JPH07282253A - 文書イメージのしきい値処理方法 - Google Patents

文書イメージのしきい値処理方法

Info

Publication number
JPH07282253A
JPH07282253A JP7081625A JP8162595A JPH07282253A JP H07282253 A JPH07282253 A JP H07282253A JP 7081625 A JP7081625 A JP 7081625A JP 8162595 A JP8162595 A JP 8162595A JP H07282253 A JPH07282253 A JP H07282253A
Authority
JP
Japan
Prior art keywords
value
image
density
range
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7081625A
Other languages
English (en)
Inventor
Lawrence Patrick O'gorman
パトリック オーゴーマン ローレンス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
American Telephone and Telegraph Co Inc
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by American Telephone and Telegraph Co Inc, AT&T Corp filed Critical American Telephone and Telegraph Co Inc
Publication of JPH07282253A publication Critical patent/JPH07282253A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/403Discrimination between the two tones in the picture signal of a two-tone original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 文書イメージを多重にしきい値処理する。 【構成】 グレー・スケールのイメージに含まれるしき
い値レベルの数を決定するのにローカルとグローバルの
両方の情報を考慮する。グレー・スケールのイメージ
は、複数の画素で構成される。各画素は1個の濃度値を
持つ。類似の濃度値を持つ画素のローカルな領域は識別
されて、イメージのグローバルな表現に編集される。濃
度範囲は、画素の濃度値がほぼ一定であるグローバルな
表現の中で識別される。濃度値は、表現範囲内で最も一
定の点を表す各範囲内で識別される。しきい値レベルの
数は、表現の範囲の数に等しいように設定される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、文書イメージの処理
方法に関し、特に文書イメージの多重しきい値処理の方
法に関する。便宜のため、用語集を明細書の最後に添付
した。
【0002】
【従来の技術】情報を伝達し保管するのに伝統的に紙の
文書が使用されてきている。コンピュータとスキャナが
それほど高価でなくなり性能がいっそう高くなるにつれ
て、文書の電子的な保管、伝逹、複写が普及してきてい
る。しかし、電子文書を複写する場合、それが対応する
紙の文書に厳密に類似しており、それにより人間の使用
者に容認されるというように処理されなければならな
い。たとえば、テキストをシステムにスキャンする場合
にも、テキストは人間の使用者にとって読みやすくなけ
ればならず、文字が誤って連結されたりあるいは分解さ
れたりして変形されるようなことがあってはならない。
【0003】一般に、紙の文書に含まれるデータは、光
学的なスキャンによって捕獲される。スキャンにより、
画素(ピクセル)として知られるサンプルされたイメー
ジ要素の濃度値を表示する信号を生成する。画素は一般
に、テキストだけを含むような場合は2値イメージとし
てオン(1)とオフ(0)の値を持つデータにより、ま
た絵を含むような場合はグレー・スケールのイメージと
して0〜255の値を持つデータにより記述される。そ
れから画素データを処理して、イメージに対してさらな
る分析を実行する。実行されるそのような画素処理の一
つは、グレー・スケールのイメージまたはカラー・イメ
ージを、かなり濃度を少なくした、すなわち2値イメー
ジまたは多重レベル・イメージのような「情報」レベル
を含むイメージへ、しきい値処理することである。
【0004】しきい値処理とは、グレー・スケールの文
書イメージに適用して2値濃度レベルのイメージまたは
多重濃度レベル(多重レベル)のイメージを獲得する公
知のイメージ処理操作であり、そこでのレベル数はオリ
ジナルのイメージの中よりもはるかに少ない。典型的に
はグレー・スケールのイメージはたとえば256値とい
う広範囲の濃度値を持つが、情報レベルの数は通常はる
かに少ない。たとえば雑誌テキストは、黒色のテキスト
と白色の背景という2個のレベルの情報しか持たない。
しかし、同じページのグレー・スケールのイメージは、
テキストに含まれる文字の不均一な印刷や照明の影響に
より生じる影のような要因のために、もっと多くの濃度
値を持つことになる。別の形式の文書として雑誌のカバ
ー等は一般に多数のレベルの情報を含んでおり、たとえ
ば文書ページのテキスト部分と背景部分の両者に使用さ
れている多数のカラーがある。文書ページをグレー・ス
ケールのイメージに変換すると、ページ上の各色は、多
数の濃度値によって表される。したがって適切なしきい
値処理には、情報のレベル数を表現するのに必要なしき
い値の数の適切な選択と、これらのしきい値の最適な値
の選択が要求される。しきい値処理されたイメージは、
電子的に見ると、同じイメージの紙の文書と一致したイ
メージを結果として生じなければならない。しきい値処
理する目的の一つは、将来のアクセスと読み取りのため
に効率的に保管することのできるイメージを理解するこ
とである。もう一つの目的は、光学的文字認識(OC
R)に適したイメージを産出するためである。この二つ
の目的のためには、しきい値処理されたイメージは読み
取りの明瞭度が高品質であり、OCRシステムによる認
識が最良であることを必要とする。
【0005】一般に2個のレベルの情報を含んでいるイ
メージを処理するために使われる方法は、2値化であ
る。しかし、2値化は3個以上のレベルの情報を含む文
書には不適当である。これらの多重レベルのイメージに
対して、しきい値レベルの数を前もって選択するよう義
務づけることにより識別するしきい値の数を制限すると
いう公知の多重レベルしきい値処理方法が存在する。し
かし、しきい値レベルがあらかじめ3個に決められてい
るのに、しきい値処理される文書イメージが4個のしき
い値レベルを含んでいる状況では問題が発生する。この
技法では4個目のレベルを識別しない。
【0006】多重レベルのイメージをしきい値処理する
公知のグローバル技法は、イメージ内の各々の濃度値で
の画素数を表す濃度ヒストグラムの形で、イメージ表現
を編集する。たとえば、N.Otsuの "A Threshold Select
ion Method from Gray-LevelHistograms"(グレー・レ
ベルのヒストグラムからのしきい値選択方法)IEEE Tra
ns. Systems, Man, and Cybernetics, Vol.SMC-9, No.
1, Han. 1979, pp.62-66 を参照して下さい。濃度ヒス
トグラムの中のピークは、多数の画素が同じ濃度値を持
ちことを示しており、したがってこのピークは特定の情
報レベルに対応している。しきい値は、もっともよくピ
ークを切り離す数値を計算することによって濃度ヒスト
グラムから決定される。
【0007】これらのグローバル技法は、イメージのあ
らかじめ定義された範囲内での一つ以上の隣接した画素
の濃度レベルの関係を記述するローカルな情報を考慮に
いれない。結果的に、上述のしきい値処理技法によって
処理されたイメージが、たとえばテキスト文字のような
イメージ領域が、誤って連結されたり分断されたりする
ことによって変形してしまうことがある。その結果、O
CRのようなある種の用途では認識率が低くなる。たと
えば、しきい値があまりに低く設定されるならば、文字
「m」は連結される可能性があって、OCRで文字
「m.」と誤って認識されることもある。しきい値があ
まりに高く設定されると、文字「e」の中の水平ストロ
ークが2値化の過程で失われて、その結果、OCRはそ
の文字を「c」と誤って認識することがある。
【0008】
【発明が解決しようとする課題】公知のローカルなしき
い値処理技法は、隣接またはすぐ近傍の画素の中での濃
度値の類似性を記述する情報を考慮に入れる。ローカル
な情報には、個々の文字のエッジ定義や、文字が連結さ
れたり分離されたり、また連結度として参照される手法
などのような要因を含む。たとえば、J.M. White and
G.D. Rohrerの "Image Thresholding for Optical Char
acter Recognition and Other Applications Requiring
Character Images Extraction" (文字イメージ抽出
を必要とする光学的文字認識と他の用途のためのイメー
ジしきい値 処理) IBM J. Res. Development, Vol. 2
7, No. 4, July 1983, pp.400-411 を参照して下さ
い。ローカル技法がグローバル技法に対して利点を持つ
のは、特定のしきい値レベルの画素は通常、文字領域と
他の形式の領域を構成するのに使用される画素の連結さ
れたグループとして発生することをローカル技法が認識
する点である。しかし、グローバル技法と比べたローカ
ル技法の欠点は、各ローカルなしきい値処理の決定すな
わちローカルな画素グループとして考慮される画素数が
少ないことである。この結果、ノイズを持つ値の存在
は、誤った結果を引き起こすことがある。対照的にグロ
ーバル技法は、グローバルなしきい値処理決定に対し
て、イメージに含まれる画素のすべてを考慮するので、
ノイズを持つ画素は画素全体の数に対するパーセンテー
ジも通常小さく、しきい値処理結果に大きな影響を与え
ない。
【0009】業界には、文書上の同様の数のレベルの情
報を正確に記録するために必要な、また各しきい値レベ
ルに最適なしきい値を決定するために必要な、しきい値
レベル数をより正確に定義するためのしきい値処理方法
に対する需要が引き続き存在する。
【0010】
【問題を解決するための手段と作用】この発明に従う
と、グレー・スケールのイメージに含まれるしきい値レ
ベルの数を決定するのにローカルとグローバルの両方の
情報を考慮する、文書イメージの多重しきい値処理方法
が実現される。
【0011】グレー・スケールのイメージは複数の画素
で構成される。各画素は、1個の濃度値を持つ。所定の
濃度値を越える濃度値を持つ画素のローカルな領域は、
グレー・スケールのイメージに含まれる各濃度値に対し
て識別されて、イメージのグローバルな表現に編集され
る。濃度範囲は、画素の濃度値がほぼ一定であるグロー
バル表現内で識別される。しきい値は、表現の範囲内で
最も一定の点を表す各範囲内で識別される。しきい値レ
ベルの数は、表現となる範囲の数に等しいように設定さ
れる。
【0012】この発明は、類似の濃度の連結された画素
を識別するのにグローバルとローカルの両方の情報を考
慮し、これらはその後、しきい値レベルの数と各しきい
値レベルの値の両者を決定する際に考慮される。連結さ
れた領域は保存され背景領域から区別されることによっ
て、スキャンされた文書内に含まれるテキストは歪むこ
となくまた誤って連結されることもないことを確実にす
る。
【0013】
【実施例】図1はこの発明の原理を組み入れた多重しき
い値処理の文書システム100を示す。多重しきい値処
理文書システム100は定期刊行物、雑誌、新聞、本の
ような文書類を電子的に保管する事例的なシステムであ
る。システム100に入力されることになる文書105
はスキャナ110によりスキャンされる。スキャナ11
0は、グレー・スケールのイメージを作成するために文
書105をデジタルのイメージ信号に変える。以下に詳
細に記述される方法で、グレー・スケールのイメージの
内部に含まれるしきい値の数を決定するプロセッサ11
5により、グレー・スケールのイメージが受信される。
しきい値処理されたイメージを表現するデジタルのイメ
ージ信号は、記憶装置125に保管される。しきい値処
理されたイメージは記憶装置125から検索することが
できて、ディスプレイ120上で見ることができ、ある
いは、プリンタ(図示せず)を使用してイメージを印刷
することによりハードコピーを得ることができる。
【0014】操作に際して、システム100のユーザ
は、キーボード(図示せず)を使ってキーワードを入力
することにより検索要求を定式化するような、種々の検
索技法を使用して文書イメージを検索する。キーワード
を含んでいる文書イメージはプロセッサ115によって
識別され、文書イメージのリストがディスプレイ120
上に表示される。それから、ユーザは適当なコマンドを
入力することによって文書イメージの一つを見るこでき
る。要求された文書イメージは記憶装置125から検索
されて、ディスプレイ120上に表示される。
【0015】検索された文書イメージは、情報レベル2
個を含む2値レベルのイメージ、または情報レベルを3
個以上含む多重レベルのイメージである。一例として文
書ページ200を図2に示す。文書ページ200は、情
報レベル3個で構成される雑誌カバーを表す。第一の情
報レベルは、第一の色、例として青色に印刷された背景
部205である。第二の情報レベルはテキスト部分21
0と215を含み、第二の色、例として黒色に印刷され
ている。第三の情報レベルは、第三の色、例として白色
に印刷されたテキスト部220を含む。
【0016】スキャナ105でスキャンすると、図2で
示された形式の文書は、その文書の各々の色に対応する
支配的なグレー・スケールのレベルを3個持つグレー・
スケールのイメージに変換される。グレー・スケールの
イメージの内部に含まれるしきい値レベルは、グローバ
ルとローカルの両方の情報を考慮することによって識別
される。図3は、複数の画素で構成されるグレー・スケ
ールのイメージ300を示す。各画素は、濃度値を1個
持つ。類似の濃度値を持つ画素のグループは連結された
領域として識別される。イメージ300は、類似の濃度
値を持つ画素を含む画素領域3個で構成される。画素領
域305は、5画素×5画素の領域で構成され、濃度値
4を持つ。画素領域310は6画素×6画素の領域で構
成され濃度値4を持つ。画素領域315は4画素×4画
素の領域で構成され濃度値12を持つ。
【0017】図4は、図3のグレー・スケールのイメー
ジのしきい値処理の方法を示すブロック図である。グレ
ー・スケールのイメージのグローバルな表現は、「ラ
ン」ヒストグラム決定すること(ステップ405)によ
って作成される。ランとは、イメージ内部で識別され
る、同一または類似の濃度値の画素の連結グループであ
る。たとえばランは、列または行の一部であるか、ある
いはイメージの特定領域によって定義される領域であ
る。次に、スライディング・プロファイルが、ラン・ヒ
ストグラムから決定(ステップ410)される。スライ
ディング・プロファイルが、ラン・ヒストグラムによっ
て表される各濃度レベルのまわりの範囲に対するランの
「平坦さ」または変化の欠如を計測する。次に、しきい
値の数がスライディング・プロファイルから決定(ステ
ップ415)される。しきい値の数は、最大値に達する
か接近するスライディング・プロファイルでのピークの
数に等しい。グレー・スケールのイメージのしきい値処
理のステップは各々、図3に描写されたイメージを使用
していっそう詳細に説明される。
【0018】この発明に従うと、イメージの中で各々の
所定のしきい値レベルでのランの数を決定することによ
りラン・ヒストグラムが生成される。イメージ内の各画
素に対する濃度値は、ラスタースキャン順に識別され
る。図3のイメージ内の点線330により示される列の
ような、イメージ内の所定の列に対して、各画素はその
濃度値を識別するために詳細に調べられる。隣接の画素
に対する濃度値が連続して大きくなると、ランの始まり
を示す。同様に隣接の画素が連続して値を減少すると、
ランの終わりを示す。
【0019】図6は、イメージ300の列330に対す
る濃度の断面図を示す。濃度の断面図は、その列に沿っ
た各画素の濃度値を示す。最初に画素領域305に到達
すると、濃度レベルは605で濃度レベル4にまで初め
て増加する。断面図によって示されるように、濃度レベ
ル1、2、3に対するランも開始される。610で示さ
れるように、画素領域305の終わりが検出されるま
で、プロットは濃度レベル4に留まる。画素領域305
は、濃度レベル0を持つと想定される背景に隣接してい
るので、画素領域305の終わりもやはり濃度レベル1
〜4に対する各々のランの終わりを示す。
【0020】次に画素領域315に初めて到達すると、
濃度レベルは615で12に増加する。断面図に示すよ
うに、濃度レベル1〜11に対するランもやはり開始さ
れる。画素領域315の終わりが620で示したように
検出されるまでは、プロットは濃度レベル12に留ま
る。画素領域315の終わりは背景に隣接している。
【0021】図7は、列330に対するラン・ヒストグ
ラムを示す。図示されたように、しきい値レベル0と4
の間に2個のランが存在し、しきい値レベル4と12の
間に1個のランが存在する。累積されたラン・ヒストグ
ラムは、イメージの各列と各行でのランを識別すること
によってイメージ300に対して編集される。図5は、
イメージ300に対するラン・ヒストグラムを示す。各
画素領域に対する各列と各行が4以上の濃度レベルを持
つので、30個のラン(すなわち、5+5+4+4+6
+6)が濃度レベル3以下のしきい値を持つとして識別
される。8個のランが、濃度レベル4と濃度レベル12
の間のしきい値レベルを持つとして識別される。濃度レ
ベルが12を越えるしきい値レベルを持つランは存在し
ない。
【0022】しきい値は、ランが最も一定しているラン
・ヒストグラム上の範囲を識別することによってラン・
ヒストグラムから決定される。これらの範囲はラン・ヒ
ストグラムの平坦な部分により表される。図7を参照す
ると、検出されるしきい値の数は2個の平坦範囲により
示されるように2に等しい。第一のしきい値は、濃度レ
ベル0と濃度レベル4の間になるように選択される。第
二の濃度レベルは、濃度レベル4と濃度レベル12の間
になるように選択される。
【0023】ラン・ヒストグラムの中の平坦な範囲の計
測は、多様な手法で決定できる。この発明に従うと、ス
ライディング・プロファイルは、ラン・ヒストグラムか
ら決定(図4のステップ410)される。スライディン
グ・プロファイルが、ラン・ヒストグラムによって表さ
れる各濃度レベルのまわりの範囲のランの変化の欠如ま
たは「平坦性」の計測を産出する。スライディング・プ
ロファイルは、プロファイルの値P(i)をプロット
し、これはラン・ヒストグラムに含まれる濃度値の関数
として、予想される平坦さの偏差ΔFに対応する。これ
らの平坦な範囲は、ランが一定である濃度値範囲に対応
する。これが示すのは、ランがこれらの範囲内で明確に
定義されること、また各範囲内の濃度は複数の領域の濃
度の間にあることである。しきい値が各範囲内で識別さ
れる場合、これらの範囲によって切り離される領域が識
別される。
【0024】スライディング・プロファイルは、ラン・
ヒストグラムの垂直軸に沿ってスライドし、イメージ内
の各画素の濃度値上に集中する、ウインドウを使用して
事例として計算されている。計算は、ラン・ヒストグラ
ムの中の平坦な範囲を示す。ウインドウが平坦な範囲を
1個だけ含むような濃度レベルに垂直軸があるとき、そ
の濃度レベルで結果として生ずるプロファイル値は最大
である。ウインドウが平坦な範囲または範囲間の遷移を
2個以上含むような濃度レベルに垂直軸があるとき、そ
の濃度レベルで結果として生ずるプロファイル値は最大
値より小さい。スライディング・プロファイル上の最大
値は、ラン・ヒストグラム上の平坦な範囲に対応する。
しきい値は、各プロファイル・ピーク内の最大値として
選択される。
【0025】図9は、スライディング・プロファイルの
計算を描写する流れ図をさらに詳細に示す。最初に(ス
テップ905)ラン・ヒストグラム上の各濃度レベルに
中心を置くウインドウの寸法が選択される。ウインドウ
の寸法は、濃度レベル間の最小距離を定義する最小コン
トラストのユーザ・パラメータに依存している。このパ
ラメータは、事例的にしきい値レベル間の差分のパーセ
ンテージとして表され、概ね平坦な濃度レベル範囲の中
にあるノイズが平均化されるように、できるだけ大きく
するのが望ましい。しかしそのパラメータは、ウインド
ウが別のしきい値レベル間に平均化を発生させるよう
な、別のしきい値レベル間の最小の濃度値の差分よりも
大きくしてはならない。事例として、パラメータは10
%に設定される。ウインドウの幅は下記の式により決定
される。
【数1】 ここで、Wは、ウインドウの幅 cは、最小コントラスト・パラメータ(%) Iは、オリジナルのイメージの可能な最大濃度値
【0026】次に、スライディング・プロファイルは以
下のようにしてラン・ヒストグラムから計算される。ウ
インドウの中央の濃度値とウインドウに含まれる各々の
他の濃度値の間の差分を判定することにより、ランの数
の差分から計算される。それから差分を集計すると、ウ
インドウの中央に位置する画素に対する平坦さの計測値
が提供される。平坦さの計測値は下記の式により決定さ
れる。
【0027】
【数2】 ここで、diは、ウインドウ内の差分の合計 Wは、ウインドウの幅 iは、濃度 R(i)は、濃度iのランの数 Iは、オリジナルのイメージの可能な最大濃度値
【0028】差分の合計は、結果として生じるプロファ
イル値を提供するガウス形曲線を割り出すのに使用され
る。プロファイル値は、下記のように決定される。
【0029】
【数3】 ここで、P(i)は、濃度レベルiでのプロファイル値 diは、ウインドウ内の差分の合計 σは、ガウス形曲線の標準偏差
【0030】標準偏差σは、イメージの特性に基づいて
選択される。標準偏差は、ラン・ヒストグラムの非平坦
性の変化度、または単一イメージ領域の濃度値の非均一
性の変化度に対して、しきい値処理方法の適応化を可能
とする。この非均一性は一般に、平均値の周囲にガウス
状に分布した濃度値範囲をイメージ領域に持たせること
になるノイズのためである。このように、均一領域が高
いレベルの偏差を持つことが予測される場合は、大きい
数値のσが使用される。逆の場合は逆である。
【0031】図5で示したラン・ヒストグラムに対する
スライディング・プロファイルは、図8に示される。2
個のピークが、スライディング・プロファイルの中に図
示されている。次に、しきい値の数はスライディング・
プロファイルから決定(図4のステップ415)され
る。一般にしきい値の数は、最大値に到達するかまたは
接近する、スライディング・プロファイルの中のピーク
の数に等しい。図3を参照すると、完全に平坦なラン・
ヒストグラム内に2個の平坦な範囲があり、最大値に到
達するスライディング・プロファイル・ピーク2個を結
果として生じる。一般に、ノイズや照明に限らず、プロ
ファイル・ピークを最大値以下にし完全には平坦でなく
する他の影響する要因のために、スキャンされたイメー
ジは濃度値に変化を受けやすい。そのような場合、しき
い値レベルは、プロファイル・ピークの最も平坦な部分
から選択される。
【0032】予想される平坦性の偏差ΔF内にプロファ
イル値が存在する濃度値の全範囲は、しきい値範囲を示
す。平坦性の偏差は、最大プロファイル値のパーセンテ
ージとして下記のように定義される。
【0033】
【数4】 ここで、{i}j は、濃度レベル範囲 j は、しきい値範囲 ΔFは、平坦性の偏差 P(I)は、プロファイル値
【0034】しきい値は、各しきい値範囲j内で、最大
プロファイル値を割り出す濃度レベルとして選択され
る。これは、その特定の濃度レベル範囲内でのラン・ヒ
ストグラムの最も平坦な部分に中心を置く濃度値を示
し、下記のように表現される。
【0035】
【数5】 ここで、Tjは、j=1,・・Lのしきい値範囲に対す
るしきい値
【0036】ノイズその他の制限を考慮に入れて、しき
い値に修正が実行される。図8を参照すると、検出され
たしきい値の数は2個のピークで示されるように2に等
しい。濃度レベル0と濃度レベル4の間になる第一のし
きい値が選択される。濃度レベル4と濃度レベル12の
間になる第二の濃度レベルが選択される。これらの値は
イメージ300を正確にしきい値処理することになる。
【0037】この中で明確には図示したり記述したりし
てはいないが、技術に熟練した人々が、本発明の適用範
囲内で本発明の精神を逸脱することなく、本発明の原理
を具体化する種々多様な構成変更を考案できることは認
識されるであろう。
【0038】
【用語集】
画素(ピクセル):イメージ要素 グローバル技法:イメージ内のすべての画素に基づいて
しきい値を選択する、しきい値処理技法 しきい値:イメージに含まれる2個のレベルの情報を最
もよく切り離す、所定のイメージのために選択された濃
度値 スライディング・プロファイル:ラン・ヒストグラムに
よって表される各濃度値でのランの変化の欠如の表現 2値化:濃度レベルを2個含むイメージを認識するグレ
ー・スケールのイメージのしきい値処理方法 濃度値:0(オフ=白色)と255(オン=黒色)の間
に黒度値を持つ画素のグレー・スケール値 濃度ヒストグラム:各濃度レベルで数値を持つ画素数の
表現 濃度レベル:人間の目に単一濃度値として認識される情
報レベル ラン:所定の濃度レベルを越える画素を連結したグルー
プ ラン・ヒストグラム:イメージ内の各濃度値におけるラ
ンの数の表現 ローカル技法:各画素でのしきい値をその画素のローカ
ルな近傍に基づいて選択する、しきい値処理技法
【図面の簡単な説明】
【図1】この発明に従った多重しきい値処理文書システ
ムのブロック図。
【図2】多重の情報レベルを含んでいる文書ページの一
部。
【図3】3個の領域を持っているグレー・スケールのイ
メージ。
【図4】この発明に従ってグレー・スケールのイメージ
をしきい値処理するためのステップを図示するブロック
図。
【図5】図3のイメージに対するランのヒストグラム。
【図6】図3のイメージの列に沿った、濃度の横断面。
【図7】図6で図示された列のランのヒストグラム。
【図8】図3のランのヒストグラムに由来するスライデ
ィング・プロファイル。
【図9】図8に示したスラィディング・プロファイルの
計算のフローチャート。
【符号の説明】
100 文書システムのブロック図 105 文書 110 スキャナ 115 プロセッサ 120 ディスプレイ 125 記憶装置 200 文書ページ 205 背景部 210 テキスト部 215 テキスト部 220 テキスト部 300 グレー・スケールのイメージ 305 画素領域 310 画素領域 315 画素領域 405 ランのヒストグラムの決定 410 ランのヒストグラムからスライディング・プ
ロファイルの決定 415 スライディング・プロファイルからしきい値
数の決定 905 ラン・ヒストグラムの濃度値にウインドウの
中心を置く 910 ウインドウの中心での値とウインドウの各々
の他の値の間で見つかるラン数の差分の計算 915 各々の差分値の合計の決定 920 ガウス形状曲線に合計を割りつける 925 差分の合計は0か 930 曲線上の低い点の割りつけ 935 曲線上の最大値の割りつけ 940 I=I+1にして、イメージの次の画素へ移
動 945 Iは最大値か

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 少くとも2個のレベルを持つイメージを
    得るためにグレー・スケールのイメージをしきい値処理
    する方法であって、グレー・スケールのイメージは複数
    の画素から構成されていて、各画素は1個の濃度値を持
    っており、該方法は、 所定の濃度値を越える濃度値を持つ連結された画素のロ
    ーカル・グループを識別し、前記識別はグレー・スケー
    ルのイメージに含まれる各濃度値に対して決定されるス
    テップと、 各濃度値での画素のグループの数を表すグローバルな表
    現を編集するステップと、 画素のグループの数が実質的に一定のままとなる表現の
    中で濃度範囲を識別するステップと、 しきい値レベルの数をその表現内の範囲の数に等しくな
    るように決定するステップと、 濃度範囲の最も一定の部分を表す各濃度範囲内でしきい
    値を識別するステップとを備えることを特徴とする方
    法。
  2. 【請求項2】 請求項1記載のしきい値処理方法であっ
    て、表現内の濃度範囲を識別する前記ステップが、 表現内の各濃度値上にウインドウの中心を置き、ウイン
    ドウの中心に位置する濃度値とウインドウ内に含まれる
    他の濃度値の各々との間の数値の差分の合計を決定する
    ステップと、 あらかじめ計算された値を越える差分の合計を識別する
    ステップと、 あらかじめ計算された値を越える、表現の上での差分合
    計の範囲を識別するステップと、 差分合計のプロファイルを濃度値の関数として生成する
    ステップとを備える方法。
  3. 【請求項3】 請求項2記載のしきい値処理方法であっ
    て、しきい値を識別する前記ステップが、 プロファイルの各差分合計の範囲内で最大値を選択する
    ステップを備える方法。
  4. 【請求項4】 請求項1記載のしきい値処理方法であっ
    て、前記グローバル表現が、グループ数を濃度値の関数
    としてプロットするヒストグラムである方法。
  5. 【請求項5】 請求項4記載のしきい値処理方法であっ
    て、各グループが、類似した濃度値の連結された画素の
    少なくとも1個のランを構成する方法。
  6. 【請求項6】 請求項1記載のしきい値処理方法であっ
    て、各範囲が、表現の中で平坦な領域を表す方法。
  7. 【請求項7】 少くとも2個のレベルを持つイメージを
    得るためにグレー・スケールのイメージをしきい値処理
    する方法であって、グレー・スケールのイメージは複数
    の画素から構成されていて、各画素は1個の濃度値を持
    っており、該方法は、 所定の濃度値を越える濃度値を持つ連結された画素のグ
    ループを識別し、前記識別がグレー・スケールのイメー
    ジに含まれる各濃度値に対して決定されるステップと、 画素のグループ数を濃度値の関数として表すグローバル
    な表現を編集し、前記表現が画素グループ間の遷移レベ
    ルを表す平坦な範囲を含んでいるステップと、 各範囲の最も平坦な部分で各平坦範囲からしきい値を選
    択するステップとを備えることを特徴とする方法。
  8. 【請求項8】 請求項7記載のしきい値処理方法であっ
    て、表現内でしきい値を選択する前記ステップが、 表現内の各濃度値上にウインドウの中心を置き、ウイン
    ドウの中心に位置する濃度値とウインドウ内に含まれる
    各々の他の濃度値との間の数値の差分の合計を決定する
    ステップと、 あらかじめ計算された値を越える差分合計を識別するス
    テップと、 あらかじめ計算された値を越える、表現上の差分合計の
    範囲を識別するステップと、 差分合計のプロファイルを濃度値の関数として生成する
    ステップと、 プロファイルの各差分合計範囲内で最大値を選択するス
    テップとを備える方法。
  9. 【請求項9】 請求項7記載のしきい値処理方法であっ
    て、各グループは、類似の濃度値の連結された画素の少
    なくとも1個のランを構成する方法。
  10. 【請求項10】 多重レベルイメージを得るためのグレ
    ー・スケールのイメージのしきい値処理方法であって、
    グレー・スケールのイメージは複数の画素で構成されて
    いて、各画素は1個の濃度値を持っており、該方法は、 所定の濃度値を越える濃度値を持つ画素領域をグレー・
    スケールのイメージ内で識別し、前記識別はグレー・ス
    ケールのイメージに含まれる各濃度値に対して決定され
    るステップと、 イメージ内の領域の数を濃度値の関数としてプロットす
    る、画素領域のグローバル表現を生成するステップと、 表現内の平坦範囲を識別するために表現内の各濃度値上
    に画素ウインドウの中心を置き、前記平坦範囲が、範囲
    内での画素に対する濃度値が概ね一定のままであること
    を表すステップと、 その範囲の最も平坦な部分を表す各平坦な範囲内で1個
    の濃度値を識別するステップと、 しきい値レベルの数を、識別された範囲の数と等しくな
    るように決定するステップとを備えることを特徴とする
    方法。
  11. 【請求項11】 請求項10記載のしきい値処理方法で
    あって、前記グローバル表現が、領域の数を濃度値の関
    数としてプロットするヒストグラムである方法。
  12. 【請求項12】 請求項11記載のしきい値処理方法で
    あって、各画素領域が類似の濃度値の連結された画素の
    少なくとも1個のランを構成する方法。
JP7081625A 1994-04-07 1995-04-07 文書イメージのしきい値処理方法 Withdrawn JPH07282253A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US22444694A 1994-04-07 1994-04-07
US224446 1994-04-07

Publications (1)

Publication Number Publication Date
JPH07282253A true JPH07282253A (ja) 1995-10-27

Family

ID=22840722

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7081625A Withdrawn JPH07282253A (ja) 1994-04-07 1995-04-07 文書イメージのしきい値処理方法

Country Status (4)

Country Link
US (1) US5781658A (ja)
EP (1) EP0676891A3 (ja)
JP (1) JPH07282253A (ja)
CA (1) CA2144793C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011070681A (ja) * 2009-09-25 2011-04-07 Sony Corp L1距離測度に基づいて局所画像相似性を測定する方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2323493A (en) * 1997-02-25 1998-09-23 British Broadcasting Corp Quantisation for compression systems
US6269188B1 (en) 1998-03-12 2001-07-31 Canon Kabushiki Kaisha Word grouping accuracy value generation
US6243501B1 (en) 1998-05-20 2001-06-05 Canon Kabushiki Kaisha Adaptive recognition of documents using layout attributes
JP3345350B2 (ja) * 1998-05-27 2002-11-18 富士通株式会社 文書画像認識装置、その方法、及び記録媒体
US6222642B1 (en) * 1998-08-10 2001-04-24 Xerox Corporation System and method for eliminating background pixels from a scanned image
JP2000217000A (ja) * 1998-11-19 2000-08-04 Murata Mach Ltd 画像処理装置、画像処理方法及び記録媒体
EP1117072A1 (en) * 2000-01-17 2001-07-18 Koninklijke Philips Electronics N.V. Text improvement
US6674900B1 (en) 2000-03-29 2004-01-06 Matsushita Electric Industrial Co., Ltd. Method for extracting titles from digital images
US7050195B1 (en) * 2000-04-20 2006-05-23 Hewlett-Packard Development Company, L.P. Printed medium data storage
WO2002103617A1 (en) * 2001-06-15 2002-12-27 Koninklijke Philips Electronics N.V. Automatic natural content detection in video information
US7088857B2 (en) * 2002-01-31 2006-08-08 Hewlett-Packard Development Company, L.P. Dynamic bilevel thresholding of digital images
US7257248B2 (en) * 2003-03-27 2007-08-14 General Electric Company Non-contact measurement system and method
US7734089B2 (en) * 2005-08-23 2010-06-08 Trident Microsystems (Far East) Ltd. Method for reducing mosquito noise
WO2008030104A1 (en) * 2006-09-07 2008-03-13 Lumex As Relative threshold and use of edges in optical character recognition process
US8189917B2 (en) * 2008-09-25 2012-05-29 Sharp Laboratories Of America, Inc. Methods and systems for locating text in a digital image
US8422777B2 (en) * 2008-10-14 2013-04-16 Joshua Victor Aller Target and method of detecting, identifying, and determining 3-D pose of the target
US10475189B2 (en) 2017-12-11 2019-11-12 Adobe Inc. Content aware, spatially adaptive automated thresholding of images

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3107521A1 (de) * 1981-02-27 1982-09-16 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von bild- und text- oder graphikbereichen auf druckvorlagen
US4673977A (en) * 1985-06-20 1987-06-16 International Business Machines Corporation Method of spatially thresholding a discrete color image
CA1268547A (en) * 1986-03-31 1990-05-01 Ahmed Mostafa El-Sherbini Thresholding algorithm selection apparatus
US5073954A (en) * 1989-02-28 1991-12-17 Electrocom Automation, Inc. Bar code location and recognition processing system
FR2670979A1 (fr) * 1990-12-21 1992-06-26 Philips Electronique Lab Procede de segmentation binaire locale d'images numerisees, par seuillage d'histogramme.
US5179599A (en) * 1991-06-17 1993-01-12 Hewlett-Packard Company Dynamic thresholding system for documents using structural information of the documents
US5450502A (en) * 1993-10-07 1995-09-12 Xerox Corporation Image-dependent luminance enhancement

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011070681A (ja) * 2009-09-25 2011-04-07 Sony Corp L1距離測度に基づいて局所画像相似性を測定する方法

Also Published As

Publication number Publication date
EP0676891A2 (en) 1995-10-11
EP0676891A3 (en) 1997-04-09
CA2144793A1 (en) 1995-10-08
CA2144793C (en) 1999-01-12
US5781658A (en) 1998-07-14

Similar Documents

Publication Publication Date Title
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
US8373905B2 (en) Semantic classification and enhancement processing of images for printing applications
JPH07282253A (ja) 文書イメージのしきい値処理方法
US6909805B2 (en) Detecting and utilizing add-on information from a scanned document image
JP3686439B2 (ja) デジタル・イメージのフォト領域検出システム、及び方法
US6865290B2 (en) Method and apparatus for recognizing document image by use of color information
US7469063B2 (en) Apparatus, method and storage medium storing program for recognizing characters
US8369623B2 (en) Image forming apparatus that automatically creates an index and a method thereof
US7440618B2 (en) Apparatus for extracting rules line from multiple-valued image
US20030063802A1 (en) Image processing method, apparatus and system
Savakis Adaptive document image thresholding using foreground and background clustering
US20110158517A1 (en) Image processing apparatus, image processing method, and computer-readable medium
JPH0879536A (ja) 画像処理方法
US20030202696A1 (en) Activity detector
US20140086473A1 (en) Image processing device, an image processing method and a program to be used to implement the image processing
JP4588771B2 (ja) 画像処理方法、画像処理装置、画像形成装置、プログラム及び記憶媒体
CA2790210A1 (en) Resolution adjustment of an image that includes text undergoing an ocr process
US20010043742A1 (en) Communication document detector
US5812695A (en) Automatic typing of raster images using density slicing
JP2011257896A (ja) 文字認識方法及び文字認識装置
JP4393556B2 (ja) 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及びコンピュータでの読み取りが可能な記録媒体
US8295602B2 (en) Image processing apparatus and image processing method
US11948342B2 (en) Image processing apparatus, image processing method, and non-transitory storage medium for determining extraction target pixel
JP2877548B2 (ja) 文書画像の属性判別方法
JP3756660B2 (ja) 画像認識方法、装置および記録媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020702