JP4164489B2 - 文書画像強調方法、装置及びそのための記憶媒体 - Google Patents
文書画像強調方法、装置及びそのための記憶媒体 Download PDFInfo
- Publication number
- JP4164489B2 JP4164489B2 JP2004342872A JP2004342872A JP4164489B2 JP 4164489 B2 JP4164489 B2 JP 4164489B2 JP 2004342872 A JP2004342872 A JP 2004342872A JP 2004342872 A JP2004342872 A JP 2004342872A JP 4164489 B2 JP4164489 B2 JP 4164489B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- row
- line
- connected component
- component density
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 230000002708 enhancing effect Effects 0.000 claims abstract description 6
- 230000001629 suppression Effects 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 16
- 238000009499 grossing Methods 0.000 claims description 14
- 230000010339 dilation Effects 0.000 claims description 8
- 238000003706 image smoothing Methods 0.000 claims 2
- 230000000875 corresponding effect Effects 0.000 description 18
- 239000003623 enhancer Substances 0.000 description 14
- 230000010365 information processing Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000007547 defect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000015654 memory Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234381—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the temporal resolution, e.g. decreasing the frame rate by frame skipping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/164—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47202—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/658—Transmission by the client directed to the server
- H04N21/6587—Control parameters, e.g. trick play commands, viewpoint selection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20024—Filtering details
- G06T2207/20032—Median filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Character Input (AREA)
- Image Processing (AREA)
Description
前記黒色8連結構成要素密度と白色8連結構成要素密度とに基づいて、前記行画像を正常行画像、破断ストローク行画像及び中抜けストローク行画像のいずれかの種類に分類する行画像分類工程と、
前記行画像に対して、前記行画像分類工程で分類された種類に応じた強調処理を実行することにより、強調行画像を獲得する強調工程とを備え、
前記行画像分類工程では、
白色8連結構成要素密度<=閾値T1であり且つ黒色8連結構成要素密度>=閾値T2であれば、前記行画像は前記破断ストローク行画像であると分類し、
白色8連結構成要素密度>閾値T1であれば、前記行画像は前記中抜けストローク行画像であると分類し、
白色8連結構成要素密度<=閾値T1であり且つ黒色8連結構成要素密度<閾値T2であれば、前記行画像は前記正常行画像であると分類するものであり、
更に、閾値T1は2〜4であり、閾値T2は3〜5であることを特徴とする文書画像強調方法が提供される。
本発明の方法は、例えば、パーソナルコンピュータ(PC)、ノートブック又は郵便物分類機器などの何らかのオートメーション機器に埋め込まれたシングルチップマイクロコンピュータ(SCM)などの、どのような情報処理機器においても実現されることができるであろう。本発明の方法をソフトウェア、ハードウェア又はファームウェア又はそれらの組み合わせによって実現することは当業者には容易であろう。特に、本発明のいずれかの工程又は工程の組み合わせを実現するために、I/O装置、メモリ装置、CPUなどのマイクロプロセッサなどを使用することが必要であるのが当業者には自明であることに注意すべきである。以下の本発明の方法の説明は必ずしもそのような装置を挙げていないが、実際にはそれらの装置が使用される。
(好ましい実施例)
図7Aは、本発明による文書画像強調方法の好ましい一実施例を示す。この方法は、OCRアプリケーションなどの他のアプリケーション又はスキャナなどから獲得されるブロック画像702で始まる。言うまでもなく、ブロック画像702はいずれかの場所に格納されており、処理されるべき時点で呼び出される必要がある。また、画像が処理されるとき、原画像及び中間処理結果が破壊されず、原画像又は何らかの中間結果を必要とする後の処理工程で使用されることが可能であるように、原画像及び中間処理結果が格納されなければならないことに注意すべきであり、そのことは当業者には自明である。しかし、明瞭簡潔にするため、上記の目的のための複写又は格納のような工程は以下の説明及び図面では省略されている。
事前解析は4つの面を含む。
A.行画像の中の文字の数(以下、文字数という)を計算する。
文字数は連結された構成要素の密度(連結構成要素密度)を生成するための後の分類(ラベル付け)ステップ又は再分類(再ラベル付け)ステップで使用される。文字数は次の公式を使用して計算されれば良い。
水平行の場合:文字数=K×行幅/行高さ。
垂直行の場合:文字数=K×行高さ/行幅。
Kは言語の分類を反映する係数である。例えば、中国語又は日本語などの象形文字の場合、Kの値は1になるであろう。英語などのアルファベット文字の場合には、Kの値は1より大きくなるであろう。
本発明では、行画像において黒色8連結構成要素、黒色4連結構成要素、白色8連結構成要素及び白色4連結構成要素を分類するので、行画像において黒色8連結構成要素密度(以下、B8という)、黒色4連結構成要素密度(以下、B4という)、白色8連結構成要素密度(以下、W8という)及び白色4連結構成要素密度(以下、W4という)が獲得される。各連結構成要素密度は次の公式を使用して計算される。
連結構成要素密度=連結構成要素の数/文字数。
N4(p)={(x+1,y),(x−1,y),(x,y+1),(x,y−1)}
はその4近傍画素と呼ばれる。その8近傍画素は次のように定義される。
N8(p)=N4(p)∪{(x+1,y+1),(x+1,y−1),(x−1,y+1),(x−1,y−1)}。
このことから、4連結度及び8連結度の定義を推論することができる。共に集合Vに由来する値を有する2つの画素p及びqは、qが集合N4(p)に属していれば4連結であり、qがN8(p)に属していれば8連結である。
黒色画素密度=行画像における黒色画素の数/(行幅×行高さ)。
この場合、行幅及び行高さは画素単位で測定される。
尚、以下に説明するような後の行雑音抑制ステップ712及び分類ステップ718の後の行強調ステップについて、発明者は様々な実施例を提案しているが、そのうちのいくつかは黒色画素密度を使用しない。そのような場合、このステップが不要であることは自明である。
2つの隣接する行画像の間の領域を行間画像という。多くの場合、行画像と行間画像の雑音分布は類似している。従って、行間画像における雑音密度は行画像の雑音の強さを反映する。
従って、雑音抑制行画像を分類するに際しては、雑音抑制行画像714における連結構成要素を分類し、対応する連結構成要素密度を獲得することが必要である。それが分類ステップ716である。このステップは「行画像の事前解析」の部分で説明した分類動作に類似しているため、ここでは詳細な説明を省く。以下に説明するように、正常行画像強調ステップ720、破断ストローク行画像強調ステップ722及び中抜けストローク行画像強調ステップ724も分類ステップ716の分類結果を使用できる。このステップでは、B4、B8、W4及びW8が得られる。しかし、この分類ステップ716を後続するステップに配分しても良いことは当業者には自明であるという点に注意すべきである。すなわち、B4、B8、W4及びW8の値はあらかじめ計算されるのではなく、それらの値を必要とする後の関連するステップで計算されても良い。
正常行画像の場合、幾分かのジグザグストロークが混じっているので、正常行画像強調ステップ720の目的は存在する可能性があるジグザグストロークを平滑化することである。
破断ストローク行画像の場合、破断ストローク行画像強調ステップ722の目的は破断ストロークを連結することである。破断ストローク行画像を強調することの中核は行画像を膨張させることである。必要に応じて、平滑化動作が採用されても良い。特に、発明者は以下に説明するステップの3つの実施例を好適と考えるが、本開示を読むことにより他の実施例も考えられる。
尚、この破断ストローク行画像強調ステップ722の実施例においては、分類ステップ716に類似する再分類動作があるため、その詳細な説明が省略されていることに注意する。
中抜けストローク行画像の場合、中抜けストローク行画像強調ステップ724の目的はストローク中の抜けた領域を充填することである。本発明においては、中抜けストローク行画像は、行画像を平滑化し、次に得られた行画像を膨張させることにより強調される。特に、発明者は次に説明するステップの3つの実施例を好適と考えるが、本開示を読むことにより他の実施例も考えられる。
以上説明した好ましい実施例は、原文書画像から分割されたブロック画像を強調することを目的としている。しかし、本発明は、複写装置などの走査手段から入力される原文書画像を直接に強調することが可能であるように、図7Aに示すようなブロック分割ステップ104を含んでいても良い。
本発明は、本発明による文書画像強調方法を使用する文字認識方法を更に提供する。図7Cは、本発明による文字認識方法の一実施例を示す。図7A及び図7Bに示されるステップに加えて、方法は文字分割ステップ112及び単独文字認識ステップ116を含み、これら2つのステップは周知の技法である。本発明を適用すると、文書画像、特にハーフトーン文書画像の認識率を大幅に改善できるであろう。発明者は、本発明による強調方法を使用した場合と、使用しない場合とについていくつかのサンプルを認識することによって本発明をエミュレートした。その結果を図12及び図13に示す。
(好ましい実施例)
図14は、文書画像強調装置1400の好ましい一実施例を示し、装置の構成要素について以下に説明する。
以上説明した好ましい実施例は、原文書画像から分割されたブロック画像を強調することを目的としている。しかし、本発明による装置は、複写装置などの走査手段から入力される原文書画像を直接に強調することが可能であるようにブロック分割手段(図示せず)を更に含んでいても良い。
本発明は、原文書画像を分割して、ブロック画像を獲得するように構成されたブロック分割手段1602と、先に説明した文書画像強調装置1400と、強調ブロック画像における行画像を単独文字画像に分割するように構成された文字分割手段1604と、各単独文字画像を認識するように構成された単独文字認識手段1606とを具備する文字認識装置1600(図16)を更に提供する。ブロック分割手段1602、文字分割手段1604及び単独文字認識手段1606は全て従来の技術である。
本発明の目的は、前記画像源及びそれに続く処理装置と通信する、先に説明したような情報処理機器で1つのプログラム又は1組のプログラムを実行することによっても実現できるであろう。それらの情報処理機器、画像源及びそれに続く処理装置は全て周知の汎用機器である。従って、本発明の目的は、単に、前述の文書画像強調方法又は文字認識方法を実現できるプログラムコードを提供することにより実現できるであろう。すなわち、前述の文書画像強調方法又は文字認識方法を実現するためのプログラムコードを格納する記憶媒体は本発明を構成する。
Claims (17)
- 行画像における連結構成要素の数を行画像の文字の数で除算することにより、前記行画像における黒色8連結構成要素密度と白色8連結構成要素密度とを獲得する連結構成要素密度獲得工程と、
前記黒色8連結構成要素密度と白色8連結構成要素密度とに基づいて、前記行画像を正常行画像、破断ストローク行画像及び中抜けストローク行画像のいずれかの種類に分類する行画像分類工程と、
前記行画像に対して、前記行画像分類工程で分類された種類に応じた強調処理を実行することにより、強調行画像を獲得する強調工程と
を備え、
前記行画像分類工程では、
白色8連結構成要素密度<=閾値T1であり且つ黒色8連結構成要素密度>=閾値T2であれば、前記行画像は前記破断ストローク行画像であると分類し、
白色8連結構成要素密度>閾値T1であれば、前記行画像は前記中抜けストローク行画像であると分類し、
白色8連結構成要素密度<=閾値T1であり且つ黒色8連結構成要素密度<閾値T2であれば、前記行画像は前記正常行画像であると分類するものであり、
更に、閾値T1は2〜4であり、閾値T2は3〜5であることを特徴とする文書画像強調方法。 - 原ブロック画像における雑音を抑制することにより、雑音抑制ブロック画像を得るブロック画像雑音抑制工程と、
前記雑音抑制ブロック画像を分割し、行画像の位置情報を獲得する工程と、
前記原ブロック画像における行画像及び行間画像を解析し、行画像及び行間画像の特性を獲得する工程と、
前記特性に基づいて原ブロック画像における行画像の雑音を抑制することにより、雑音抑制行画像を得る行画像雑音抑制工程と、を更に備え、
前記連結構成要素密度獲得工程と前記行画像分類工程と前記強調工程とで処理対象になる行画像は、前記行画像雑音抑制工程で雑音が抑制された雑音抑制行画像であることを特徴とする請求項1に記載の文書画像強調方法。 - 前記特性は、
1つの行画像における連結構成要素の数をその行画像の文字の数で除算することにより求めた、黒色8連結構成要素密度、黒色4連結構成要素密度、白色8連結構成要素密度及び白色4連結構成要素密度のうちの少なくとも1つを含む連結構成要素密度と、
1つの行画像における黒色画素の数をその行画像の画素における面積で除算することにより求めた黒色画素密度と、
1つの行画像の上下の行間画像から選択された所定の領域における行間雑音の数と、
前記行間雑音の数を前記領域の面積で除算した値に等しい行間雑音密度と、
関連する行画像の高さに等しい文字高さと、
原ブロック画像から読み取られるDPIと
のうちの少なくとも1つを含むことを特徴とする請求項2記載の文書画像強調方法。 - 前記行画像雑音抑制工程では、行間雑音密度と黒色画素密度と連結構成要素密度との少なくともいずれかに従って行画像の雑音を抑制することを含むことを特徴とする請求項3記載の文書画像強調方法。
- 前記閾値T1は3であり、前記閾値T2は4であることを特徴とする請求項5記載の文書画像強調方法。
- 前記強調工程では、
前記正常行画像を平滑化することにより強調する正常行画像強調工程と、
前記中抜けストローク行画像を、ストロークの抜け領域を充填することにより強調する中抜けストローク画像強調工程と、
前記破断ストローク行画像を、その破断ストロークを連結することにより強調する破断ストローク画像強調工程と
を有することを特徴とする請求項1乃至5のいずれか1項に記載の文書画像強調方法。 - 前記正常行画像強調工程は、正常行画像を連結構成要素密度と文字高さとその正常行画像との少なくともいずれかがその時点までに平滑化されたことがあるか否かに従って平滑化することを含むことを特徴とする請求項6記載の文書画像強調方法。
- 前記破断ストローク行画像強調工程は、
破断ストローク行画像に対して強い膨張を実行する工程と、
その結果得られた行画像を中央値フィルタによって処理する工程とを含むことを特徴とする請求項6記載の文書画像強調方法。 - 前記破断ストローク行画像強調工程は、連結構成要素密度又は文字高さ又はその両方に応じて、行画像に対して強い膨張を実行する強膨張実行工程又は行画像に対して弱い膨張を実行する弱膨張実行工程を含むことを特徴とする請求項6記載の文書画像強調方法。
- 前記強膨張実行工程は、平滑化する平滑化工程と、平滑化行画像の連結構成要素密度に応じて行画像に対して強い膨張を実行する工程とを更に含むことを特徴とする請求項9記載の文書画像強調方法。
- 前記平滑化工程は、連結構成要素密度及び行画像がその時点までに平滑化されたことがあるか否かに応じて行画像を平滑化することを含むことを特徴とする請求項10記載の文書画像強調方法。
- 前記中抜けストローク行画像強調工程は、行画像を平滑化する行画像平滑化工程と、その結果得られた行画像を膨張させる行画像膨張工程とを含むことを特徴とする請求項6記載の文書画像強調方法。
- 前記行画像膨張工程は、連結構成要素密度に応じて行画像に対して膨張を実行すべきか否かを判定する工程又は連結構成要素密度に応じて行画像に対して強い膨張を実行すべきか又は弱い膨張を実行すべきかを判定する工程又はその両方を含むことを特徴とする請求項12記載の文書画像強調方法。
- 前記行画像平滑化工程は、連結構成要素密度及び行画像がその時点までに平滑化されたことがあるか否かに応じて行画像を平滑化すべきか否かを判定する工程又は連結構成要素密度に従って平滑化方法を判定する工程又はその両方を含むことを特徴とする請求項12記載の文書画像強調方法。
- 更に、
前記強調行画像を単独文字画像に分割する工程と、
前記分割された単独文字画像を文字認識する工程と
を備えることを特徴とする請求項1に記載の文書画像強調方法。 - 行画像における連結構成要素の数を行画像の文字の数で除算することにより、前記行画像における黒色8連結構成要素密度と白色8連結構成要素密度とを獲得する連結構成要素密度獲得手段と、
前記黒色8連結構成要素密度と白色8連結構成要素密度とに基づいて、前記行画像を正常行画像、破断ストローク行画像及び中抜けストローク行画像のいずれかの種類に分類する行画像分類手段と、
前記行画像に対して、前記行画像分類工程で分類された種類に応じた強調処理を実行することにより、強調行画像を獲得する強調手段と、を備え、
前記行画像分類手段では、
白色8連結構成要素密度<=閾値T1であり且つ黒色8連結構成要素密度>=閾値T2であれば、前記行画像は前記破断ストローク行画像であると分類し、
白色8連結構成要素密度>閾値T1であれば、前記行画像は前記中抜けストローク行画像であると分類し、
白色8連結構成要素密度<=閾値T1であり且つ黒色8連結構成要素密度<閾値T2であれば、前記行画像は前記正常行画像であると分類するものであり、
更に、閾値T1は2〜4であり、閾値T2は3〜5であることを特徴とする文書画像強調装置。 - 請求項1乃至15のいずれか1項に記載の方法をコンピュータに実行させるためのプログラムコードを格納したコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2003101186847A CN1310182C (zh) | 2003-11-28 | 2003-11-28 | 用于增强文档图像和字符识别的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005174323A JP2005174323A (ja) | 2005-06-30 |
JP4164489B2 true JP4164489B2 (ja) | 2008-10-15 |
Family
ID=34744502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004342872A Expired - Fee Related JP4164489B2 (ja) | 2003-11-28 | 2004-11-26 | 文書画像強調方法、装置及びそのための記憶媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7505632B2 (ja) |
JP (1) | JP4164489B2 (ja) |
CN (1) | CN1310182C (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7606445B2 (en) * | 2005-11-30 | 2009-10-20 | General Electric Company | Methods and systems for ultrasound inspection |
US8280157B2 (en) * | 2007-02-27 | 2012-10-02 | Sharp Laboratories Of America, Inc. | Methods and systems for refining text detection in a digital image |
US8548267B1 (en) * | 2007-09-28 | 2013-10-01 | Amazon Technologies, Inc. | Processing a digital image of content using content aware despeckling |
US8838489B2 (en) | 2007-12-27 | 2014-09-16 | Amazon Technologies, Inc. | On-demand generating E-book content with advertising |
JP5208540B2 (ja) * | 2008-02-27 | 2013-06-12 | 株式会社Pfu | 画像ファイル振分方法、画像ファイル振分装置、および、プログラム |
CN101593278B (zh) * | 2008-05-27 | 2013-01-16 | 佳能株式会社 | 文档图像的语言判别方法和系统 |
US8306327B2 (en) * | 2008-12-30 | 2012-11-06 | International Business Machines Corporation | Adaptive partial character recognition |
CN101872475B (zh) * | 2009-04-22 | 2012-03-28 | 中国科学院自动化研究所 | 一种扫描文档图像自动配准方法 |
JP2012114606A (ja) * | 2010-11-24 | 2012-06-14 | Hitachi Consumer Electronics Co Ltd | 制御装置及び制御方法 |
JP2013029904A (ja) * | 2011-07-27 | 2013-02-07 | Sony Corp | 画像処理装置および画像処理方法 |
JP5547226B2 (ja) * | 2012-03-16 | 2014-07-09 | 株式会社東芝 | 画像処理装置、及び画像処理方法 |
US9251568B1 (en) * | 2014-08-29 | 2016-02-02 | Konica Minolta Laboratory U.S.A., Inc. | Pseudo-skeleton based image enhancement for document image reproduction |
CN109378279B (zh) * | 2018-11-12 | 2020-12-18 | 武汉新芯集成电路制造有限公司 | 晶圆检测方法及晶圆检测系统 |
CN110298350B (zh) * | 2019-06-18 | 2024-01-23 | 新疆大学 | 一种高效的印刷体维吾尔文单词分割算法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5142689A (en) * | 1982-09-27 | 1992-08-25 | Siemens Nixdort Informationssysteme Ag | Process for the preparation of the connection of one of several data processor devices to a centrally synchronized multiple line system |
US4891750A (en) * | 1986-10-29 | 1990-01-02 | Pitney Bowes Inc. | Optical character recognition by forming and detecting matrices of geo features |
US5121440A (en) * | 1990-08-30 | 1992-06-09 | Monolithic Resources Corporation | Analog video character recognition system |
US5438628A (en) * | 1993-04-19 | 1995-08-01 | Xerox Corporation | Method for matching text images and documents using character shape codes |
EP0677817B1 (en) * | 1994-04-15 | 2000-11-08 | Canon Kabushiki Kaisha | Page segmentation and character recognition system |
US5848186A (en) * | 1995-08-11 | 1998-12-08 | Canon Kabushiki Kaisha | Feature extraction system for identifying text within a table image |
WO1997013217A1 (fr) * | 1995-10-05 | 1997-04-10 | Fujitsu Denso Ltd. | Procede d'enregistrement des empreintes digitales et appareil pour classer ces empreintes |
US6400845B1 (en) * | 1999-04-23 | 2002-06-04 | Computer Services, Inc. | System and method for data extraction from digital images |
JP4392907B2 (ja) * | 1999-07-30 | 2010-01-06 | 株式会社東芝 | 文字切出し方法 |
EP1661062A4 (en) * | 2003-09-05 | 2009-04-08 | Gannon Technologies Group | SYSTEMS AND METHODS FOR BIOMETRIC IDENTIFICATION THROUGH THE USE OF HANDWIRE IDENTIFICATION |
-
2003
- 2003-11-28 CN CNB2003101186847A patent/CN1310182C/zh not_active Expired - Fee Related
-
2004
- 2004-11-12 US US10/986,378 patent/US7505632B2/en not_active Expired - Fee Related
- 2004-11-26 JP JP2004342872A patent/JP4164489B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20050180660A1 (en) | 2005-08-18 |
CN1622120A (zh) | 2005-06-01 |
JP2005174323A (ja) | 2005-06-30 |
US7505632B2 (en) | 2009-03-17 |
CN1310182C (zh) | 2007-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4423298B2 (ja) | デジタル画像におけるテキスト状エッジの強調 | |
JP5624004B2 (ja) | ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法 | |
JP3768052B2 (ja) | カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体 | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JP4164489B2 (ja) | 文書画像強調方法、装置及びそのための記憶媒体 | |
JP4719386B2 (ja) | カラー原稿の解釈 | |
JP5455038B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2003132358A (ja) | 画像処理方法、装置およびシステム | |
JP2008148298A (ja) | 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体 | |
JP2001297303A (ja) | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 | |
US8611658B2 (en) | Image processing apparatus and image processing method | |
JP2007172132A (ja) | レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法 | |
JP3995185B2 (ja) | 枠認識装置及び記録媒体 | |
EP1017011A2 (en) | Block selection of table features | |
US6532302B2 (en) | Multiple size reductions for image segmentation | |
JP6743092B2 (ja) | 画像処理装置、画像処理の制御方法、及びプログラム | |
JP2000132690A (ja) | ト―クン化によるイメ―ジ分割を用いたイメ―ジ処理方法および装置 | |
US8229214B2 (en) | Image processing apparatus and image processing method | |
JP3296874B2 (ja) | 入力イメージが空白であるかどうかを決定する方法 | |
US5768414A (en) | Separation of touching characters in optical character recognition | |
JP4049560B2 (ja) | 網点除去方法及びシステム | |
JPH11213090A (ja) | 文字図形と背景領域の識別方法およびその装置およびその方法を記録した記録媒体 | |
Ozawa et al. | A character image enhancement method from characters with various background images | |
JP4446332B2 (ja) | セグメンテーション・ベースのハーフトーニング | |
US20220021787A1 (en) | Apparatus, method, and storage medium for removing shading dots |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080418 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080714 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080728 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110801 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120801 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120801 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130801 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |