JP2023051732A - 方法、コンピュータ可読プログラムおよびシステム - Google Patents
方法、コンピュータ可読プログラムおよびシステム Download PDFInfo
- Publication number
- JP2023051732A JP2023051732A JP2022110306A JP2022110306A JP2023051732A JP 2023051732 A JP2023051732 A JP 2023051732A JP 2022110306 A JP2022110306 A JP 2022110306A JP 2022110306 A JP2022110306 A JP 2022110306A JP 2023051732 A JP2023051732 A JP 2023051732A
- Authority
- JP
- Japan
- Prior art keywords
- text
- image
- candidate
- edge
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000012015 optical character recognition Methods 0.000 claims abstract description 49
- 239000000284 extract Substances 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 12
- 230000010339 dilation Effects 0.000 description 6
- 230000003628 erosive effect Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Character Input (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
Description
Claims (20)
- 入力画像からテキストを抽出し、文書を生成するための方法であって、
前記入力画像からエッジマスクを生成することと、ここで、前記エッジマスクは前記入力画像内の特徴のエッジをマーキングする二値画像を含み、
前記エッジマスクから得られるエッジ画像を生成することと、
前記エッジマスク内で、1または複数の推定テキスト領域を識別することと、ここで、前記推定テキスト領域は、マークされたピクセルの所定の割合が潜在的な水平または垂直テキストライン内にあるポリゴンであり、
前記エッジ画像のうち、前記推定テキスト領域のそれぞれに対応する、1または複数の推定テキスト部分のそれぞれに対して、第1の光学文字認識(OCR)操作を実行することによって、テキスト文字の第1のセットを抽出することと、
前記第1のOCR操作によって抽出されたテキスト文字の前記第1のセットに対応する画像文字を、前記入力画像から消去することによって修正画像を生成することと、
前記修正画像上に、抽出されたテキスト文字の前記第1のセットを重ね合わせることによって文書を生成することとを含む方法。 - 得られた前記エッジ画像が前記エッジマスクと同じである請求項1に記載の方法。
- 得られた前記エッジ画像は、入力画像のピクセルをブランクバックグラウンド上の、前記エッジマスク内のマークされた前記エッジに対応する位置に配置することによって生成される請求項1に記載の方法。
- 1または複数の前記推定テキスト領域を識別することは、さらに、
前記エッジマスク内のテキストの水平ライン候補およびテキストの垂直ライン候補を識別することと、
第1の所定数のピクセルよりも小さい幅または高さを有するテキストの前記水平ライン候補を除去すること、および、前記第1の所定数のピクセルよりも小さい幅または高さを有するテキストの前記垂直ライン候補を除去することと、
隣り合った、または重なり合った残りの水平ライン候補および垂直ライン候補を、1または複数のグループ候補へグルーピングすることと、
1または複数のポリゴン候補を生成することと、ここで、前記ポリゴン候補の各々は、1の前記グループ候補から前記水平ライン候補および前記垂直ライン候補を結合し、水平ライン候補および垂直ライン候補が重なり合っているデュプリケートセクションを除去することによって生成され、
前記ポリゴン候補の各々がテキストを含みそうかどうかを判定することと、
テキストを含みそうであると判定されなかった前記ポリゴン候補の各々を除去することとをさらに含み、
前記ポリゴン候補の各々がテキストを含みそうかどうかを判定することは、
前記ポリゴン候補の各々の中で、前記潜在的な水平テキストラインおよび前記潜在的な垂直テキストラインを識別することと、
前記ポリゴン候補の各々の中で、第2の所定数のピクセルよりも小さい幅または高さを有する前記潜在的な水平ラインおよび前記潜在的な垂直テキストラインを除去することと、
前記ポリゴン候補に対応する、得られた前記エッジ画像のポリゴナル部分の中でマークされたピクセルの前記所定の割合が、残りの潜在的な水平テキストラインの中にあるかどうかを決定することによって、前記ポリゴン候補の各々が水平テキストを含みそうかどうかを判定することと、
前記ポリゴン候補に対応する、得られた前記エッジ画像の前記ポリゴナル部分の中でマークされたピクセルの前記所定の割合が、残りの潜在的な垂直テキストラインの中にあるかどうかを決定することによって、前記ポリゴン候補の各々が垂直テキストを含みそうかどうかを判定することとをさらに含む請求項1~3のいずれかに記載の方法。 - 前記入力画像を、1または複数の初期領域へセグメント化することと、
前記初期領域の各々を複数のコンテンツクラスのうちの1つに分類することと、ここで、複数の前記コンテンツクラスは画像クラスを含み、
得られた前記エッジ画像のうち、前記初期領域のそれぞれに対応する、1または複数の初期部分のそれぞれに対して、第2のOCR操作を実行することによって、テキスト文字の第2のセットを抽出することとをさらに含み、前記初期部分は、
前記画像クラス以外の前記コンテンツクラスの1つに分類され、
前記画像クラスとして処理されるように選択され、
テキスト文字の前記第1のセットを抽出することは、得られた前記エッジ画像のうち、前記画像クラスとして分類された前記初期領域のそれぞれの中にある前記推定テキスト部分内でのみ実行され、
前記修正画像を生成することは、
前記第2のOCR操作によって抽出されたテキスト文字の前記第2のセットに対応する画像文字を前記入力画像から消去することをさらに含み、
前記文書を生成することは、
前記修正画像上に、テキスト文字の前記第2のセットを重ね合わせることをさらに含む請求項1に記載の方法。 - 複数の前記コンテンツクラスは、
テキストクラス、
テーブルクラス、
チャートクラス、
フローチャートクラスおよび、
ベクトルグラフィッククラスをさらに含む請求項5に記載の方法。 - 前記初期領域のコンテンツクラスによって判定されたテキストの抽出処理が試みられて失敗するとき、前記初期領域が前記画像クラスとして処理されるように選択される請求項5に記載の方法。
- 入力画像からテキストを抽出し、文書を生成するためのコンピュータ可読プログラムであって、
前記入力画像からエッジマスクを生成し、ここで、前記エッジマスクは前記入力画像内の特徴のエッジをマーキングする二値画像を含み、
前記エッジマスクから得られるエッジ画像を生成し、
前記エッジマスク内で、1または複数の推定テキスト領域を識別し、ここで、前記推定テキスト領域は、マークされたピクセルの所定の割合が潜在的な水平または垂直テキストライン内にあるポリゴンであり、
前記エッジ画像のうち、前記推定テキスト領域のそれぞれに対応する、1または複数の推定テキスト部分のそれぞれに対して、第1の光学文字認識(OCR)操作を実行することによって、テキスト文字の第1のセットを抽出し、
前記第1のOCR操作によって抽出されたテキスト文字の前記第1のセットに対応する画像文字を、前記入力画像から消去することによって修正画像を生成し、
前記修正画像上に、抽出されたテキスト文字の前記第1のセットを重ね合わせることによって文書を生成することをコンピュータに実行させるコンピュータ可読プログラム。 - 得られた前記エッジ画像が前記エッジマスクと同じである請求項8に記載のコンピュータ可読プログラム。
- 得られた前記エッジ画像は、入力画像のピクセルをブランクバックグラウンド上の、前記エッジマスク内のマークされた前記エッジに対応する位置に配置することによって生成される請求項8に記載のコンピュータ可読プログラム。
- 1または複数の前記推定テキスト領域を識別することでは、前記コンピュータ可読プログラムが、さらに、
前記エッジマスク内のテキストの水平ライン候補およびテキストの垂直ライン候補を識別し、
第1の所定数のピクセルよりも小さい幅または高さを有するテキストの前記水平ライン候補を除去し、および、前記第1の所定数のピクセルよりも小さい幅または高さを有するテキストの前記垂直ライン候補を除去し、
隣り合った、または重なり合った残りの水平ライン候補および垂直ライン候補を、1または複数のグループ候補へグルーピングし、
1または複数のポリゴン候補を生成し、ここで、前記ポリゴン候補の各々は、1の前記グループ候補から前記水平ライン候補および前記垂直ライン候補を結合し、水平ライン候補および垂直ライン候補が重なり合っているデュプリケートセクションを除去することによって生成され、
前記ポリゴン候補の各々がテキストを含みそうかどうかを判定し、
テキストを含みそうであると判定されなかった前記ポリゴン候補の各々を除去することとをさらに前記コンピュータにさらに実行させ、
前記ポリゴン候補の各々がテキストを含みそうかどうかを判定することは、
前記ポリゴン候補の各々の中で、前記潜在的な水平テキストラインおよび前記潜在的な垂直テキストラインを識別することと、
前記ポリゴン候補の各々の中で、第2の所定数のピクセルよりも小さい幅または高さを有する前記潜在的な水平ラインおよび前記潜在的な垂直テキストラインを除去することと、
前記ポリゴン候補に対応する、得られた前記エッジ画像のポリゴナル部分の中でマークされたピクセルの前記所定の割合が、残りの潜在的な水平テキストラインの中にあるかどうかを決定することによって、前記ポリゴン候補の各々が水平テキストを含みそうかどうかを判定することと、
前記ポリゴン候補に対応する、得られた前記エッジ画像の前記ポリゴナル部分の中でマークされたピクセルの前記所定の割合が、残りの潜在的な垂直テキストラインの中にあるかどうかを決定することによって、前記ポリゴン候補の各々が垂直テキストを含みそうかどうかを判定することとをさらに含む請求項8~10のいずれかに記載のコンピュータ可読プログラム。 - 前記入力画像を、1または複数の初期領域へセグメント化し、
前記初期領域の各々を複数のコンテンツクラスのうちの1つに分類し、ここで、複数の前記コンテンツクラスは画像クラスを含み、
得られた前記エッジ画像のうち、前記初期領域のそれぞれに対応する、1または複数の初期部分のそれぞれに対して、第2のOCR操作を実行することによって、テキスト文字の第2のセットを抽出することを前記コンピュータにさらに実行させ、前記初期部分は、
前記画像クラス以外の前記コンテンツクラスの1つに分類され、
前記画像クラスとして処理されるように選択され、
テキスト文字の前記第1のセットを抽出することは、得られた前記エッジ画像のうち、前記画像クラスとして分類された前記初期領域のそれぞれの中にある前記推定テキスト部分内でのみ実行され、
前記修正画像を生成することは、
前記第2のOCR操作によって抽出されたテキスト文字の前記第2のセットに対応する画像文字を前記入力画像から消去することをさらに含み、
前記文書を生成することは、
前記修正画像上に、テキスト文字の前記第2のセットを重ね合わせることをさらに含む請求項8に記載のコンピュータ可読プログラム。 - 複数の前記コンテンツクラスは、
テキストクラス、
テーブルクラス、
チャートクラス、
フローチャートクラスおよび、
ベクトルグラフィッククラスをさらに含む請求項12に記載のコンピュータ可読プログラム。 - 前記初期領域のコンテンツクラスによって判定されたテキストの抽出処理が試みられて失敗するとき、前記初期領域が前記画像クラスとして処理されるように選択される請求項12に記載のコンピュータ可読プログラム。
- 入力画像からテキストを抽出し、文書を生成するためのシステムであって、
メモリと、
前記メモリに接続されたプロセッサとを備え、前記プロセッサは、
前記入力画像からエッジマスクを生成し、ここで、前記エッジマスクは前記入力画像内の特徴のエッジをマーキングする二値画像を含み、
前記エッジマスクから得られるエッジ画像を生成し、
前記エッジマスク内で、1または複数の推定テキスト領域を識別し、ここで、前記推定テキスト領域は、マークされたピクセルの所定の割合が潜在的な水平または垂直テキストライン内にあるポリゴンであり、
前記エッジ画像のうち、前記推定テキスト領域のそれぞれに対応する、1または複数の推定テキスト部分のそれぞれに対して、第1の光学文字認識(OCR)操作を実行することによって、テキスト文字の第1のセットを抽出し、
前記第1のOCR操作によって抽出されたテキスト文字の前記第1のセットに対応する画像文字を、前記入力画像から消去することによって修正画像を生成し、
前記修正画像上に、抽出されたテキスト文字の前記第1のセットを重ね合わせることによって文書を生成するシステム。 - 得られた前記エッジ画像が前記エッジマスクと同じである請求項15に記載のシステム。
- 得られた前記エッジ画像は、入力画像のピクセルをブランクバックグラウンド上の、前記エッジマスク内のマークされた前記エッジに対応する位置に配置することによって生成される請求項15に記載のシステム。
- 1または複数の前記推定テキスト領域を識別することでは、前記プロセッサは、さらに、
前記エッジマスク内のテキストの水平ライン候補およびテキストの垂直ライン候補を識別し、
第1の所定数のピクセルよりも小さい幅または高さを有するテキストの前記水平ライン候補を除去し、および、前記第1の所定数のピクセルよりも小さい幅または高さを有するテキストの前記垂直ライン候補を除去し、
隣り合った、または重なり合った残りの水平ライン候補および垂直ライン候補を、1または複数のグループ候補へグルーピングし、
1または複数のポリゴン候補を生成し、ここで、前記ポリゴン候補の各々は、1の前記グループ候補から前記水平ライン候補および前記垂直ライン候補を結合し、水平ライン候補および垂直ライン候補が重なり合っているデュプリケートセクションを除去することによって生成され、
前記ポリゴン候補の各々がテキストを含みそうかどうかを判定し、
テキストを含みそうであると判定されなかった前記ポリゴン候補の各々を除去し、
前記ポリゴン候補の各々がテキストを含みそうかどうかを判定することは、
前記ポリゴン候補の各々の中で、前記潜在的な水平テキストラインおよび前記潜在的な垂直テキストラインを識別することと、
前記ポリゴン候補の各々の中で、第2の所定数のピクセルよりも小さい幅または高さを有する前記潜在的な水平ラインおよび前記潜在的な垂直テキストラインを除去することと、
前記ポリゴン候補に対応する、得られた前記エッジ画像のポリゴナル部分の中でマークされたピクセルの前記所定の割合が、残りの潜在的な水平テキストラインの中にあるかどうかを決定することによって、前記ポリゴン候補の各々が水平テキストを含みそうかどうかを判定することと、
前記ポリゴン候補に対応する、得られた前記エッジ画像の前記ポリゴナル部分の中でマークされたピクセルの前記所定の割合が、残りの潜在的な垂直テキストラインの中にあるかどうかを決定することによって、前記ポリゴン候補の各々が垂直テキストを含みそうかどうかを判定することとをさらに含む請求項15~17のいずれかに記載のシステム。 - 前記プロセッサは、さらに
前記入力画像を、1または複数の初期領域へセグメント化し、
前記初期領域の各々を複数のコンテンツクラスのうちの1つに分類し、ここで、複数の前記コンテンツクラスは画像クラスを含み、
得られた前記エッジ画像のうち、前記初期領域のそれぞれに対応する、1または複数の初期部分のそれぞれに対して、第2のOCR操作を実行することによって、テキスト文字の第2のセットを抽出し、前記初期部分は、
前記画像クラス以外の前記コンテンツクラスの1つに分類され、
前記画像クラスとして処理されるように選択され、
テキスト文字の前記第1のセットを抽出することは、得られた前記エッジ画像のうち、前記画像クラスとして分類された前記初期領域のそれぞれの中にある前記推定テキスト部分内でのみ実行され、
前記修正画像を生成することは、
前記第2のOCR操作によって抽出されたテキスト文字の前記第2のセットに対応する画像文字を前記入力画像から消去することをさらに含み、
前記文書を生成することは、
前記修正画像上に、テキスト文字の前記第2のセットを重ね合わせることをさらに含む請求項15に記載のシステム。 - 前記初期領域のコンテンツクラスによって判定されたテキストの抽出処理が試みられて失敗するとき、前記初期領域が前記画像クラスとして処理されるように選択される請求項19に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/490,770 US12062246B2 (en) | 2021-09-30 | 2021-09-30 | Extracting text from an image |
US17/490,770 | 2021-09-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023051732A true JP2023051732A (ja) | 2023-04-11 |
JP7402931B2 JP7402931B2 (ja) | 2023-12-21 |
Family
ID=85706474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022110306A Active JP7402931B2 (ja) | 2021-09-30 | 2022-07-08 | 方法、コンピュータ可読プログラムおよびシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US12062246B2 (ja) |
JP (1) | JP7402931B2 (ja) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6361387A (ja) * | 1986-09-02 | 1988-03-17 | Hitachi Ltd | 文字切り出し方法 |
JPH0372778A (ja) * | 1989-08-11 | 1991-03-27 | Fuji Xerox Co Ltd | 画像処理装置の領域識別方式 |
JPH0799581A (ja) * | 1992-09-25 | 1995-04-11 | Olympus Optical Co Ltd | 画像処理装置 |
JPH09120443A (ja) * | 1995-10-26 | 1997-05-06 | Canon Inc | 画像処理方法とその装置 |
JPH1185902A (ja) * | 1997-09-12 | 1999-03-30 | Toshiba Corp | 文字読取方式および物品処理装置 |
JP2001285716A (ja) * | 2000-01-24 | 2001-10-12 | Toshiba Corp | テロップ情報処理装置及びテロップ情報表示装置 |
US20060171587A1 (en) * | 2005-02-01 | 2006-08-03 | Canon Kabushiki Kaisha | Image processing apparatus, control method thereof, and program |
JP2009211296A (ja) * | 2008-03-03 | 2009-09-17 | Sharp Corp | 画像処理装置、画像読取装置、画像データ出力処理装置、および画像処理方法 |
JP2010152800A (ja) * | 2008-12-26 | 2010-07-08 | Kddi Corp | 画像処理装置、画像処理方法およびプログラム |
JP2012022575A (ja) * | 2010-07-15 | 2012-02-02 | Canon Inc | 画像処理装置、画像処理方法及びプログラム |
JP2013196369A (ja) * | 2012-03-19 | 2013-09-30 | Pfu Ltd | 画像処理装置、文字認識方法及びコンピュータプログラム |
JP2017156852A (ja) * | 2016-02-29 | 2017-09-07 | ブラザー工業株式会社 | 画像処理装置、および、コンピュータプログラム |
JP2017162179A (ja) * | 2016-03-09 | 2017-09-14 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP2020067959A (ja) * | 2018-10-26 | 2020-04-30 | キヤノン株式会社 | 画像処理装置、その制御方法及びプログラム |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6493465B2 (en) * | 1996-02-21 | 2002-12-10 | Canon Kabushiki Kaisha | Matching point extracting method and apparatus therefor |
US6735335B1 (en) * | 2000-05-30 | 2004-05-11 | Microsoft Corporation | Method and apparatus for discriminating between documents in batch scanned document files |
US6704449B1 (en) | 2000-10-19 | 2004-03-09 | The United States Of America As Represented By The National Security Agency | Method of extracting text from graphical images |
EP1555804A3 (en) * | 2004-01-19 | 2006-08-16 | Ricoh Company, Ltd. | Image processing apparatus, image processing program and storage medium |
US20060239454A1 (en) * | 2005-04-26 | 2006-10-26 | Kwon Jong-Min | Image forming method and an apparatus capable of adjusting brightness of text information and image information of printing data |
KR100714393B1 (ko) | 2005-09-16 | 2007-05-07 | 삼성전자주식회사 | 텍스트 추출 기능을 갖는 호스트 장치 및 그의 텍스트 추출방법 |
CN100517374C (zh) | 2005-12-29 | 2009-07-22 | 佳能株式会社 | 从复杂背景文档图像提取文本的装置、方法 |
US7899248B2 (en) * | 2007-08-30 | 2011-03-01 | Seiko Epson Corporation | Fast segmentation of images |
CN101419661B (zh) | 2007-10-26 | 2011-08-24 | 国际商业机器公司 | 基于图像中的文本进行图像显示的方法和系统 |
US20090148043A1 (en) | 2007-12-06 | 2009-06-11 | International Business Machines Corporation | Method for extracting text from a compound digital image |
US20090273597A1 (en) * | 2008-05-05 | 2009-11-05 | International Business Machines Corporation | User interface screen layout analysis using hierarchical geometric features |
DE102008056600A1 (de) * | 2008-11-10 | 2010-05-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Erkennen von Objekten |
KR20130102895A (ko) * | 2012-03-08 | 2013-09-23 | 한국전자통신연구원 | 동영상에서의 전경 레이어 추출 장치 및 방법 |
US8818099B2 (en) | 2012-09-08 | 2014-08-26 | Konica Minolta Laboratory U.S.A., Inc. | Document image binarization and segmentation using image phase congruency |
RU2013106513A (ru) * | 2013-02-14 | 2014-08-20 | ЭлЭсАй Корпорейшн | Способ и устройство для улучшения изображения и подтверждения границ с использованием по меньшей мере одного дополнительного изображения |
JP6399872B2 (ja) * | 2014-07-07 | 2018-10-03 | キヤノン株式会社 | 情報処理装置、情報処理方法、プログラム |
JP5695257B1 (ja) * | 2014-07-25 | 2015-04-01 | 楽天株式会社 | 画像処理装置、画像処理方法、および画像処理プログラム |
JP6361387B2 (ja) | 2014-09-05 | 2018-07-25 | オムロン株式会社 | 識別装置および識別装置の制御方法 |
CA3193007A1 (en) * | 2016-01-12 | 2017-07-20 | Esight Corp. | Language element vision augmentation methods and devices |
EP3803567A4 (en) * | 2018-06-04 | 2022-03-02 | NVOQ Incorporated | RECOGNIZING ARTIFACTS IN COMPUTER DISPLAYS |
US10863038B1 (en) * | 2019-09-19 | 2020-12-08 | Toshiba Tec Kabushiki Kaisha | Apparatus, method, and storage medium for character recognition processing |
US11574456B2 (en) * | 2019-10-07 | 2023-02-07 | International Business Machines Corporation | Processing irregularly arranged characters |
-
2021
- 2021-09-30 US US17/490,770 patent/US12062246B2/en active Active
-
2022
- 2022-07-08 JP JP2022110306A patent/JP7402931B2/ja active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6361387A (ja) * | 1986-09-02 | 1988-03-17 | Hitachi Ltd | 文字切り出し方法 |
JPH0372778A (ja) * | 1989-08-11 | 1991-03-27 | Fuji Xerox Co Ltd | 画像処理装置の領域識別方式 |
JPH0799581A (ja) * | 1992-09-25 | 1995-04-11 | Olympus Optical Co Ltd | 画像処理装置 |
JPH09120443A (ja) * | 1995-10-26 | 1997-05-06 | Canon Inc | 画像処理方法とその装置 |
JPH1185902A (ja) * | 1997-09-12 | 1999-03-30 | Toshiba Corp | 文字読取方式および物品処理装置 |
JP2001285716A (ja) * | 2000-01-24 | 2001-10-12 | Toshiba Corp | テロップ情報処理装置及びテロップ情報表示装置 |
US20060171587A1 (en) * | 2005-02-01 | 2006-08-03 | Canon Kabushiki Kaisha | Image processing apparatus, control method thereof, and program |
JP2006246435A (ja) * | 2005-02-01 | 2006-09-14 | Canon Inc | 画像処理装置及びその制御方法、プログラム |
JP2009211296A (ja) * | 2008-03-03 | 2009-09-17 | Sharp Corp | 画像処理装置、画像読取装置、画像データ出力処理装置、および画像処理方法 |
JP2010152800A (ja) * | 2008-12-26 | 2010-07-08 | Kddi Corp | 画像処理装置、画像処理方法およびプログラム |
JP2012022575A (ja) * | 2010-07-15 | 2012-02-02 | Canon Inc | 画像処理装置、画像処理方法及びプログラム |
JP2013196369A (ja) * | 2012-03-19 | 2013-09-30 | Pfu Ltd | 画像処理装置、文字認識方法及びコンピュータプログラム |
JP2017156852A (ja) * | 2016-02-29 | 2017-09-07 | ブラザー工業株式会社 | 画像処理装置、および、コンピュータプログラム |
JP2017162179A (ja) * | 2016-03-09 | 2017-09-14 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP2020067959A (ja) * | 2018-10-26 | 2020-04-30 | キヤノン株式会社 | 画像処理装置、その制御方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20230094651A1 (en) | 2023-03-30 |
US12062246B2 (en) | 2024-08-13 |
JP7402931B2 (ja) | 2023-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020140698A1 (zh) | 表格数据的获取方法、装置和服务器 | |
JP6100744B2 (ja) | 自動修復を用いたカラー文書画像セグメンテーション及び二値化 | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
CN110097046A (zh) | 一种文字检测方法及装置、设备和计算机可读存储介质 | |
US7386171B2 (en) | Activity detector | |
US9275030B1 (en) | Horizontal and vertical line detection and removal for document images | |
US9842251B2 (en) | Bulleted lists | |
US9330331B2 (en) | Systems and methods for offline character recognition | |
CN105469027A (zh) | 针对文档图像的水平和垂直线检测和移除 | |
CN111368638A (zh) | 电子表格的创建方法、装置、计算机设备和存储介质 | |
CN112101386B (zh) | 文本检测方法、装置、计算机设备和存储介质 | |
JP7244223B2 (ja) | 電子文書における強調テキストの識別 | |
CN113591746B (zh) | 一种文档表格结构检测方法及装置 | |
US20190266431A1 (en) | Method, apparatus, and computer-readable medium for processing an image with horizontal and vertical text | |
CN114495141A (zh) | 文档段落位置提取方法、电子设备及存储介质 | |
CN112800824B (zh) | 扫描文件的处理方法、装置、设备及存储介质 | |
JP4049560B2 (ja) | 網点除去方法及びシステム | |
JP7402931B2 (ja) | 方法、コンピュータ可読プログラムおよびシステム | |
CN116030472A (zh) | 文字坐标确定方法及装置 | |
US11100355B1 (en) | Document image content protection in the context of noise reduction | |
US20220198185A1 (en) | Finding natural images in document pages | |
AU2018229526B2 (en) | Recursive contour merging based detection of text area in an image | |
CN114648751A (zh) | 一种处理视频字幕的方法、装置、终端及存储介质 | |
CN108573253B (zh) | 车牌字符二值图的生成方法 | |
Konya et al. | Adaptive methods for robust document image understanding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231211 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7402931 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |