JP2014229317A - 1つ以上の画像処理アルゴリズムの自動選択のための方法およびシステム - Google Patents
1つ以上の画像処理アルゴリズムの自動選択のための方法およびシステム Download PDFInfo
- Publication number
- JP2014229317A JP2014229317A JP2014106720A JP2014106720A JP2014229317A JP 2014229317 A JP2014229317 A JP 2014229317A JP 2014106720 A JP2014106720 A JP 2014106720A JP 2014106720 A JP2014106720 A JP 2014106720A JP 2014229317 A JP2014229317 A JP 2014229317A
- Authority
- JP
- Japan
- Prior art keywords
- image
- image processing
- segments
- algorithm
- algorithms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18105—Extraction of features or characteristics of the image related to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Image Processing (AREA)
Abstract
【課題】処理用画像の仕様変化に合わせて適切なアルゴリズムを自動的に選択するシステムを提供する。
【解決手段】受信モジュール212は、トレーニング画像を受信し、画像処理モジュール214は、受信した画像を複数のセグメントに分割し、さらに事前に保存されている画像処理アルゴリズムを、画像セグメントのそれぞれに対して実行する。比較モジュール216は、画像処理アルゴリズム出力を所定のしきい画像処理出力スコアと比較し、記録モジュール218は、画像処理アルゴリズムを、対応する画像セグメントおよび関連特徴ベクトルと併せて、トレーニングペアとして記録する。マッチングモジュール220は、新たに送られてくる前処理済みテスト画像(ターゲットとされる画像)に対し、記録されている前記トレーニングペアから、1つ以上の潜在的にマッチングする画像処理アルゴリズムを選択する。
【選択図】図3
【解決手段】受信モジュール212は、トレーニング画像を受信し、画像処理モジュール214は、受信した画像を複数のセグメントに分割し、さらに事前に保存されている画像処理アルゴリズムを、画像セグメントのそれぞれに対して実行する。比較モジュール216は、画像処理アルゴリズム出力を所定のしきい画像処理出力スコアと比較し、記録モジュール218は、画像処理アルゴリズムを、対応する画像セグメントおよび関連特徴ベクトルと併せて、トレーニングペアとして記録する。マッチングモジュール220は、新たに送られてくる前処理済みテスト画像(ターゲットとされる画像)に対し、記録されている前記トレーニングペアから、1つ以上の潜在的にマッチングする画像処理アルゴリズムを選択する。
【選択図】図3
Description
本出願は、2013年5月24日出願のインド国特許出願第1840/MUM/2013号の優先権を主張する。
本明細書において説明される発明は、画像処理一般に関し、より具体的には、1つ以上の画像処理アルゴリズムの自動選択に関する。
画像処理は、写真またはビデオフレーム等の画像の処理を含み、処理の出力として、処理済み画像や画像に関連する特徴やパラメーターのセットを生成する。
画像の処理は、2値化、ページ分割、スキュー補正、文字認識、ページレイアウト分析のような様々なタスクを含む。これらタスクは、市場において利用可能な様々な従来既知のアルゴリズムによって達成される。しかしながら、大きな問題が、イントラ画像変化(intra image variation:1フレーム(画面)内での画像変化等)がある場合に生じている。その問題とは、単一のアルゴリズムでは、許容可能または所望の結果を生成できないことである。さらに、既知の単一のアルゴリズムは、全ての条件下において画像を良好に処理することができない。
さらに、従来のアプローチでは、所望の処理済み画像を取得するため、アルゴリズムや技術、およびそれらの対応するパラメーターがユーザーフィードバックに基づいて選択される。従来のアプローチの主たる制限は、そのアプローチが人手による介入を含むことにある。人手による介入は、システムを低速にさせ、最終的に取得される結果を人間の認識に対してセンシティブにしてしまう。機械学習を用いた画像処理に対し、適したアルゴリズムを提案する様々なアプローチが存在するが、それにも関わらず、それらアプローチは、イントラ画像変化における課題に対応していない。したがって、複数のアルゴリズムから、処理中に画像の仕様にマッチングする1つ以上のアルゴリズムを自動特定することに対するニーズが存在している。本発明の特定の実施形態は、以下に説明される説明および図から明確となるこれらニーズおよび他の目的を満たすことを目的としている。
本概要は、1つ以上の画像処理アルゴリズムの自動選択のためのシステムおよび方法に関する複数の様態を説明するために提供される。該様態は、以下の詳細な説明においてさらに説明される。本概要は、クレームされた発明の本質的特徴を特定する意図はなく、クレームされた発明の範囲を決定または限定するために用いられる意図もない。
実施形態の1つにおいて、画像処理用の1つ以上の事前に保存されている画像処理アルゴリズムの自動選択のための画像処理システムが開示される。画像処理システムは、プロセッサーと、前記プロセッサーに接続されたメモリーとを有する。前記プロセッサーは、前記メモリー内に存在する複数のモジュールを実行する。前記複数のモジュールは、受信モジュールと、画像処理モジュールと、比較モジュールと、記録モジュールと、マッチングモジュールとを含む。前記受信モジュールは、少なくとも1つの画像(トレーニング画像)を受信するよう構成されている。前記画像処理モジュールは、受信した前記画像を複数の画像セグメントに分割するよう構成されている。前記画像処理モジュールは、さらに、複数の画像処理アルゴリズム出力を取得するために、複数の画像処理アルゴリズムから1つ以上の事前に保存されているアルゴリズムを、前記画像セグメントのそれぞれに対して実行するよう構成されている。一方、前記比較モジュールは、前記画像処理アルゴリズム出力のそれぞれを、所定のしきい画像処理出力スコアと比較するよう構成されている。前記記録モジュールは、画像処理アルゴリズムを、対応する1つ以上の画像セグメントおよび関連特徴ベクトルと併せて、トレーニングペアとして記録するよう構成されている。前記マッチングモジュールは、送られてくる(incoming)前処理済みテスト画像(ターゲットとされる画像)のそれぞれに対し、記録されている前記トレーニングペアから、1つ以上の潜在的にマッチングする画像処理アルゴリズムを選択するよう構成されている。
実施形態の1つにおいて、画像処理環境内において1つ以上のアルゴリズムを自動的に選択するためのコンピューター実施方法が開示される。この方法は、少なくとも1つの画像(トレーニング画像)を受信する工程を含む。前記受信された画像は、複数の画像セグメントに分割される。次の工程において、複数の画像処理アルゴリズム出力を取得するために、前記画像セグメントのそれぞれに対し、複数の画像処理アルゴリズムから1つ以上の事前に保存されているアルゴリズムが実行される。さらに、前記画像処理アルゴリズム出力のそれぞれは、所定のしきい画像処理出力スコアと比較される。前記所定のしきい画像処理出力スコアを超える前記画像処理アルゴリズムのそれぞれ用に、対応する1つ以上の画像セグメントおよび関連特徴ベクトルと併せて、前記画像処理アルゴリズムがトレーニングペアとして記録される。次の工程において、送られてくる前処理済みテスト画像(ターゲットとされる画像)のそれぞれに対し、記録されている前記トレーニングペアから、1つ以上の潜在的にマッチングする画像処理アルゴリズムが選択される。
添付の図を参照して、詳細な説明が記述される。図中に示された各参照番号の左端の数字は、その参照番号が最初に現れる図を表している。各図において、同様の特徴およびコンポーネントは、同じ番号を用いて参照される。
画像処理環境内において1つ以上のアルゴリズムを自動的に選択するためのシステムおよび方法が開示される。
実施形態の1つにおいて、画像処理システムは、プロセッサーと、プロセッサーに接続されたメモリーとを含む。プロセッサーは、メモリー内に存在する複数のモジュールを実行する。複数のモジュールは、受信モジュールと、画像処理モジュールと、比較モジュールと、記録モジュールと、マッチングモジュールとを含む。受信モジュールは、少なくとも1つの画像(トレーニング画像)を受信するよう構成されている。画像処理モジュールは、画像を、複数の画像セグメントに分割するよう構成されている。画像処理モジュールは、さらに、複数の画像処理アルゴリズム出力を取得するため、複数の画像処理アルゴリズムから1つ以上の事前に保存されているアルゴリズムを用いて、画像セグメントのそれぞれに対し、画像処理を実行するよう構成されている。一方、比較モジュールは、画像処理アルゴリズム出力のそれぞれを、所定のしきい画像処理出力スコアと比較するよう構成されている。記録モジュールは、画像処理アルゴリズムを、対応する1つ以上の画像セグメントおよび関連特徴ベクトルと併せて、トレーニングペアとして記録するよう構成されている。マッチングモジュールは、送られてくる前処理済みテスト画像(ターゲットとされる画像)のそれぞれに対し、記録されているトレーニングペアから(記録されているトレーニングペアを参照して)、1つ以上の潜在的にマッチングする画像処理アルゴリズムをマッチングするよう構成されている。
実施形態の1つにおいて、画像(トレーニング画像)は、画像処理システムによって受信される。受信された画像は、分割用の既知のアルゴリズムを用いて、複数のセグメントに分割される。複数の事前に保存されているアルゴリズムは、この複数のセグメントに適用することができる。さらに、アルゴリズムを実行することによって得られた各結果は、所定のしきい画像処理出力スコアと比較される。次の工程において、所定のしきい画像処理出力スコアを超える画像処理アルゴリズムのそれぞれに対し、画像処理アルゴリズムは、対応する1つ以上の画像セグメントおよびそれらの関連する特徴ベクトルと併せて、トレーニングペアとして記録される。さらに、送られてくる前処理済みテスト画像(ターゲットとされる画像)のそれぞれに対し、トレーニングペアから、1つ以上の潜在的にマッチングする画像処理アルゴリズムが選択される。
実施形態の1つにおいて、前処理済みテスト画像は、複数の画像セグメント(テスト画像セグメント)にさらに分割されるテスト画像を受信することによって取得される。その後、複数の特徴(特徴ベクトル)は、前記複数の画像セグメントから抽出される。
説明された画像処理環境内において1つ以上のアルゴリズムを自動的に選択するためのシステムおよび方法の様態は、任意の数の異なる演算システム、環境および/または構成によって実施することができるが、実施形態は、以下の例示的なシステムの文脈において、説明される。
参照される図1には、本発明の実施形態に係る画像処理環境内において1つ以上のアルゴリズムを自動的に選択するための画像処理システム102のネットワーク実施100が示されている。実施形態の1つにおいて、画像処理システム102は、画像(トレーニング画像)を受信するよう構成されている。受信された画像は、分割用の既知のアルゴリズムを用いて、複数のセグメントに分割される。複数の事前に保存されているアルゴリズムは、それら複数のセグメントに適用される。さらに、これらアルゴリズムを実行することによって得られた結果のそれぞれは、しきい画像処理出力スコアと比較される。次の工程において、所定のしきい画像処理出力スコアを超える画像処理アルゴリズムのそれぞれに対し、画像処理アルゴリズムは、対応する1つ以上の画像セグメントおよび関連特徴ベクトルと併せて、トレーニングペアとして記録される。さらに、送られてくる前処理済みテスト画像(ターゲットとされる画像)のそれぞれに対し、記録されているトレーニングペアから1つ以上の潜在的にマッチングする画像処理アルゴリズムが選択される。
画像処理システム102は、サーバー上に実施されているものとして、本発明は説明されるが、画像処理システム102は、ラップトップコンピューター、デスクトップコンピューター、ノートパソコン、ワークステーション、メインフレームコンピューター、サーバー、ネットワークサーバー等の様々な演算システムにおいて実施してもよいことを理解されたし。画像処理システム102は、以下集合的にユーザー104と称される1つ以上のユーザーデバイス104−1、104−2…104−Nを介したユーザー、またはユーザーデバイス104上に駐在するアプリケーションによってアクセスされてもよいことを理解されたし。これらに限定されるものではないが、ユーザーデバイス104の例として、ポータブルコンピューター、PDA(Personal Digital Assistant)、ハンドヘルドデバイス、ワークステーションが挙げられる。ユーザーデバイス104は、ネットワーク106を介して、画像処理システム102に通信可能に接続されている。
実施形態の1つにおいて、ネットワーク106は、無線ネットワーク、有線ネットワークまたはこれらの組み合わせであってもよい。ネットワーク106は、イントラネット、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット等のような異なるタイプのネットワークのいずれか1つとして実施することができる。ネットワーク106は、専用ネットワークまたは共有ネットワークのいずれであってもよい。共有ネットワークは、異なるタイプのネットワークの接続を表す。異なるタイプのネットワークの接続は、例えば、ハイパーテキストトランスファープロトコル(HTTP)、トランスミッションコントロールプロトコル/インターネットプロトコル(TCP/IP)、ワイヤレスアプリケーションプロトコル(WAP)等の様々なプロトコルを使用し、互いに通信を行う。さらに、ネットワーク106は、ルーター、ブリッジ、サーバー、演算デバイス、ストレージデバイス等を含む様々なネットワークデバイスを含んでいてもよい。
参照される図2には、本発明の実施形態に係る画像処理システム102が示されている。実施形態の1つにおいて、画像処理システム102は、少なくとも1つのプロセッサー202と、入出力(I/O)インターフェース204と、メモリー206とを含む。少なくとも1つのプロセッサー202は、1つ以上のマイクロプロセッサー、マイクロコンピューター、マイクロコントローラー、デジタル信号プロセッサー、中央演算装置(CPU)、状態機械(state machine)、論理回路および/または操作命令に基づいて信号を操作する任意のデバイスとして、実施することができる。他の機能として、少なくとも1つのプロセッサー202は、メモリー206内に保存されているコンピューター可読命令をフェッチ(fetch:メモリーから命令を持ってくること)および実行するよう構成されている。
I/Oインターフェース204は、例えば、ウェブインターフェース、グラフィカルユーザーインターフェース(GUI)等の様々なソフトウェアおよびハードウェアインターフェースを含む。I/Oインターフェース204は、画像処理システム102が、ユーザーと直接に、または、クライアントデバイス104を介して相互通信することを可能とする。さらに、I/Oデバイス204は、画像処理システム102が、ウェブサーバーや外部データサーバー(図示せず)等の他の演算デバイスと通信することを可能とする。I/Oインターフェース204は、有線ネットワーク(例えば、LANやケーブル等)や無線ネットワーク(WLAN、携帯電話、衛星等)を含む幅広い種類のネットワークおよびプロトコルタイプ内における多重通信を容易とすることができる。I/Oインターフェース204は、多数のデバイスを互いに、または他のサーバーに接続するための1つ以上のポートを含む。
メモリー206は、例えば、揮発性メモリー(静的ランダムアクセスメモリー(SRAM)や動的ランダムアクセスメモリー(DRAM)等)および/または不揮発性メモリー(リードオンリーメモリー(ROM)、消去可能プログラム可能ROM、フラッシュメモリー、ハードディスク、光ディスク、磁気テープ等)を含む本分野において既知の任意のコンピューター可読媒体を含む。メモリー206は、モジュール208と、データ210とを含む。
モジュール208は、特定のタスクを実行または特定の抽象データタイプ(abstract data type)をインプリメント(implement)するルーティーン(routine:ある限定されたタスクを実行するプログラム)、プログラム、オブジェクト、コンポーネント、データ構造等を含む。実施形態の1つにおいて、モジュール208は、受信モジュール212と、画像処理モジュール214と、比較モジュール216と、記録モジュール218と、マッチングモジュール220と、その他モジュール222とを含む。その他モジュール222は、画像処理システム102のアプリケーションおよびファンクションを補完するプラグラムまたはコード化された命令を含む。
特に、データ210は、その他要素の中でも、1つ以上のモジュール208によって、処理され、受信され、生成されたデータを保存するためのレポジトリ(repository:データ、情報、プログラム等を保存するシステム内のデータベース)として機能する。また、データ210は、受信データベース224と、画像処理データベース226と、比較データベース228と、記録データベース230と、マッチングデータベース232と、その他データベース234とを含む。その他データベース234は、その他モジュール222内の1つ以上のモジュールの実行結果として生成されるデータを含む。
実施形態の1つにおいて、ユーザーは、I/Oインターフェース204を介して画像処理システム102にアクセスするため、クライアントデバイス104を使用する。ユーザーは、画像処理システム102を使用するため、I/Oインターフェース204を用いて、自身を登録(本人登録)することができる。画像処理システム102の動作は、以下に説明される図3および図4において、詳細に説明される。画像処理システム102は、画像処理環境内において1つ以上のアルゴリズムを自動的に選択するために用いることができる。画像処理システム102の実際の動作は、以下のセクションにおいて説明される。
参照する図3には、本発明の実施形態に係る画像処理システム102の詳細な動作を説明するブロック図300が示されている。
実施形態の1つにおいて、モジュール208は、特定のタスクを実行または特定の抽象データタイプをインプリメントするルーティーン、プログラム、オブジェクト、コンポーネント、データ構造等を含む。実施形態の1つにおいて、モジュール208は、受信モジュール212と、画像処理モジュール214と、比較モジュール216と、記録モジュール218と、マッチングモジュール220と、その他モジュール222とを含む。その他モジュール222は、画像処理システム102のアプリケーションおよびファンクションを補完するプログラムまたはコード化された命令を含む。
受信モジュール212
実施形態の1つにおいて、受信モジュール212は、処理を施すための複数の画像(トレーニング画像)を受信するよう構成されている。受信モジュール212によって受信された画像は、画像処理システム102と相互通信する様々なデバイス104から取得される。
実施形態の1つにおいて、受信モジュール212は、処理を施すための複数の画像(トレーニング画像)を受信するよう構成されている。受信モジュール212によって受信された画像は、画像処理システム102と相互通信する様々なデバイス104から取得される。
実施例の1つにおいて、受信された画像は、JPEG/JFIF画像、JPEG2000画像、Exif画像、TIFF画像、RAW画像等を含むがこれらに限定されないファイル形式である。
実施形態の1つにおいて、受信モジュール212は、デバイス104から、前処理済み画像(ターゲットとされる画像)を受信する。前処理済み画像は、画像(ターゲットとされる画像)から抽出された複数の特徴(特徴ベクトル)を含むがこれに限定されない。
実施例の1つにおいて、前処理済み画像は、テスト画像を受信し、受信したテスト画像を複数の画像セグメント(テスト画像セグメント)に分割することによって取得される。複数の画像セグメントは、複数の特徴(特徴ベクトル)を抽出するためにさらに利用される。
実施形態の1つにおいて、受信モジュール212に関連するデータは、受信データベース224内に保存される。実施例の1つにおいて、受信データベース224は、処理用に受信された複数の画像と、前処理済み画像と、複数の画像から抽出された複数の特徴を含むがこれに限定されない。
画像処理モジュール214
実施形態の1つにおいて、画像処理モジュール214は、受信した画像(トレーニング画像)を複数の画像セグメントに分割するよう構成されている。さらに、画像処理モジュール214は、複数の画像処理アルゴリズム出力を取得するために、複数の画像処理アルゴリズムから1つ以上の事前に保存されているアルゴリズムを、画像セグメントのそれぞれに対して実行するよう構成されている。
実施形態の1つにおいて、画像処理モジュール214は、受信した画像(トレーニング画像)を複数の画像セグメントに分割するよう構成されている。さらに、画像処理モジュール214は、複数の画像処理アルゴリズム出力を取得するために、複数の画像処理アルゴリズムから1つ以上の事前に保存されているアルゴリズムを、画像セグメントのそれぞれに対して実行するよう構成されている。
実施形態の1つにおいて、画像処理モジュール214は、画像処理システム102内に事前に保存されている既知の分割方法を用いて、受信した画像を複数の画像セグメントに分割する。実施例の1つにおいて、既知の分割方法は、しきい値処理方法(thresholding method)、クラスタリング方法(clustering method)、圧縮ベース方法(compression-based method)等を含むがこれに限定されない。
実施形態の1つにおいて、複数の画像セグメントは、重複セグメント(overlapping segments)、非重複セグメント(non-overlapping segments)またはこれらの組み合わせを含むがこれに限定されない。これら画像セグメントは、さらに、複数の画像処理アルゴリズム出力を取得するために、複数の画像処理アルゴリズムから1つ以上の事前に保存されているアルゴリズムを用いて、処理される。
実施例の1つにおいて、1つ以上の事前に保存されているアルゴリズムは、2値化アルゴリズム、ノイズ低減アルゴリズム、分割アルゴリズム(segmentation algorithms)、文字認識アルゴリズム、ページレイアウト検出、ページレイアウト分割および本分野において既知で既存の任意の画像処理アルゴリズムを含むがこれに限定されない。
実施例の1つにおいて、処理によって取得される複数の画像処理アルゴリズム出力は、各領域に対し予測されたアルゴリズムに従って、同じ画像の複数の異なる領域を含んでいてもよい。別の実施例において、複数の画像処理アルゴリズム出力は、画像や、画像に関連する特徴またはパラメーターのセットを含んでいてもよい。
実施形態の1つにおいて、画像処理モジュール214に関連するデータは、画像処理データベース226内に保存される。実施例の1つにおいて、画像処理データベース226は、複数の既知の分割方法、複数の画像処理アルゴリズム、複数の画像セグメント等を含むがこれに限定されない。
比較モジュール216
実施形態の1つにおいて、比較モジュール216は、画像処理アルゴリズム出力のそれぞれを、所定のしきい画像処理出力スコアと比較するよう構成されている。画像処理モジュール216から取得された出力は、所定のしきい画像処理出力スコアと比較される。
実施形態の1つにおいて、比較モジュール216は、画像処理アルゴリズム出力のそれぞれを、所定のしきい画像処理出力スコアと比較するよう構成されている。画像処理モジュール216から取得された出力は、所定のしきい画像処理出力スコアと比較される。
実施例の1つにおいて、画像処理モジュール216から取得された出力は、グランドトゥルース(GT (Ground Truth):航空写真のような平面画像に現れる識別対象物の実際のデータ)と比較される。GTは、人手によって注釈を入れられたデータまたは本分野において既知の任意のGT技術を含むがこれに限定されない技術を用いて算出される。
実施形態の1つにおいて、比較モジュール216は、所定のしきい画像処理出力スコアを、各トレーニングペア用の特徴であるグランドトゥルースとして決定する。さらに、比較モジュール216に関連するデータは、比較データベース228内に保存される。実施例の1つにおいて、比較データベース228は、画像処理アルゴリズム出力、所定のしきい画像処理出力スコア、グランドトゥルース(GT)等を含むがこれに限定されない。
記録モジュール218
実施形態の1つにおいて、記録モジュール218は、比較モジュール216の出力に基づいて、画像処理アルゴリズムを、対応する1つ以上の画像セグメントおよび関連特徴ベクトルと併せて、トレーニングペアとして記録するよう構成されている。
実施形態の1つにおいて、記録モジュール218は、比較モジュール216の出力に基づいて、画像処理アルゴリズムを、対応する1つ以上の画像セグメントおよび関連特徴ベクトルと併せて、トレーニングペアとして記録するよう構成されている。
実施形態の1つにおいて、画像処理アルゴリズムは、対応する1つ以上の画像セグメントと共に、比較モジュール216から取得される。1つ以上の画像セグメントに関連する関連特徴ベクトルは、各セグメントに対し、画像モーメント特徴を抽出することにより取得される。画像モーメント特徴は、画像セグメントに対応する平均(mean)、分散およびスキュー(skew:画像歪み)を含む。さらに、特徴ベクトルは、各画像セグメント用の画像モーメント特徴に基づいて形成される。特徴ベクトルは、HSV量子化や本分野において既知の任意の技術を用いて取得される。実施例の1つにおいて、長さの特徴ベクトル265は、受信された画像のそれぞれから抽出される。
実施形態の1つにおいて、トレーニングペアは、対応する1つ以上の画像セグメントと併せて、画像処理アルゴリズムを含むがこれに限定されない。
実施形態の1つにおいて、記録モジュール218に関連するデータは、記録データベース230内に保存される。実施形態の1つにおいて、記録データベース230は、画像処理アルゴリズムを、対応する1つ以上の画像セグメントおよび関連特徴ベクトルと併せて、トレーニングペアとして記録していて(含んでいて)もよく、または、各トレーニングペア用の特徴として決定されたグランドトゥルース(GT)等を記録していてもよいがこれに限定されない。
マッチングモジュール220
実施形態の1つにおいて、マッチングモジュール220は、送られてくる前処理済みテスト画像(ターゲットとされる画像)のそれぞれに対し、トレーニングペアから、1つ以上の潜在的にマッチングする画像処理アルゴリズムをマッチングするよう構成されている。前処理済みテスト画像は、テスト画像(ターゲットとされる画像)を受信し、受信したテスト画像を複数の画像セグメント(テスト画像セグメント)に分割することにより取得される。複数の画像セグメントは、複数の特徴(特徴ベクトル)を抽出するためにさらに利用される。
実施形態の1つにおいて、マッチングモジュール220は、送られてくる前処理済みテスト画像(ターゲットとされる画像)のそれぞれに対し、トレーニングペアから、1つ以上の潜在的にマッチングする画像処理アルゴリズムをマッチングするよう構成されている。前処理済みテスト画像は、テスト画像(ターゲットとされる画像)を受信し、受信したテスト画像を複数の画像セグメント(テスト画像セグメント)に分割することにより取得される。複数の画像セグメントは、複数の特徴(特徴ベクトル)を抽出するためにさらに利用される。
実施形態の1つにおいて、セグメントからの複数の特徴は、本分野における当業者によく知られている方法によって抽出される。しかしながら、開示される本発明は、本分野における当業者によく知られている他の画像分割方法を含んでいてもよいことを理解されたし。
実施例の1つにおいて、受信された画像は、JPEG/JFIF画像、JPEG2000画像、Exif画像、TIFF画像、RAW画像等を含むがこれに限定されないファイル形式である。
実施形態の1つにおいて、画像前処理は、画像処理システム102内またはデバイス104において実行される。
実施形態の1つにおいて、マッチングモジュール220に関連するデータは、マッチングデータベース232内に保存される。実施例の1つにおいて、マッチングデータベース232は、前処理済みテスト画像、画像処理アルゴリズム等を含むがこれに限定されない。
参照する図4には、本発明の実施形態に係る画像処理環境内において1つ以上のアルゴリズムを自動的に選択するための方法が示されている。
方法400は、コンピューター実行可能命令の一般的コンテキストの形態で説明される。一般的に、コンピューター実行可能命令は、特定の機能を実行または特定の抽象データタイプをインプリメントするルーティーン、プログラム、オブジェクト、コンポーネント、データ構造、プロシージャ(procedure)、モジュール、ファンクション等を含むことができる。また、方法400は、配布された演算環境内において実行される。演算環境内において、機能は、通信ネットワークを介してリンクされたリモート処理デバイスによって実行される。配布された演算環境内において、コンピューター実行可能命令は、メモリーストレージデバイス等のローカルおよびリモートコンピューターストレージ媒体の双方内に位置することができる。
方法400の説明での順番は、限定を構成する意図はなく、任意の数の説明される方法のブロックが任意の順番で組み合され、方法400またはその他方法を実施することができる。さらに、各ブロックは、ここに説明される発明の原理および範囲から有意に離れることのない限り、方法400から省略することができる。さらに加えて、本方法は、任意の適したハードウェア、ソフトウェア、ファームウェアまたはこれらの組み合わせ内において実施することができる。しかしながら、説明の簡略化のため、以下に説明する本実施形態では、方法400は、上述の画像処理システム102内で実施されているものとする。
ブロック402において、少なくとも1つの画像(トレーニング画像)が受信される。受信された画像は、画像処理システム102と相互通信している様々なデバイス104から取得される。
ブロック404において、受信した画像は、複数の画像セグメントに分割される。画像の分割は、本分野において既知で既存の任意の画像分割技術を用いて実行される。しかしながら、開示される本発明は、本分野における当業者によく知られている画像分割の他の方法を含んでもよいことを理解されたし。
ブロック406において、複数の画像処理アルゴリズム出力を取得するため、画像セグメントのそれぞれに対し、複数の画像処理アルゴリズムから少なくとも1つの事前に保存されているアルゴリズムが実行される。実施例の1つにおいて、画像処理アルゴリズムは、2値化アルゴリズム、ノイズ低減アルゴリズム、分割アルゴリズム、文字認識アルゴリズムを含むがこれに限定されない。
ブロック408において、画像処理アルゴリズム出力は、所定のしきい画像処理出力スコアと比較される。実施例の1つにおいて、所定のしきい画像処理出力スコアは、各トレーニングペア用の特徴であるグランドトゥルース(GT)である。
ブロック410において、画像処理アルゴリズムは、対応する画像セグメントおよび関連特徴ベクトルと併せて、トレーニングペアとして記録される。実施形態の1つにおいて、1つ以上の画像セグメントに関連する関連特徴ベクトルは、画像セグメントのそれぞれの画像モーメント特徴を抽出することにより取得される。画像モーメント特徴は、画像セグメントに対応する平均、分散およびスキューを含む。さらに、特徴ベクトルは、画像セグメントのそれぞれの画像モーメント特徴に基づいて、形成される。特徴ベクトルは、HSV量子化を用いて取得される。
ブロック412において、さらなる処理のために送られてくる前処理済みテスト画像(ターゲットとされる画像)のそれぞれに対し、記録されているトレーニングペアからマッチングする画像処理アルゴリズムが選択される。実施形態の1つにおいて、前処理済みテスト画像は、テスト画像を受信し、受信したテスト画像を複数の画像セグメント(テスト画像セグメント)に分割することによって取得される。複数の画像セグメントは、複数の特徴(特徴ベクトル)を抽出するためにさらに利用される。前処理済みテスト画像のそれぞれに潜在的にマッチングする画像処理アルゴリズムの選択は、(前処理済み)テスト画像のテスト画像セグメントおよび該テスト画像セグメントから抽出された特徴ベクトルと、記録されているトレーニングペアの画像セグメントおよび関連特徴ベクトルとをマッチングすることによって実行される。
参照する図5には、本発明の実施形態に係る前処理済みテスト画像を取得するための方法500が示されている。方法500は、画像処理システム102内またはデバイス104内において実行される。
ステップ502において、テスト画像(ターゲットとされる画像)が受信される。実施例の1つにおいて、受信された画像は、JPEG/JFIF画像、JPEG2000画像、Exif画像、TIFF画像、RAW画像等を含むがこれに限定されないファイル形式である。
ステップ504において、受信されたテスト画像は、複数の画像セグメント(テスト画像セグメント)に分割される。実施例の1つにおいて、分割は、本分野において既知で既存の任意の画像分割技術によって実行される。しかしながら、開示される本発明は、本分野における当業者によく知られている他の画像分割方法を含んでいてもよいことを理解されたし。
ステップ506において、複数の画像セグメントは、複数の特徴(特徴ベクトル)を抽出するために、さらに利用される。実施例の1つにおいて、抽出は、本分野において既知で既存の任意の画像抽出技術によって実行される。しかしながら、開示される本発明は、本分野における当業者によく知られている他の画像抽出方法を含んでいても良いことは理解されたし。
参照される図6には、本発明の実施形態に係る画像処理のフローチャートが示されている。
実施形態の1つにおいて、画像(トレーニング画像)が、画像処理システムによって受信される。受信された画像は、既知の分割用アルゴリズムを用いて、複数のセグメントに分割される。複数の事前に保存されているアルゴリズムは、複数のセグメントにそれぞれ適用され、複数の画像処理アルゴリズム出力が取得される。さらに、複数の画像処理アルゴリズム出力のそれぞれ(すなわち、アルゴリズムの結果のそれぞれ)は、グランドトゥルース(GT)である所定のしきい画像処理出力スコアと比較される。次の工程において、所定のしきい画像処理出力スコアを超える画像処理出力を有する画像処理アルゴリズムのそれぞれが記録される。このとき、その画像処理アルゴリズムが、対応する1つ以上の画像セグメントおよび関連特徴ベクトルと併せて、トレーニングペアとして記録される。
さらに、少なくとも1つのテスト画像(ターゲットとされる画像)が、画像処理システムによって受信される。受信されたテスト画像は、既知の分割用アルゴリズムを用いて、複数のセグメント(テスト画像セグメント)に分割される。既知の抽出アルゴリズムを用いて、テスト画像のそれぞれの画像セグメントから、複数の特徴(特徴ベクトル)が抽出される。最後に、送られてくる前処理済み(特徴抽出された)テスト画像のテスト画像セグメントおよび該テスト画像セグメントに関連する特徴ベクトルと、記録されている1つ以上の画像セグメントおよび記録されている画像セグメントに関連する特徴ベクトルとをマッチングすることにより、送られてくる前処理済みテスト画像のそれぞれに対し、1つ以上の潜在的にマッチングする画像処理アルゴリズムが選択される。
このフローチャートの詳細な動作が図7に示されている。
参照される図7には、本発明の実施形態に係る例示的な画像処理システムと、その動作が示されている。
T={t1,t2......tn}が、n個のトレーニング画像のセットであるとする。各トレーニング画像ti用に、光学式文字認識(OCR’s)出力が取得される。Aは、m個の2値化アルゴリズムのセットA={a1,a2....am}であり、これらは、画像処理システム内に事前に保存されている。各画像は、k個の(重複したまたは非重複の)セグメント(s1,s2.....sk)に分割される。すなわち、以下の式が成立する。
さらに、m個のアルゴリズムのそれぞれは、k個のセグメントのそれぞれに対し適用される。rijを、アルゴリズムajをセグメントsiに対して適用した結果の2値化を示すものとする。画像全部の2値化は、以下の式によって取得される。
ここで、jは1からmまで変動可能であるので、1つのトレーニング画像に対し、km個の異なる2値化結果が存在する。
実施例の1つにおいて、OCRは、これらk個のセグメントのkm個の画像(2値化結果)のそれぞれを認識し、複数のOCR出力(o1,o2......ok m)を生成する。これらoiのそれぞれは、その後、対応するグランドトゥルース(GT)giと比較される。このとき、マッチングが見つけられたのであれば、それはすなわち、oiを生成する一連のアルゴリズムは、k個のセグメントに対して適用されるk個の2値化アルゴリズム(k個のアルゴリズム全てが必ずしも区別可能(distinct)である必要はない)の正しいセット(right set)である。B={b1,b2.....bk}を、k個のセグメント(s1,s2.....sk)に適用されるこれらk個のアルゴリズムのセットとする。実施形態の1つにおいて、2値化アルゴリズムは、大津手法(Otsu’s method)、Savoula手法(Savoula method)、Niblack手法(Niblack method)、Wolf2値化技術(Wolf Binarization Technique)等を含むがこれに限定されない。
ここで、全てbi∈Aであり、biはbjと等しくともよい(ここで、i≠j)。したがって、biとsiとの間には1対1対応が成立し、biがsiの2値化用の正しいアルゴリズムであると判断することができる。
上記構造は、トレーニングペア<画像セグメント,2値化アルゴリズム>、すなわち、<si,bi>を生成するために用いられる。(b1,b2.......bk)のそれぞれは、出力を生成する経路としてみなすことができ、mk個のそのような経路が存在する。このモデルは、そのOCR出力が適切である(correct)ことを判断するための複数の最終画像を生成する。したがって、単一のトレーニング画像から、適切なOCR結果を与える複数の経路を取得することができる。これら経路の全てが、トレーニングインスタンス(training instance)を生成するために参照される。この処理が、図7に説明されている。GTは、グランドトゥルースを表し、チェックマークは、適切なOCR出力を生成する経路に対応しており、バツマークは、誤ったOCR出力を生成する経路を示している。誤ったOCR出力を生成する経路は、トレーニングデータを準備する際、無視される。
実施例の1つにおいて、機械学習アルゴリズム(例えばSVM)に従ってマシーン(機械)をトレーニングするため、次に、各si(画像セグメントを表す)は、対応する特徴ベクトルfiとなる。そのため、最終的に<fi,bi>ペアがトレーニングのために用いられる。
実施例の1つにおいて、特徴ベクトルは、画像セグメントのそれぞれ用の画像モーメント特徴に基づいて取得される。画像モーメント特徴は、画像セグメント(sxy)に対応する平均(Ex)と、分散(σx)と、スキュー(Zx)とを含む。これら特徴は、以下の式を用いて抽出される。
実施例の1つにおいて、特徴ベクトルは、HSV量子化を用いて取得される。
さらに、トレーニングデータは、各セグメントに対し<fi,bi>ペアを生成することによって構築される。ここで、fiは、特徴ベクトルである。
処理用にアルゴリズムを自動的に選択するため、テスト画像(ターゲットとされる画像)が受信される。画像処理システムは、テスト画像をk個のセグメント(テスト画像セグメント)に分割し、k個のセグメントのそれぞれ用の対応する2値化アルゴリズムを予測する。各画像セグメントから特徴(特徴ベクトル)が抽出され、SVMによって(各画像セグメントに対するアルゴリズムの)予測が実行される。SVMは、前もって準備されたトレーニングデータセットでトレーニングされている。次に、各画像セグメントが、予測されたアルゴリズムを用いて2値化される。テスト画像の最終2値バージョンは、それらのセグメントに対し2値化された画像の論理和(ORing)をシンプルに実行することにより取得される。
実施例の1つにおいて、このモデルの目標指向の評価(goal directed evaluation)は、テスト画像の2値バージョンを読むためのOCRを用いて実行される。OCR結果が、テスト画像に対応するグランドトゥルースとマッチングするのであれば、該テスト画像用の正しい2値化戦略の予測が成功したものとみなすことができる。
参照する図8には、本発明の実施形態に係る画像処理システムの結果が示されている。
図8は、3つの画像を示している。左側コラムには、適用時に適切なOCRをもたらす2値化アルゴリズムがなかった場合の画像が示されている。右側コラムには、適切なOCR出力を実現するために、提案の発明である画像処理システムによって得られた出力が示されている。
上記発明の主たる利点は、複数の事前に保存されているアルゴリズムから、画像の仕様にマッチングする1つ以上のアルゴリズムを、処理中に自動的に特定できることにある。
本発明の別の利点は、イントラ画像変化が存在し、単一のアルゴリズムが許容可能な結果を生成できない場合であっても、効率的に動作できることにある。
本発明の別の利点は、システムを低速にさせ、最終的に取得される結果を人間の認識に対してセンシティブにしてしまう人手による介入を減らせるので、効率的かつ高速であることにある。
本発明の別の利点は、イントラ画像変化に対しても有効な、機械学習アプローチを用いた画像処理用に適したアルゴリズムを提供できることにある。
本発明の別の利点は、従来の画像処理システムにおける時間浪費が、上述の自動プロセスによって、劇的に減少することにある。
画像処理用の自動アルゴリズム選択のための方法およびシステムの実施は、構造的特徴および/または方法に特有の用語によって説明されたが、添付の請求項は、説明された特定の特徴または方法に必ずしも限定されないことは理解されたし。つまり、特定の特徴および方法は、画像処理用の自動アルゴリズム選択の実施の例として説明された。
Claims (11)
- 画像処理環境内において1つ以上のアルゴリズムを自動的に選択するためのコンピューター実施される方法であって、
少なくとも1つの画像を受信する工程と、
受信された前記画像を複数の画像セグメントに分割する工程と、
複数の画像処理アルゴリズム出力を取得するために、前記画像セグメントのそれぞれに対し、複数の画像処理アルゴリズムから1つ以上の事前に保存されているアルゴリズムを実行する工程と、
前記画像処理アルゴリズム出力のそれぞれを、所定のしきい画像処理出力スコアと比較する工程と、
前記所定のしきい画像処理出力スコアを超えた前記画像処理アルゴリズムのそれぞれに対し、前記画像処理アルゴリズムを、対応する1つ以上の画像セグメントおよび関連特徴ベクトルと併せて、トレーニングペアとして記録する工程と、
送られてくる前処理済みテスト画像に対し、前記トレーニングペアから1つ以上の潜在的にマッチングする画像処理アルゴリズムを選択する工程と、を含むことを特徴とする方法。 - 前記前処理済みテスト画像は、
テスト画像を受信する工程と、
受信された前記テスト画像を複数の画像セグメントに分割する工程と、
前記複数の画像セグメントから複数の特徴を抽出する工程と、を経て取得される請求項1に記載のコンピューター実施される方法。 - 前記複数の画像セグメントは、重複セグメント、非重複セグメントまたはこれらの組み合わせを含む請求項1に記載のコンピューター実施される方法。
- 前記複数の画像処理アルゴリズムは、2値化アルゴリズム、ノイズ低減アルゴリズム、分割アルゴリズム、文字認識アルゴリズム、ページレイアウト検出、ページレイアウト分割またはこれらの組み合わせを含む請求項1に記載のコンピューター実施される方法。
- 前記特徴ベクトルは、
前記画像セグメントのそれぞれの画像モーメント特徴を抽出する工程と、
前記特徴ベクトルを形成する工程と、を経て取得され、
前記画像モーメント特徴は、前記画像セグメントに対応した平均、分散およびスキューを含み、
前記特徴ベクトルは、HSV量子化等を用いて取得される請求項1に記載のコンピューター実施される方法。 - 前記所定のしきい画像処理出力スコアは、前記トレーニングペアのそれぞれの特徴として決定されたグランドトゥルースである請求項1に記載のコンピューター実施される方法。
- 画像処理環境内において1つ以上のアルゴリズムを自動的に選択するための画像処理システムであって、
プロセッサーと、
前記プロセッサーに接続されたメモリーと、を含み、
前記プロセッサーは、前記メモリー内に保存された複数のモジュールを実行可能であり、
前記複数のモジュールは、
少なくとも1つの画像を受信する受信モジュールと、
受信された前記画像を複数の画像セグメントに分割し、さらに、複数の画像処理アルゴリズム出力を取得するために、前記複数の画像セグメントのそれぞれに対し、複数の画像処理アルゴリズムから1つ以上の事前に保存されているアルゴリズムを実行するよう構成された画像処理モジュールと、
前記複数の画像処理アルゴリズム出力のそれぞれを、所定のしきい画像処理出力スコアと比較するよう構成された比較モジュールと、
前記画像処理アルゴリズムを、対応する1つ以上の画像セグメントおよび関連特徴ベクトルと併せて、トレーニングペアとして記録するよう構成された記録モジュールと、
送られてくる前処理済みテスト画像のそれぞれに対し、前記トレーニングペアから1つ以上の潜在的にマッチングする画像処理アルゴリズムを選択するよう構成されたマッチングモジュールと、を含むことを特徴とする画像処理システム。 - 前記画像処理モジュールは、2値化アルゴリズム、ノイズ低減アルゴリズム、分割アルゴリズム、文字認識アルゴリズム、ページレイアウト検出、ページレイアウト分割またはこれらの組み合わせから選択される1つ以上の画像処理アルゴリズムを実行することにより、受信された前記画像を処理するよう構成されている請求項7に記載の画像処理システム。
- 前記前処理済みテスト画像は、
テスト画像を受信する工程と、
受信された前記テスト画像を複数の画像セグメントに分割する工程と、
前記複数の画像セグメントから複数の特徴を抽出する工程と、を経て導出される請求項7に記載の画像処理システム。 - 前記記録モジュールは、さらに前記特徴ベクトルを取得するよう構成されており、
前記特徴ベクトルは、
前記画像セグメントのそれぞれに対し画像モーメント特徴を抽出する工程と、
前記特徴ベクトルを形成する工程と、を経て導出され、
前記画像モーメント特徴は、前記画像セグメントに対応した平均、分散およびスキューを含み、
前記特徴ベクトルは、HSV量子化等を用いて取得される請求項7に記載の画像処理システム。 - 前記比較モジュールは、前記所定のしきい画像処理出力スコアを、前記トレーニングペアのそれぞれの特徴であるグランドトゥルースとして決定する請求項7に記載の画像処理システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IN1840/MUM/2013 | 2013-05-24 | ||
IN1840MU2013 | 2013-05-24 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016093445A Division JP6099793B2 (ja) | 2013-05-24 | 2016-05-06 | 1つ以上の画像処理アルゴリズムの自動選択のための方法およびシステム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014229317A true JP2014229317A (ja) | 2014-12-08 |
Family
ID=50819570
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014106720A Pending JP2014229317A (ja) | 2013-05-24 | 2014-05-23 | 1つ以上の画像処理アルゴリズムの自動選択のための方法およびシステム |
JP2016093445A Active JP6099793B2 (ja) | 2013-05-24 | 2016-05-06 | 1つ以上の画像処理アルゴリズムの自動選択のための方法およびシステム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016093445A Active JP6099793B2 (ja) | 2013-05-24 | 2016-05-06 | 1つ以上の画像処理アルゴリズムの自動選択のための方法およびシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US9275307B2 (ja) |
EP (1) | EP2806374B1 (ja) |
JP (2) | JP2014229317A (ja) |
CN (1) | CN104182770B (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019505921A (ja) * | 2016-01-25 | 2019-02-28 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 画像データ事前処理 |
JP2020144735A (ja) * | 2019-03-08 | 2020-09-10 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
JP2021177541A (ja) * | 2020-05-04 | 2021-11-11 | アプライド マテリアルズ イスラエル リミテッド | 試料の検査のためのアルゴリズムモジュールの自動選択 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015129020A1 (ja) * | 2014-02-28 | 2015-09-03 | 株式会社 日立製作所 | データ送信方法およびデータ送信装置 |
WO2016132152A1 (en) | 2015-02-19 | 2016-08-25 | Magic Pony Technology Limited | Interpolating visual data |
WO2016156864A1 (en) | 2015-03-31 | 2016-10-06 | Magic Pony Technology Limited | Training end-to-end video processes |
GB201604672D0 (en) | 2016-03-18 | 2016-05-04 | Magic Pony Technology Ltd | Generative methods of super resolution |
WO2016208037A1 (ja) * | 2015-06-25 | 2016-12-29 | 富士通株式会社 | プログラム生成装置、プログラム生成方法および生成プログラム |
CN105354600B (zh) * | 2015-09-28 | 2018-10-23 | 南京大学 | 一种砂岩显微薄片的自动分类方法 |
CN108475425B (zh) * | 2016-01-20 | 2022-03-08 | 富士通株式会社 | 图像处理装置、图像处理方法及计算机可读取的记录介质 |
US10108883B2 (en) * | 2016-10-28 | 2018-10-23 | Intuit Inc. | Image quality assessment and improvement for performing optical character recognition |
JP6923794B2 (ja) | 2017-08-04 | 2021-08-25 | 富士通株式会社 | 検査装置、検査プログラム、及び検査方法 |
CN107729948A (zh) * | 2017-10-31 | 2018-02-23 | 京东方科技集团股份有限公司 | 图像处理方法及装置、计算机产品和存储介质 |
CN108009643B (zh) * | 2017-12-15 | 2018-10-30 | 清华大学 | 一种机器学习算法自动选择方法和系统 |
WO2020037127A1 (en) * | 2018-08-17 | 2020-02-20 | Dauntless.Io, Inc. | Systems and methods for modeling and controlling physical dynamical systems using artificial intelligence |
CN109255277B (zh) * | 2018-08-31 | 2020-04-28 | 阿里巴巴集团控股有限公司 | 一种二维码解析方法及装置 |
US11055822B2 (en) | 2019-05-03 | 2021-07-06 | International Business Machines Corporation | Artificially intelligent, machine learning-based, image enhancement, processing, improvement and feedback algorithms |
CN110309060B (zh) * | 2019-05-24 | 2021-08-17 | 平安科技(深圳)有限公司 | 识别算法更新的检测方法、装置、存储介质及计算机设备 |
JP2021012098A (ja) * | 2019-07-05 | 2021-02-04 | 株式会社イシダ | 検査装置 |
CN110866872B (zh) * | 2019-10-10 | 2022-07-29 | 北京邮电大学 | 一种路面裂缝图片预处理智能选择方法、装置及电子设备 |
WO2023200396A1 (en) * | 2022-04-13 | 2023-10-19 | Simpple Pte Ltd | System and method for facilitating cleaning area |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1063239A (ja) * | 1996-08-23 | 1998-03-06 | Matsushita Electric Ind Co Ltd | 多値画像2値化装置 |
JP2000175038A (ja) * | 1998-12-04 | 2000-06-23 | Eastman Kodak Co | 領域ベ―スのイメ―ジ2値化システム |
JP2000333023A (ja) * | 1999-05-17 | 2000-11-30 | Canon Inc | 画像データ処理方法及び装置 |
US20010043748A1 (en) * | 1997-12-19 | 2001-11-22 | Slawomir B. Wesolkowski | Method of selecting one of a plurality of binarization programs |
JP2002170116A (ja) * | 2000-12-01 | 2002-06-14 | Sharp Corp | 画像を記述する方法 |
JP2003123023A (ja) * | 2001-10-12 | 2003-04-25 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識方法及び文字認識装置、文字認識プログラム並びにそのプログラムを記録した記録媒体 |
US20040197009A1 (en) * | 2003-02-19 | 2004-10-07 | Solystic | Method of optically recognizing postal articles using a plurality of images |
EP1840799A1 (fr) * | 2006-03-28 | 2007-10-03 | Solystic | Procédé utilisant la multi-résolution des images pour la reconnaissance optique d'envois postaux |
JP2013073439A (ja) * | 2011-09-28 | 2013-04-22 | Hitachi Computer Peripherals Co Ltd | 文字認識装置及び文字認識方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02188891A (ja) * | 1989-01-17 | 1990-07-24 | Daihatsu Motor Co Ltd | 車台刻印番号認識装置における分割2値化処理方法 |
US5291563A (en) * | 1990-12-17 | 1994-03-01 | Nippon Telegraph And Telephone Corporation | Method and apparatus for detection of target object with improved robustness |
JPH08138025A (ja) * | 1994-11-04 | 1996-05-31 | Kobe Steel Ltd | 画像識別パラメータの決定方法及び画像認識方法 |
US6996549B2 (en) * | 1998-05-01 | 2006-02-07 | Health Discovery Corporation | Computer-aided image analysis |
WO2007044504A1 (en) * | 2005-10-05 | 2007-04-19 | Siemens Medical Solutions Usa, Inc. | Automatic cad algorithm selection |
US20070133851A1 (en) * | 2005-12-12 | 2007-06-14 | General Electric Company | Method and apparatus for selecting computer-assisted algorithms based on protocol and/or parameters of an acquisistion system |
US7657089B2 (en) * | 2006-02-21 | 2010-02-02 | Microsoft Corporation | Automatic classification of photographs and graphics |
JP4637054B2 (ja) * | 2006-05-15 | 2011-02-23 | キヤノン株式会社 | 画像処理装置及びその制御方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体 |
US7953265B2 (en) | 2006-11-22 | 2011-05-31 | General Electric Company | Method and system for automatic algorithm selection for segmenting lesions on pet images |
US8160347B2 (en) | 2008-06-03 | 2012-04-17 | Siemens Medical Solutions Usa, Inc. | System and method for intelligent CAD processing |
US20100014755A1 (en) * | 2008-07-21 | 2010-01-21 | Charles Lee Wilson | System and method for grid-based image segmentation and matching |
CN102165454B (zh) * | 2008-09-29 | 2015-08-05 | 皇家飞利浦电子股份有限公司 | 用于提高计算机辅助诊断对图像处理不确定性的鲁棒性的方法 |
KR101201620B1 (ko) * | 2010-01-26 | 2012-11-14 | 삼성전자주식회사 | 휴대단말기의 영상 개선장치 및 방법 |
CN102955950A (zh) * | 2011-08-16 | 2013-03-06 | 索尼公司 | 用于在线训练分类器的装置和在线训练分类器的方法 |
US8903169B1 (en) * | 2011-09-02 | 2014-12-02 | Adobe Systems Incorporated | Automatic adaptation to image processing pipeline |
US8965104B1 (en) * | 2012-02-10 | 2015-02-24 | Google Inc. | Machine vision calibration with cloud computing systems |
-
2014
- 2014-05-21 EP EP14169357.2A patent/EP2806374B1/en active Active
- 2014-05-23 JP JP2014106720A patent/JP2014229317A/ja active Pending
- 2014-05-23 CN CN201410222004.4A patent/CN104182770B/zh active Active
- 2014-05-23 US US14/286,303 patent/US9275307B2/en active Active
-
2016
- 2016-05-06 JP JP2016093445A patent/JP6099793B2/ja active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1063239A (ja) * | 1996-08-23 | 1998-03-06 | Matsushita Electric Ind Co Ltd | 多値画像2値化装置 |
US20010043748A1 (en) * | 1997-12-19 | 2001-11-22 | Slawomir B. Wesolkowski | Method of selecting one of a plurality of binarization programs |
JP2000175038A (ja) * | 1998-12-04 | 2000-06-23 | Eastman Kodak Co | 領域ベ―スのイメ―ジ2値化システム |
JP2000333023A (ja) * | 1999-05-17 | 2000-11-30 | Canon Inc | 画像データ処理方法及び装置 |
JP2002170116A (ja) * | 2000-12-01 | 2002-06-14 | Sharp Corp | 画像を記述する方法 |
JP2003123023A (ja) * | 2001-10-12 | 2003-04-25 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識方法及び文字認識装置、文字認識プログラム並びにそのプログラムを記録した記録媒体 |
US20040197009A1 (en) * | 2003-02-19 | 2004-10-07 | Solystic | Method of optically recognizing postal articles using a plurality of images |
EP1840799A1 (fr) * | 2006-03-28 | 2007-10-03 | Solystic | Procédé utilisant la multi-résolution des images pour la reconnaissance optique d'envois postaux |
JP2013073439A (ja) * | 2011-09-28 | 2013-04-22 | Hitachi Computer Peripherals Co Ltd | 文字認識装置及び文字認識方法 |
Non-Patent Citations (1)
Title |
---|
JPN6015014102; CHAMCHONG, R.: 'Optimal selection of binarization techniques for the processing of ancient palm leaf manuscripts' 2010 IEEE International Conference on Systems Man and Cybernetics [online] , 201010, pp. 3796 - 3800 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019505921A (ja) * | 2016-01-25 | 2019-02-28 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 画像データ事前処理 |
JP2020144735A (ja) * | 2019-03-08 | 2020-09-10 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
JP7215242B2 (ja) | 2019-03-08 | 2023-01-31 | 富士フイルムビジネスイノベーション株式会社 | 画像処理装置及びプログラム |
JP2021177541A (ja) * | 2020-05-04 | 2021-11-11 | アプライド マテリアルズ イスラエル リミテッド | 試料の検査のためのアルゴリズムモジュールの自動選択 |
JP7150918B2 (ja) | 2020-05-04 | 2022-10-11 | アプライド マテリアルズ イスラエル リミテッド | 試料の検査のためのアルゴリズムモジュールの自動選択 |
Also Published As
Publication number | Publication date |
---|---|
US9275307B2 (en) | 2016-03-01 |
CN104182770B (zh) | 2018-06-05 |
JP2016184412A (ja) | 2016-10-20 |
EP2806374B1 (en) | 2022-07-06 |
EP2806374A1 (en) | 2014-11-26 |
JP6099793B2 (ja) | 2017-03-22 |
CN104182770A (zh) | 2014-12-03 |
US20140348420A1 (en) | 2014-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6099793B2 (ja) | 1つ以上の画像処理アルゴリズムの自動選択のための方法およびシステム | |
CN110569721B (zh) | 识别模型训练方法、图像识别方法、装置、设备及介质 | |
CN110543815B (zh) | 人脸识别模型的训练方法、人脸识别方法、装置、设备及存储介质 | |
US11853882B2 (en) | Methods, apparatus, and storage medium for classifying graph nodes | |
US10936911B2 (en) | Logo detection | |
US11348249B2 (en) | Training method for image semantic segmentation model and server | |
US10095925B1 (en) | Recognizing text in image data | |
WO2020098250A1 (zh) | 字符识别方法、服务器及计算机可读存储介质 | |
JP5932992B2 (ja) | ロケーションを利用した認識 | |
CN110853033B (zh) | 基于帧间相似度的视频检测方法和装置 | |
US10528844B2 (en) | Method and apparatus for distance measurement | |
WO2017161756A1 (zh) | 视频鉴别方法及系统 | |
CN111079841A (zh) | 目标识别的训练方法、装置、计算机设备和存储介质 | |
EP4085369A1 (en) | Forgery detection of face image | |
US11714921B2 (en) | Image processing method with ash code on local feature vectors, image processing device and storage medium | |
US20170323149A1 (en) | Rotation invariant object detection | |
WO2020125100A1 (zh) | 一种图像检索方法、装置以及设备 | |
JP2019533867A (ja) | カーネルベースの機械学習のための構造化直交ランダム特徴 | |
CN110941989A (zh) | 图像校验、视频校验方法、装置、设备及存储介质 | |
WO2021232865A1 (zh) | 一种对象识别方法、装置、设备及介质 | |
KR20220076398A (ko) | Ar장치를 위한 객체 인식 처리 장치 및 방법 | |
WO2018121414A1 (zh) | 电子设备、目标图像识别方法及装置 | |
EP2994884A2 (en) | Method and apparatus for image matching | |
US20230222762A1 (en) | Adversarially robust visual fingerprinting and image provenance models | |
US20160358039A1 (en) | Apparatus and method for detecting object |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150320 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150414 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150708 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160105 |