JP2019504430A

JP2019504430A - 画像処理方法及びデバイス

Info

Publication number: JP2019504430A
Application number: JP2018557180A
Authority: JP
Inventors: リン，トン
Original assignee: アリババグループホウルディングリミテッド
Priority date: 2016-01-25
Filing date: 2017-01-16
Publication date: 2019-02-14
Anticipated expiration: 2037-01-16
Also published as: US10706555B2; JP6937782B2; CN106997580A; EP3410389A4; EP3410389A1; SG11201806345QA; US20200126238A1; MY192394A; KR20180105210A; US20190005651A1; CN106997580B; TWI711004B; TW201732733A; WO2017128977A1; PH12018501579A1; US10769795B2; KR102239588B1

Abstract

本願は、画像処理方法を提供する。前記方法は：複数のサンプル画像を得るために、複数の方法を用いて原画像から干渉因子を除去するステップと；所定のセグメント化規則に基づいて各サンプル画像を複数のサンプル副画像にセグメント化するステップと；同じ属性を有するサンプル副画像からターゲット副画像を特定するステップと；異なる属性を有する複数のターゲット副画像をターゲット画像に組み合わせるステップと；を含む。本願において、実像に最も類似したターゲット副画像は同じ属性を有する複数のサンプル副画像から特定でき、次いで、異なる属性を有する複数のターゲット副画像は、ターゲット画像に組み合わせることができる。このため、取得されたターゲット画像は高い精度で実像を復元して、後続の画像認識の精度を向上できる。

Description

本願は、画像処理技術の分野に関し、特に、画像処理方法及びデバイスに関する。

インターネット技術の急速な発展により、顔認識及び認証画像認識等の画像認識がより一層ネットワークサービスにおいて用いられている。しかし、多くの画像には網目模様や透かしが付されている。その結果、画像認識効率が低下し、画像認識の困難は増す。

本願の主な目的は、画像処理方法及びデバイスを提供することにある。

本願は、以下の技術的解決策によって実施される。

画像処理方法が提供される。前記方法は：複数のサンプル画像を得るために、複数の方法を用いて原画像から干渉因子を除去するステップと；所定のセグメント化規則に基づいて各サンプル画像を複数のサンプル副画像にセグメント化（分割）するステップと；同じ属性を有するサンプル副画像からターゲット副画像を特定するステップと；異なる属性を有する複数のターゲット副画像をターゲット画像に組み合わせるステップと；を含む。

好ましくは、同じ属性を有するサンプル副画像からターゲット副画像を特定する前記ステップは：各サンプル副画像の数学的パラメータを特定するステップと；クラスタリングアルゴリズムを用いて、前記数学的パラメータに基づいて同じ属性を有する前記サンプル副画像を、複数の画像セットに分割するステップであって、各画像セットは１つ以上のサンプル副画像を含む、分割するステップと；サンプル副画像の最大数を含む画像セットから前記ターゲット副画像を特定するステップと；を含む。

好ましくは、各サンプル副画像の数学的パラメータを特定する前記ステップは：前記サンプル副画像の前記数学的パラメータとしてＲＧＢベクトルを用い、前記サンプル副画像内の各ピクセルのＲＧＢ情報に基づいて前記サンプル副画像のための前記ＲＧＢベクトルを生成するステップを含む。

好ましくは、サンプル副画像の最大数を含む画像セットから前記ターゲット副画像を特定する前記ステップは：サンプル副画像の最大数を含む前記画像セットからの前記ターゲット副画像として、クラスタリング後に取得された前記画像セット内の、中心点に対応するサンプル副画像を特定するステップを含む。

好ましくは、異なる属性を有する複数のターゲット副画像をターゲット画像に組み合わせるステップは：前記ターゲット副画像内の各ピクセルの位置座標に基づいて、異なる属性を有する前記複数のターゲット副画像を前記ターゲット画像に組み合わせるステップを含む。

画像処理デバイスが提供され、前記デバイスは：複数のサンプル画像を取得するために、複数の方法を用いて原画像から干渉因子を除去するように構成された干渉除去ユニットと；所定のセグメント化規則に基づいて各サンプル画像を複数のサンプル副画像にセグメント化するように構成された画像セグメント化ユニットと；同じ属性を有するサンプル副画像からターゲット副画像を特定するように構成されたターゲット特定ユニットと；異なる属性を有する複数のターゲット副画像をターゲット画像に組み合わせるように構成されたターゲット組み合わせユニットと；を含む。

好ましくは、前記ターゲット特定ユニットは：各サンプル副画像の数学的パラメータを特定するように構成されたパラメータ特定サブユニットと；クラスタリングアルゴリズムを用いて、前記数学的パラメータに基づいて同じ属性を有する前記サンプル副画像を複数の画像セットに分割するように構成され、各画像セットが１つ以上のサンプル副画像を含む、セット分割サブユニットと；サンプル副画像の最大数を含む画像セットから前記ターゲット副画像を特定するように構成されたターゲット特定サブユニットと；を含む。

好ましくは、前記パラメータ特定サブユニットは、前記サンプル副画像の前記数学的パラメータとしてＲＧＢベクトルを用い、前記サンプル副画像内の各ピクセルのＲＧＢ情報に基づいて前記サンプル副画像のための前記ＲＧＢベクトルを生成するよう構成される。

好ましくは、前記ターゲット特定サブユニットは、サンプル副画像の最大数を含む前記画像セットからの前記ターゲット副画像として、クラスタリング後に取得された前記画像セット内の、中心点に対応するサンプル副画像を特定するように構成される。

好ましくは、前記ターゲット組み合わせユニットは、前記ターゲット副画像内の各ピクセルの位置座標に基づいて、異なる属性を有する前記複数のターゲット副画像を前記ターゲット画像に組み合わせるように構成される。

本願において、原画像内の干渉因子は、複数の方法を用いて最初に除去され、複数のサンプル画像が得られることが分かる。次に、複数のサンプル画像のそれぞれは、所定のセグメント化規則に基づいて複数のサンプル副画像にセグメント化することができる。次に、ターゲット副画像は、同じ属性を有するサンプル副画像から特定できるので、実像に最も類似するターゲット副画像を、同じ属性を有する複数のサンプル副画像から特定できる。次に、異なる属性を有する複数のターゲット副画像を、ターゲット画像に組み合わせることができる。このため、得られたターゲット画像は高い精度で実像を復元し、後続の画像認識の精度を向上できる。

図１は、本願の実施の例による画像処理方法を示す概略フロー図である。

図２は、本願の実施の例によるサンプル画像のセグメント化を示す概略図である。

図３は、本願の実施の例による、同じ属性を有するサンプル副画像からターゲット副画像を特定するための手順を示す概略図である。

図４は、本願の実施の例による画像処理デバイスを示す概略構造図である。

図５は、本願の実施の例による画像処理デバイスを示す概略構造図である。

実施の例はここで詳細に説明され、実施の例は添付の図面に示されている。以下の説明が添付の図面を参照するとき、他に指定されない限り、異なる添付の図面における同じ番号は、同一又は類似の要素を表す。以下の実施の例で説明される実施は、本願と一致する全ての実施を表すものではない。それどころか、それらは、添付の特許請求の範囲に詳細に記載され、本願のいくつかの態様と一致するデバイス及び方法の例にすぎない。

本願で使用される用語は、単に実施を説明するために使用されており、本願を限定するものではない。本願及び添付の特許請求の範囲で使用される単数形の「１つの（a）」、「前記（said）」及び「前記（the）」という用語は、文脈で別段の指定がない限り、複数形も含むことが意図される。また、ここで使用される「及び／又は」という用語は、１つ又は複数の関連するアイテムの任意の又は全ての可能な組み合わせを示し、含むことを理解されたい。

「第１」、「第２」、「第３」などの用語は、様々なタイプの情報を説明するために本願で使用することができるが、情報は用語によって限定されないことを理解されたい。これらの用語は、単に同じタイプの情報を区別するために使用される。例えば、本願の範囲から逸脱することなく、第１の情報を第２の情報と呼び、同様に第２の情報を第１の情報と呼んでもよい。文脈に応じて、例えば、ここで使用される「もし（if）」という単語は、「〜の間（while）」、「〜とき（when）」、又は「特定に応答して（in response to determining）」と説明することができる。

関連技術においては、フォトショップ（登録商標）等、何らかの画像処理アルゴリズム又は画像処理ツールを用いて原画像内の網目模様又は透かしを除去できる。しかし、このような場合、網目模様又は透かしを除去して得られる像は、原画像の実像を復元できないのが普通である。その結果、画像認識精度は悪影響を受けるだろう。

図１を参照すると、この画像処理方法は端末デバイスに適用できる。端末デバイスとして、スマートフォン、タブレットコンピュータ、携帯情報端末（ＰＤＡ）、及びＰＣ等のインテリジェントデバイスを挙げることができる。この画像処理方法は、サーバにも適用でき、本願において限定されない。この画像処理方法は以下のステップを含むことができる。

ステップ１０１：複数のサンプル画像を取得するために、複数の方法を用いて原画像から干渉因子を除去する。

本実施において、原画像は、通常、認識対象画像である。原画像は１つ以上の干渉因子を含むことができる。干渉因子は、通常、実像に加えられる網目模様や透かし等の干渉パタ−ンである。

本実施において、複数のサンプル画像を取得するために、関連技術で提供される異なる干渉因子除去方法を用いて原画像内の干渉因子を除去できる。例えば、原画像内の干渉因子は、フォトショップ（登録商標）等の画像処理ソフトウェアを用いて除去できる。

ステップ１０２：所定のセグメント化規則に基づいて各サンプル画像を複数のサンプル副画像にセグメント化する。

ステップ１０１に基づいて複数のサンプル画像が得られた後、各サンプル画像は所定のセグメント化規則に基づいて複数の副画像にセグメント化することができる。説明を簡単にするために、セグメント化後に得られる副画像を、サンプル副画像と称する。

本実施において、所定のセグメント化規則は開発者によって設定できる。所定のセグメント化規則において、セグメント化で用いられる単位は、サンプル副画像のサイズであってもサンプル副画像の数であってもよく、本願では限定しない。例えば、所定のセグメント化規則により、サンプル画像を２５個のサンプル副画像にセグメント化、例を挙げるなら、５×５規則に基づいてサンプル画像を２５個のサンプル副画像にセグメント化、であってもよい。

本実施において、原画像内の干渉因子がステップ１０１におけるＮ個の異なる方法を用いて除去された場合に、Ｎ個のサンプル画像が取得できる。更に、各サンプル画像がＭ個のサンプル副画像にセグメント化された場合に、合計Ｎ×Ｍ個のサンプル副画像を取得できる。Ｍ及びＮは１よりも大きい自然数である。

ステップ１０３：同じ属性を有するサンプル副画像からターゲット副画像を特定する。

本実施において、各サンプル副画像は対応する属性を有する。この属性を用いて、サンプル副画像を含むサンプル画像内のサンプル副画像の位置情報を示すことができる。図２を参照すると、画像Ａは、原画像内の干渉を除去することによって得られたサンプル画像であると仮定する。サンプル画像は、所定のセグメント化規則に基づいて３×３個のサンプル副画像にセグメント化することができる。９個のサンプル副画像の属性は、それぞれ、Ａ１１、Ａ１２、Ａ１３、Ａ２１、・・・、及びＡ３３である。

本実施において、図２に示すセグメント化規則を一例として用いる。Ｎ個のサンプル画像を得るために、原画像内の干渉因子がＮ個の異なる方法を用いて除去された場合に、合計Ｎ×９個のサンプル副画像を取得できる。Ａ１１乃至Ａ３３のうちの１つの属性を有するサンプル副画像がＮ個存在する。このステップにおいて、属性Ａ１１を有するターゲット副画像は、属性Ａ１１を有するＮ個のサンプル副画像から特定でき、属性Ａ１２を有するターゲット副画像は属性Ａ１２を有するＮ個のサンプル副画像から特定でき、属性Ａ１１乃至Ａ３３を有する９個のターゲット副画像は同様に特定できる。

ステップ１０４：異なる属性を有する複数のターゲット副画像をターゲット画像に組み合わせる。

ステップ１０３に基づいて、ターゲット副画像が、同じ属性を有するサンプル副画像から特定された場合、異なる属性を有する複数のターゲット副画像はターゲット画像に組み合わせることができる。例えば、複数のターゲット副画像は各ターゲット副画像の属性に基づいてターゲット画像に組み合わせることができる、又は、複数のターゲット副画像は各ターゲット副画像内の各ピクセルの位置座標に基づいてターゲット画像に組み合わせることができ、本願においては限定しない。

例えば、図２に示すセグメント化規則は一例として用いられる。本ステップにおいて、属性Ａ１１乃至Ａ３３を有する９個のターゲット副画像を１つのターゲット画像に組み合わせることができる。

先の説明から分かることは、原画像内の干渉因子は複数の方法を用いることによって最初に除去されて複数のサンプル画像を取得できるという点である。次に、複数のサンプル画像のそれぞれは、所定のセグメント化規則に基づいて複数のサンプル副画像にセグメント化することができる。次に、ターゲット副画像は、同じ属性を有するサンプル副画像から特定でき、その結果、実像に最も類似するターゲット副画像を、同じ属性を有する複数のサンプル副画像から特定できる。次に、異なる属性を有する複数のターゲット副画像を、ターゲット画像に組み合わせることができる。このため、取得されたターゲット画像は高い精度で実像を復元して、後続の画像認識の精度を向上させる。

任意ではあるが、本願の実施例において、図３を参照すると、同じ属性を有するサンプル副画像からターゲット副画像を特定する工程は、以下のステップを含むことができる。

ステップ３０１：各サンプル副画像の数学的パラメータを特定する。

本実施において、サンプル画像が複数のサンプル副画像にセグメント化された後、各サンプル副画像の数学的パラメータを、後続の計算のために特定できる。

任意ではあるが、本願の実施例において、サンプル副画像の数学的パラメータとしてＲＧＢベクトルを用い、サンプル副画像内の各ピクセルのＲＧＢ情報に基づいてサンプル副画像のためのＲＧＢベクトルを生成できる。例えば、最初に、サンプル副画像内の各ピクセルのＲＧＢ値等のＲＧＢ情報を取得できる。次に、ＲＧＢベクトルを各ピクセルのＲＧＢ情報に基づいて生成できる。サンプル副画像のＲＧＢベクトルは、サンプル副画像がＫ個のピクセルを含む場合、｛Ｒ_１，Ｒ_２，・・・，Ｒ_ｋ｝であってもよく、ここでｉ番目のピクセルのＲＧＢ値はＲ_ｉであり、ｉの値は１乃至Ｋである。

ステップ３０２：クラスタリングアルゴリズムを用いることによって、数学的パラメータに基づいて同じ属性を有するサンプル副画像を複数の画像セットに分割するが、ここで各画像セットは１つ以上のサンプル副画像を含む。

本実施において、同じ属性を有する複数のサンプル副画像を、クラスタリングアルゴリズムを用い、サンプル副画像の数学的パラメータに基づいて複数の画像セットに分割できる。クラスタリングアルゴリズムとして、ＤＢＳＣＡＮ（Density-Based Spatial Clustering of Applications with Noise）クラスタリングアルゴリズム、Ｋ平均法クラスタリングアルゴリズム等を挙げることができ、本願において限定しない。

例えば、ＤＢＳＣＡＮクラスタリングアルゴリズムが用いられている場合、走査半径（ｅｐｓ）と点の最小数（ｍｉｎＰｔｓ）は、予め特定できる。各サンプル副画像はクラスタリング工程における１点に対応する。点の最小数は、分割後に得られる画像セットに含まれ得るサンプル副画像の最小数である。クラスタリング工程において、関連する計算は、サンプル副画像の数学的パラメータに基づいて行うことができる。例えば、２つのサンプル副画像のＲＧＢベクトル間の距離は２つのサンプル副画像間の距離として用いることができる。

ステップ３０３：サンプル副画像の最大数を含む画像セットからターゲット副画像を特定する。

ステップ３０２に基づいて、同じ属性を有するサンプル副画像が複数の画像セットに分割された後、各画像セットに含まれるサンプル副画像の数が特定され、次に、ターゲット副画像が、サンプル副画像の最大数を含む画像セットから特定されることができる。

任意ではあるが、本願の実施例において、クラスタリング後に取得された画像セット内の、中心点に対応するサンプル副画像は、サンプル副画像の最大数を含む画像セットからターゲット副画像として特定できる。

本実施において、クラスタリングアルゴリズムは同じ属性を有するサンプル副画像からターゲット副画像を特定するために用いられて、特定されたターゲット副画像が実像に、より類似することを確保できる。

画像処理方法の実施に対応して、本願は、更に、画像処理デバイスの実施を提供する。

本願における画像処理デバイスの実施は端末デバイス又はサーバに適用できる。このデバイスの実施は、ソフトウェア、ハードウェア、又はその両方を用いて実施できる。ソフトウェアによる実施を実施例として用いる。論理装置として、本デバイスは、不揮発性メモリ内の対応するコンピュータプログラム命令を、本デバイスが配置される端末デバイス又はサーバのプロセッサによってメモリ内に読み取ることによって、形成される。図４に示すようなハードウェアの見地からすると、図４は、本願における画像処理デバイスが配置される端末デバイス又はサーバのハードウェアを示す構造図である。図４に示すプロセッサ、メモリ、ネットワークインターフェース、及び不揮発性メモリに加えて、本実施におけるデバイスが配置される端末デバイス又はサーバは、通常、端末デバイス又はサーバの実際の機能に基づく他のハードウェアを含むことができる。詳細はここでは繰り返さない。

図５を参照すると、画像処理デバイス４００は、図４に示す端末デバイス又はサーバに適用でき、干渉除去ユニット４０１、画像セグメント化ユニット４０２、ターゲット特定ユニット４０３、及びターゲット組み合わせユニット４０４を含む。ターゲット特定ユニット４０３は、更に、パラメータ特定サブユニット４０３１、セット分割サブユニット４０３２、及びターゲット特定サブユニット４０３３を含むことができる。

干渉除去ユニット４０１は、複数のサンプル画像を取得するために、複数の方法を用いて原画像から干渉因子を除去するように構成される。

画像セグメント化ユニット４０２は、所定のセグメント化規則に基づいて各サンプル画像を複数のサンプル副画像にセグメント化するように構成される。

ターゲット特定ユニット４０３は、同じ属性を有するサンプル副画像からターゲット副画像を特定するように構成される。

ターゲット組み合わせユニット４０４は、異なる属性を有する複数のターゲット副画像をターゲット画像に組み合わせるように構成される。

パラメータ特定サブユニット４０３１は、各サンプル副画像の数学的パラメータを特定するよう構成される。

セット分割サブユニット４０３２は、クラスタリングアルゴリズムを用いて、数学的パラメータに基づいて同じ属性を有するサンプル副画像を複数の画像セットに分割するように構成される。各画像セットは１つ以上のサンプル副画像を含む。

ターゲット特定サブユニット４０３３は、サンプル副画像の最大数を含む画像セットからターゲット副画像を特定するように構成される。

任意ではあるが、パラメータ特定サブユニット４０３１は、サンプル副画像の数学的パラメータとしてＲＧＢベクトルを用い、サンプル副画像内の各ピクセルのＲＧＢ情報に基づいてサンプル副画像のためのＲＧＢベクトルを生成するように構成される。

任意ではあるが、ターゲット特定サブユニット４０３３は、サンプル副画像の最大数を含む画像セットからのターゲット副画像として、クラスタリング後に取得された画像セット内の、中心点に対応するサンプル副画像を特定するように構成される。

任意ではあるが、ターゲット組み合わせユニット４０４は、ターゲット副画像内の各ピクセルの位置座標に基づいて、異なる属性を有する複数のターゲット副画像をターゲット画像に組み合わせるように構成される。

デバイス内のユニットの機能及び役割の実施工程については、対応するステップの実施工程を参照できる。詳細はここでは説明しない。

デバイスの実施は、概して、方法の実施に対応している。このため、関連する説明のために、方法の実施の説明を参照できる。説明したデバイスの実施は単なる実施例である。別部品として説明したユニットは物理的に分離していてもいなくてもよく、また、ユニットとして説明した部品は物理的なユニットであってもなくてもよい。それらは一箇所に位置していてもよく、複数のネットワークユニット上に分散していてもよい。モジュールのうちの一部又は全ては、本願の解決策の目的を達成するために、実際のニーズに従って選択できる。当業者は、創意工夫をすることなく、本発明の実施を理解し、実施できる。

前述の説明は、本願の実施の単なる例である。それらは、本願を限定するものではない。本願の精神及び原理から逸脱することなくなされた任意の修正、均等物の置換、又は改良は、本願の保護範囲内に入るものとする。

Claims

複数のサンプル画像を得るために、複数の方法を用いて原画像から干渉因子を除去するステップと；
所定のセグメント化規則に基づいて各サンプル画像を複数のサンプル副画像にセグメント化するステップと；
同じ属性を有するサンプル副画像からターゲット副画像を特定するステップと；
異なる属性を有する複数のターゲット副画像をターゲット画像に組み合わせるステップと；を備える、
画像処理方法。
同じ属性を有するサンプル副画像からターゲット副画像を特定する前記ステップは：
各サンプル副画像の数学的パラメータを特定するステップと；
クラスタリングアルゴリズムを用いて、前記数学的パラメータに基づいて同じ属性を有する前記サンプル副画像を、複数の画像セットに分割するステップであって、各画像セットは１つ以上のサンプル副画像を含む、分割するステップと；
サンプル副画像の最大数を含む画像セットから前記ターゲット副画像を特定するステップと；を備える、
請求項１に記載の方法。
各サンプル副画像の数学的パラメータを特定する前記ステップは：
前記サンプル副画像の前記数学的パラメータとしてＲＧＢベクトルを用い、前記サンプル副画像内の各ピクセルのＲＧＢ情報に基づいて前記サンプル副画像のための前記ＲＧＢベクトルを生成するステップを備える、
請求項２に記載の方法。
サンプル副画像の最大数を含む画像セットから前記ターゲット副画像を特定する前記ステップは：
サンプル副画像の最大数を含む前記画像セットからの前記ターゲット副画像として、クラスタリング後に取得された前記画像セット内の、中心点に対応するサンプル副画像を特定するステップを備える、
請求項２に記載の方法。
異なる属性を有する複数のターゲット副画像をターゲット画像に組み合わせる前記ステップは：
前記ターゲット副画像内の各ピクセルの位置座標に基づいて、異なる属性を有する前記複数のターゲット副画像を前記ターゲット画像に組み合わせるステップを備える、
請求項１に記載の方法。
複数のサンプル画像を取得するために、複数の方法を用いて原画像から干渉因子を除去するように構成された干渉除去ユニットと；
所定のセグメント化規則に基づいて各サンプル画像を複数のサンプル副画像にセグメント化するように構成された画像セグメント化ユニットと；
同じ属性を有するサンプル副画像からターゲット副画像を特定するように構成されたターゲット特定ユニットと；
異なる属性を有する複数のターゲット副画像をターゲット画像に組み合わせるように構成されたターゲット組み合わせユニットと；を備える、
画像処理デバイス。
前記ターゲット特定ユニットは：
各サンプル副画像の数学的パラメータを特定するように構成されたパラメータ特定サブユニットと；
クラスタリングアルゴリズムを用いて、前記数学的パラメータに基づいて同じ属性を有する前記サンプル副画像を複数の画像セットに分割するように構成され、各画像セットが１つ以上のサンプル副画像を備える、セット分割サブユニットと；
サンプル副画像の最大数を備える画像セットから前記ターゲット副画像を特定するように構成されたターゲット特定サブユニットと；を備える、
請求項６に記載のデバイス。
前記パラメータ特定サブユニットは、前記サンプル副画像の前記数学的パラメータとしてＲＧＢベクトルを用い、前記サンプル副画像内の各ピクセルのＲＧＢ情報に基づいて前記サンプル副画像のための前記ＲＧＢベクトルを生成するよう構成された、
請求項７に記載のデバイス。
前記ターゲット特定サブユニットは、サンプル副画像の最大数を含む前記画像セットからの前記ターゲット副画像として、クラスタリング後に取得された前記画像セット内の、中心点に対応するサンプル副画像を特定するように構成される、
請求項７に記載のデバイス。
前記ターゲット組み合わせユニットは、前記ターゲット副画像内の各ピクセルの位置座標に基づいて、異なる属性を有する前記複数のターゲット副画像を前記ターゲット画像に組み合わせるように構成された、
請求項６に記載のデバイス。