JP2023538857A - 画像トレーニングデータにおけるテキストコンテンツの匿名化 - Google Patents
画像トレーニングデータにおけるテキストコンテンツの匿名化 Download PDFInfo
- Publication number
- JP2023538857A JP2023538857A JP2023509740A JP2023509740A JP2023538857A JP 2023538857 A JP2023538857 A JP 2023538857A JP 2023509740 A JP2023509740 A JP 2023509740A JP 2023509740 A JP2023509740 A JP 2023509740A JP 2023538857 A JP2023538857 A JP 2023538857A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- computer
- implemented method
- loaded image
- alphanumeric characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title description 14
- 238000000034 method Methods 0.000 claims abstract description 80
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000004590 computer program Methods 0.000 claims abstract description 4
- 230000001815 facial effect Effects 0.000 claims description 13
- 238000001514 detection method Methods 0.000 description 35
- 230000004044 response Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 3
- 210000000887 face Anatomy 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000001066 destructive effect Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000916 dilatatory effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 210000001061 forehead Anatomy 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioethics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
Abstract
未修正の画像データをロードし、ロードされた画像データによって表される画像内の少なくとも2つの英数字文字を検出し(24)、検出された英数字文字のうちの1つ以上を選択し(32)、選択された英数字文字の数が検出された英数字文字の総数よりも小さく、ロードされた画像データの1つ以上の文字部分を除去することによってロードされた画像データを修正し(33)、各文字部分は、選択された英数字文字の領域に対応し、修正画像データを保存する、画像データを修正するためのコンピュータ実施方法、対応するデータ処理システム、コンピュータプログラム製品およびコンピュータ可読記憶媒体。
Description
本発明は画像データを修正するためのコンピュータ実施方法に関し、より詳細には、本発明が画像データから機密個人情報を除去するためのコンピュータ実施方法に関する。詳細には、本発明は所与の画像データから、理想的には分散可能なトレーニング画像データを生成するためのコンピュータ実施方法に関する。所与の画像データは、機密個人情報を含むことができる。そのようなトレーニング画像データは、コンテンツ認識のためのシステムを改善するために使用することができる。本発明はまた、対応するデータ処理システム、対応するコンピュータプログラム製品、および対応するコンピュータ可読記憶媒体に関する。
特許文献1は、医用画像内の画像データを分析するための方法およびシステムを開示している。この方法の目的は、顔の骨格または頭部の医用画像における顔の特徴または顔の認識を防止することである。この方法は眼、鼻、唇、額線、顎線および耳の特徴を含む機密領域の匿名化に基づいており、これらの領域は自動的に認識される。匿名化は不可逆的に、ノイズによって、または可逆的に、幾何学的変換によって達成される。この方法は、機密性の高いテキストの個人情報を扱わない。加えて、このタイプの匿名化は、画像データをトレーニングに役立たなくする。
特許文献2は、画像コンテンツを匿名化するための装置および方法を開示している。この方法は、処理されていない状態および/または特徴を維持することを明確に求める。匿名化は、画像の特徴または部分を、機械によって生成される一般的であるが現実的に見える画像部分に置き換えることによって達成される。この方法は、テキストの特徴に特に適合されておらず、テキストを含む画像データにこの方法を適用する実行可能な開示はない。さらに、必要とされる機械生成された置換画像部分は、生成が事前のトレーニングを必要とするので、この方法を、トレーニングデータを生成するのに不適切にする。加えて、機械によって生成された一般的な画像部分は、トレーニングの有効性を低下させる。この刊行物は背景技術の部分においてのみ、ぼかしによる匿名化車両登録プレートの従来技術に言及している。これにより、関連する画像部分全体がトレーニングに役立たなくなる。具体的には、それはテキストコンテンツを除去するだけでなく、画像データ内の構造情報(例えば、文書レイアウトに関する)も破壊する。
特許文献3は、コンピュータ可読文書の処理のみに関する。前記コンピュータ可読文書は、以前に登録された機密情報について検索され、その後、認識不能にされる。これは、情報のカテゴリベースの選択を行うことを明示的に意図するものではない。いずれにしても、この刊行物は、画像データにおける文字認識に関心を持たず、または文字認識にも言及していない。
特許文献4は、文字データを匿名化するための1つの可能性として「文字シャッフリング」を開示している。しかしながら、画像データにおけるこれらの文字の先行認識とは関係なく、その結果、文字を表す画像データにはシャッフリングは適用されない。
特許文献5は顔画像へのいかなる接続もなしに、画像データを不明瞭にするための一般的な方法として、ぼかしの可能性を言及している。また、この刊行物は、画像データにおける文字認識と、認識された文字が機密の個人情報を含む可能性との接続を開示または取り扱っていない。
本発明の目的は、例えば、光学文字認識のためのシステムの効果的なトレーニングのために、画像データを依然として使用することができる一方で、含まれている情報から個人をトレースバックすることがより困難または不可能であるように、機密が書かれた(またはテキストの)個人情報を含むトレーニング画像を変換することである。
本発明は画像データを修正するためのコンピュータ実施方法を提案し、この方法は、
未修正の画像データをロードし、
ロードされた前記画像データによって表される画像内の少なくとも2つの英数字文字を検出し、
検出された英数字文字のうちの1つ以上を選択し、
選択される英数字文字の数は検出された英数字文字の総数よりも小さく、
ロードされた前記画像データの1つ以上の文字部分を除去することによって、ロードされた前記画像データを修正し、
各文字部分は、選択された英数字文字の領域に対応し、
修正された前記画像データを保存する。
未修正の画像データをロードし、
ロードされた前記画像データによって表される画像内の少なくとも2つの英数字文字を検出し、
検出された英数字文字のうちの1つ以上を選択し、
選択される英数字文字の数は検出された英数字文字の総数よりも小さく、
ロードされた前記画像データの1つ以上の文字部分を除去することによって、ロードされた前記画像データを修正し、
各文字部分は、選択された英数字文字の領域に対応し、
修正された前記画像データを保存する。
本発明は、機密が書かれた個人情報の個々の文字がそれ自体、そのような機密情報を表すものではなく、それにもかかわらず、光学文字認識のためのシステムをトレーニングするのに有用であるという認識に基づいている。代わりに、任意の情報を「個人的」に、したがって潜在的に機密にすることに責任を負うコンテキスト(具体的には、先行および/または後続の文字)である。単一の文字の情報内容は、少数の個人グループを除いてトレーサビリティを回避するのに十分に小さい。したがって、機密個人情報を見直すことなく、この情報内容をそのまま残すことができる。開示された方法は、検出された英数字文字の総数よりも少ない数を選択することによって、画像データ内の少なくとも1つの個々の文字を変更しないままにすることを目的とする。結果として、修正された画像データは未修正画像データに適用されるときに、その性能を改善する(すなわち、その認識力を改善または拡張する)ために光学文字認識のためのシステムを効果的にトレーニングするために使用され得、一方、未修正の画像データ自体は、トレーニングを実行するために明らかにされる必要はない。本方法によって提供される修正画像データは機械学習に基づくシステム、特に、深層学習に基づくシステムなどのニューラルネットワークを含むシステムによって容易に使用することができるが、本方法は光学文字認識の任意の特定の実装にかかわらず有用である。例えば、それはまた、エキスパートシステムまたは他のタイプのシステムにフィードバックを提供するために使用され得る。
任意選択で、選択される英数字文字の数は、検出されたすべての英数字文字の10%より多く、詳細には、30%より多く、さらに詳細には、50%より多い。任意選択で、選択される英数字文字の数は、検出されたすべての英数字文字の90%より少なく、詳細には、70%より少なく、さらに詳細には、60%より少ない。例えば、選択された英数字文字の数は、検出された全ての英数字文字の約半分の数であってもよい。
開示される方法は、ロードされた画像データによって表される画像内の2つ以上の英数字文字を含む少なくとも1つの単語を検出し、検出された各単語の検出された英数字文字のうちの1つ以上を選択する、ことを含むことができる。単語を個別に処理し、それぞれから1つ以上の文字を選択することにより、どの単語も偶然にその元の内容を維持しないことが保証される。
このコンテキストにおいて、選択された文字の単語当たりの比率は、各単語の検出された英数字文字の10%より多く、詳細には30%より多く、さらに詳細には50%より多く、および/または90%より少なく、詳細には70%より少なく、さらに詳細には60%より少ない、から任意に選択することによって実施され得る。例えば、開示される方法は、各単語の検出された英数字文字の約半分の数を選択することを含んでもよい。
例えば、画像データによって表される文書のレイアウトを含む、画像データの元の構造のより多くを維持するために、開示される方法は、ロードされた画像データの除去された文字部分のうちの少なくとも1つを、選択されていない英数字文字の領域に対応するロードされた画像データの文字部分と置き換えることによって、ロードされた画像データを修正することを含み得る。このようにして、未修正画像データが書き込まれた部分によって伝達される情報コンテンツは、依然として大幅に破壊される。同時に、修正された画像データは、書き込まれた情報の位置及び分布のような一般的な構造情報を維持する。置換部分は同じ未修正画像データに由来するので、カラー、照明、およびコントラストなどの一般的なイメージング特性は修正画像データ全体にわたって正確に反映される。置換の間、置換部分の寸法は、置換される部分の寸法に調整されてもよい。
開示される方法の別の実施形態によれば、少なくとも1つの単語に属するロードされた画像データの除去された文字部分のうちの少なくとも1つを、除去された文字部分と同じ単語に属する選択されていない英数字文字の領域に対応するロードされた画像データの文字部分に置き換えることによって、ロードされた画像データを修正することを含み得る。このようにして、置換部分は、同じ未修正画像データからだけでなく、同じ単語からも生じることが保証される。これにより、一般的なイメージング特性の正確な再現がさらに改善され、また、置換部分と置換部分との間の同じ単語内で一致する可能性がさらに高い、特定のフォントおよび文字のサイズも改善される。
任意選択で、開示された方法はロードされた画像データの1つ以上の文字部分をシャッフルすることによってロードされた画像データを修正することを含むことができ、各文字部分は、選択されていない英数字文字の領域に対応する。この場合、維持された文字の位置によって伝達される情報も本質的に破壊される。これは、任意の機密情報が修正された画像データから再構成され得る可能性をさらに低下させる。これは、希少な個々の文字が検出され、文字の総数が比較的少ない場合に特に有用である。そのような場合、希少な個々の文字の存在および位置は完全な単語(例えば、名前)を識別するのに十分な情報を伝えることができる。したがって、本開示の範囲内で、上述のシャッフリングステップは特定のタイプの文字の検出時にオンデマンドで実行することができ、任意選択で、検出された文字の総数の下限と組み合わせることができ、その下でシャッフリングがトリガされる。
本方法の任意の実施形態によれば、少なくとも1つの単語に属する英数字文字に対応する文字部分のシャッフリングは、同じ単語内のシャッフリングに限定され得る。
本方法は任意選択で、ロードされた画像データによって表される画像内の少なくとも1つの顔を検出し、ロードされた画像データの1つ以上のポートレート部分を除去することによってロードされた画像データを修正し、各ポートレート部分は検出された顔の領域に対応し、好ましくは少なくとも1つの除去されたポートレート部分を、同じポートレート部分のぼかしたバージョンと置き換えることをさらに含み得る。この例は、書かれた情報および顔情報を含む画像データへの適用に特に有用である。そのような画像データの典型的な例は、パスポートまたはIDなどの本人確認書類の画像である。この場合、および同様に、以下に記載される他の場合には、ぼかしパラメータは、関連する部分を不可逆的に、すなわち、回復不可能な状態に変換するように選択される。
このコンテキストでは本方法が少なくとも1つの検出された顔をテンプレートとして使用して、ロードされた画像データによって表される画像内の少なくとも1つの追加の顔を検出し、ロードされた画像データの1つ以上の追加のポートレート部分を除去することによってロードされた画像データを修正することをさらに含むことができ、各追加のポートレート部分は検出された追加の顔の領域に対応し、好ましくは少なくとも1つの追加のポートレート部分を、同じ追加のポートレート部分のぼかしたバージョンと置き換える。追加の顔は例えば、顔のホログラフィックバージョン、例えば識別可能なホログラフィック顔であってもよい。テンプレートとして少なくとも1つの検出された顔を使用することにより、例えば、バージョンの本質的な特徴が欠落しているか、またはバージョンの画像カラーおよび/またはコントラストが著しく低下している場合であっても、未修正画像データにおいて同じ顔の(部分的に表された)バージョンをより確実に検出することが可能になる。
本方法は任意選択的に、ロードされた画像データによって表される画像内の少なくとも1つの書き込み署名を検出し、ロードされた画像データの1つ以上の署名部分を除去することによってロードされた画像データを修正することを含む。各署名部分は検出された書き込み署名の領域に対応し、好ましくは少なくとも1つの除去された署名部分を、同じ署名部分のぼかされたバージョンと置き換える。この例は、署名情報だけでなく、書き込まれた情報を含む画像データへの適用に特に有用である。そのような画像データの典型的な例は、完成したフォームまたは契約などの法的文書の画像である。
本方法は任意選択で、ロードされた画像データによって表される画像内の少なくとも1つの機械可読コードを検出し、ロードされた画像データの1つ以上のコード部分を除去することによってロードされた画像データを修正し、各コード部分が検出された機械可読コードの領域に対応し、好ましくは少なくとも1つの除去されたコード部分を、同じコード部分のぼかされたバージョンと置き換えることをさらに含み得る。この例は、機械可読コードと同様に、書き込まれた情報を含む画像データへの適用に特に有用である。そのような画像データの典型的な例は、送信者および/または受信者の潜在的に機密の個人情報を含む住所ラベルなどの、人間および機械が使用するためのラベルの画像である。
上記の目的を解決するために、本発明は、上記に開示された変形例のうちの1つ以上に従った手段を含むデータ処理システムも提案する。
冒頭で述べた目的を解決するために、本発明はまた、プログラムがコンピュータによって実行されるときに、コンピュータに、上記で開示された変形例のうちの1つ以上による方法を実行させる命令を含むコンピュータプログラム製品を提案する。
最後に、冒頭で述べた目的を解決するために、本発明はコンピュータによって実行されると、コンピュータに、上記で開示した変形例のうちの1つ以上による方法を実行させる命令を含むコンピュータ可読記憶媒体も提案する。
図面を参照するが、図面は本開示を例示するためのものであり、本開示を限定するためのものではない。
図1Aは、個人ID文書の未修正画像1を示す。個人ID文書は文書タイプの表示2と、文書シリアル番号3と、名前4と、ポートレート5(すなわち、人の顔の画像、例えば写真)と、署名6と、文書によって識別される人の生年月日7とを含む。文書タイプを除き、この情報はすべて、機密性の高い個人情報である。したがって、画像1を表す画像データを自由に共有または配信することはできない。
ドキュメントの内容に加えて、図1Aはまた、どの英数字文字が検出され、機密個人情報に関連するかを示す。各英数字文字は、画像の対応する文字部分8、9を含む。文字部分8、9には2つのタイプがあり、選択された文字部分8は破線のボックスとして示され、選択されていない文字部分9は実線のボックスとして示される。
図1Bは、以下に詳細に記載される方法に従った改変後の図1Aと同じ個人ID文書の修正画像10を示す。文書タイプの表示2は変更されないままである。文書シリアル番号3、名前4、および生年月日7を含む書き込み情報は、文書シリアル番号11、名前12、および生年月日13の匿名化されたバージョンに置き換えられる。詳細には、選択された文字部分8(図1Aの破線のボックス)の画像コンテンツが選択されていない文字部分9(図1Aの実線のボックス)の画像コンテンツのコピーに置き換えられている。ポートレート5および署名6を含む部分は、ポートレート14および署名15のぼかしたバージョンに置き換えられる。
図2は、画像データを修正するためのコンピュータ実施方法16の概略フローチャートを示す。この方法は、未修正画像データ(この例ではスキューおよびチルトを補正するために必要に応じて修正されたID文書の画像1)をロードし(17)、未修正画像データを所定の寸法にサイズ変更して、統一された画像サイズを達成し(18)、サイズ変更後(19)に返された画像データ19の1つのコピーを、図3~図6に関連してより詳細に説明される4つの並列処理ブランチ20~23の各々に渡す。
図3は、図2の第1のブランチ20の詳細なフローチャートを示す。第1のブランチ20における方法ステップは、画像データ19内の機密テキスト領域を匿名化する。第1のブランチ20は、検出フェーズ24と、それに続く匿名化フェーズ25とを含む。検出フェーズ24は、以下のステップを含む。画像データ19によって表される画像内の少なくとも2つの英数字文字を検出する(26)。少なくとも2つの英数字文字が検出されたとの決定27に応答して、画像データ19によって表される画像内の2つ以上の英数字文字を含む少なくとも1つの単語を検出する(28)。少なくとも1つの単語が検出されたと判定する(29)。少なくとも2つの英数字文字を検出するために、ロバストな手法、例えば、Baek、Youngminらによる「文字領域認識テキスト検出のための文字領域認識」(IEEEコンピュータビジョン及びパターン認識に関する会議抄録、2019年)に記載されている「CRAFT」法を使用することができ、その実施には、https://github.com/clovaai/CRAFT-pytorchでアクセスすることができる。ロバスト性を改善するために(すなわち、テキスト領域が検出されないままであることを回避するために)、検出アプローチは、異なる画像スケールに適用され、異なるパラメータを使用して個々の文字を見つけることができる。同じ実装を単語検出にも使用することができる。文字または単語の検出は、典型的には画像内の特定の領域または領域を表す多角形の位置情報をもたらす。例えば、検出された各文字は画像データ内の領域を示す長方形に対応し得、その領域は文字の光学的表現を含む。同じ単語に属する文字は、それぞれの単語に属するすべての文字の長方形を囲む単語長方形(または一般に多角形)によって識別され、表され得る。
匿名化フェーズ25は検出フェーズ24に続き、以下のステップを含む。少なくとも1つの単語が検出されたという決定29に応答して、各単語について30を繰り返す。その単語に関連する文字を決定する(31)。その単語に関連する英数字文字の約半分をランダムに選択する(32)。選択されたすべての英数字文字について、選択された文字と同じ単語に属するすべての選択されていない英数字文字(図1Aの実線のボックス)から置換英数字文字をランダムに決定し、選択されたそれぞれの英数字文字(図1Aの破線ボックス)の文字部分内の画像データを、対応する置換英数字文字の文字部分内の画像データと置き換えることによって画像データを修正する(33)。匿名化された文字位置の集合に、すべての選択された英数字文字の文字部分を付加する(34)。すべての検出された単語が処理されるまで続ける。匿名化フェーズ25の後、第1のブランチ20は、匿名化された文字位置34の集合と共に修正された画像データを返すステップ35を含む。第1のブランチ20から戻ると(35)、制御フローは図2に続く
任意選択的に(図3には示されていない)、第1のブランチ20の範囲内で、匿名化フェーズ25は、以下のステップをさらに含むことができる。各選択されていない英数字文字(図1Aの実線ボックス)の文字部分内の画像データを、置換された文字部分と同じ検出された単語からのランダムに選択された異なる選択されていない英数字文字の文字部分内の(変更されていない)画像データと置き換えることによって、ロードされた画像データを修正する。すべての選択されていない英数字文字の文字部分を匿名化された文字位置の集合に追加する。これは、さらに、修正された画像データ内に残る、画像データの文字部分の位置の単語内シャッフリングを達成する。
図4は、図2の第2のブランチ21の詳細なフローチャートを示す。第2のブランチ21における方法ステップは、画像データ内の顔領域を匿名化する。第2のブランチ21は、主顔検出フェーズ36、副顔検出フェーズ37、および匿名化フェーズ38を備える。主顔検出フェーズ36は、以下のステップを含む。画像データ19によって表される画像内の少なくとも1つの顔を検出する(39)。少なくとも1つの顔が検出されたと判定する(40)。副顔検出フェーズ37は主顔検出フェーズ36に続き、以下のステップを含む。主顔検出フェーズ36中に少なくとも1つの顔が検出されたという決定(40)に応答して、主顔検出フェーズ36中に検出された少なくとも1つの顔をテンプレートとして使用して、画像データ19によって表される画像内の任意の(ゼロ以上の)追加の顔を検出する(41)。
好適な顔検出を実施するために、例えば、https://github.com/ageitgey/face_recognitionでアクセス可能なライブラリを使用することができ、具体的には、そのライブラリによって提供される畳み込みニューラルネットワーク検出手法(「cnn」)を使用することができる。任意選択的に、画像ピラミッド(スケーリング)パラメータは、望ましい(すなわち、ロバストである)検出性能を達成するように調整することができる。さらに、副顔検出はロバスト性を高めるために、画像データ19の異なるスケールに再び適用されてもよい。テンプレートマッチングのために、OpenCVライブラリ(https://OpenCV.org/)によって提供される実施を使用することができる。検出は、検出された各顔および検出された各追加の顔の境界ボックスをもたらす。
匿名化フェーズ38は、副顔検出フェーズ37に続き、以下のステップを含む。画像データの1つ以上のポートレート部分を除去することによって画像データ19を修正する(43)。各ポートレート部分は検出された顔の領域に対応し、少なくとも1つの除去されたポートレート部分を、同じポートレート部分のぼかしたバージョンに置き換える。ロードされた画像データの任意の追加のポートレート部分を除去することによって画像データを修正する(44)。各追加のポートレート部分は検出された追加の顔の領域に対応し、任意の追加のポートレート部分を、同じ追加のポートレート部分のぼかしたバージョンに置き換える。言い換えれば、各ポートレート部分および各追加ポートレート部分の境界ボックスは、適切なサイズのフィルタカーネルでぼかされる。匿名化フェーズ38の後、第2のブランチ21はポートレート部分および追加のポートレート部分を含む匿名化された顔位置46の集合と共に、修正された画像データを戻すステップ45を含む。第2のブランチ21から戻ると(45)、制御フローは図2に続く。
図5は、図3の第3のブランチ22の詳細なフローチャートを示す。第3のブランチ22における方法のステップは、画像データ内の署名を匿名化する。第3のブランチ22は、検出フェーズ47および匿名化フェーズ48を含む。検出フェーズ47は、画像データ19によって表される画像内の少なくとも1つの書き込み署名を検出する役割を果たす。それは以下のステップを含む。背景画像50を得るために、ロードされた画像データによって表される画像の前景(テキストまたは線のような小さなストローク構造)を、膨張およびメディアンフィルターを適用することで除去し、背景画像50を取得する(49)。差分画像52を得るために、未修正画像19と決定された背景画像50との差分を計算する(51)。2つのパラレルサブブランチで差分画像52を処理する。第1のサブブランチは、第1のモノクロ画像54を得るために、全てのカラーチャネルにわたって標準偏差(「std」)を算出する(53)。第2のサブブランチは第2のモノクロ画像56を得るために、全てのカラーチャネルにわたって合計を算出する(55)。ノイズ低減(形態学的方法)および画像フィルタリングを差分画像52に適用する。第1のモノクロ画像が第1の事前定義された閾値範囲内にあり、第2のモノクロ画像が第2の事前定義された閾値範囲内にある、画像領域のみを含む、画像マスクを計算することによって、差分画像内の潜在的テキスト様領域を識別する(57)。全ての識別された潜在的テキスト様領域の輪郭を計算する(58)。輪郭特徴および事前知識、例えば、最小および最大面積および/または形状境界(署名はIDカード全体ほど広くない)によって、それらの領域をフィルタリングする(59)(すなわち、さらなる処理からスキップする)。残りの潜在的テキスト様領域の輪郭を、すでに検出され匿名化される以前に識別されたテキスト様領域と比較し、交差領域を決定する。それらの領域を、予め定義された閾値を超える交差領域でフィルタリングする(60)。残りの潜在的テキスト様領域を、ロードされた画像データの検出された署名部分として保持する。各署名部分は検出された書き込み署名の領域に対応する。上記の文字検出および顔検出に関連して説明されるものと同様に、署名検出のための検出パラメータは、ロバストな匿名化に有利に調整され、様々な誤検出を受け入れることができる。
検出フェーズ47の後、第3のブランチ22は、少なくとも1つの署名部分が検出されたという決定61に応答して、匿名化フェーズ48に進むことを含む。匿名化フェーズ48は以下のステップを含む。画像データの1つ以上の署名部分を除去することによって画像データ19を修正する(62)。少なくとも1つの除去された署名部分を、同じ署名部分のぼかしたバージョンと置き換える。より具体的には、各署名部分の境界ボックスが適切なサイズのフィルタカーネルでぼかされる。匿名化フェーズ48の後、第3のブランチ22は、署名部分を含む匿名化された署名位置64の集合と共に修正画像データを返すステップ63を含む。第3のブランチ22から戻ると、制御フローは図2に続く。
上述の差分画像52では、画像前景として以前に除去された領域が最も強く強調表示される。上記で説明した署名検出はすべてのカラーチャネルにわたる標準偏差が小さく、同時に、すべてのカラーチャネルにわたる合計がより高い範囲にある場合、それらの領域がテキストのような構造である可能性が非常に高いという一般的な認識に基づく。
図6は、図4の第4のブランチ23の詳細なフローチャートを示す。この第4のブランチ23における方法のステップはバーコードまたはQRコード(登録商標)(または一般に、機械可読コード)を匿名化する。第4のブランチ23は、検出フェーズ65および匿名化フェーズ66を含む。検出フェーズ65は以下のステップを含む。画像データ19によって表される画像内の少なくとも1つの機械可読コードを検出する(67)少なくとも1つの機械可読コードが検出されたと判定する(68)。バーコードおよびQRコード(登録商標)の動作検知を提供する1つの例示的な実施態様は、https://pypi.org/project/pyzbar/でアクセス可能な「pyzbar」ライブラリである。
匿名化フェーズ66は検出フェーズ65に続き、以下のステップを含む。少なくとも1つの機械可読コードが検出フェーズ65中に検出されたという決定68に応答して、画像データの1つ以上のコード部分を除去することによって画像データ19を修正する(69)。各コード部分は、検出された機械可読コードの領域に対応する。少なくとも1つの除去されたコード部分を、同じコード部分のぼかしたバージョンと置き換える。言い換えれば、機械可読コードを含むものとして検出された画像データ19の領域はぼかされる。匿名化フェーズ66の後、第4のブランチ23は、修正された画像データを戻すステップ70を含む。第4のブランチ23から戻ると、制御フローは図2に続く。
画像1の例を図1Aに示す。検出される機械可読コードは存在しない。したがって、第4のブランチは、検出フェーズ65において決定68から直接戻る。
すべてのブランチ20~23が戻された後の図2に関して、本方法は、匿名化された文字位置34、匿名化された顔位置46、および第1のブランチ20、第2のブランチ21、および第3のブランチ22からそれぞれ戻された匿名化された署名位置64に基づいて4つのブランチ20~23のそれぞれから戻された修正された画像データを組み合わせ(71)、重複する部分の追加の画像変換を実行する。より詳細にはブランチから返される修正画像が以下のように結合される。匿名化された位置のいずれとも重複しない領域が未修正画像からコピーされる。単一の匿名化された位置のみと重複する領域がそれぞれの匿名化された位置と同じブランチによって返される修正画像からコピーされる。匿名化された文字位置および第2の匿名化された位置(すなわち、顔、署名またはコード)と重複する領域はそれぞれの第2の匿名化された位置と同じブランチによって返される修正画像からコピーされる。すべての他の領域(すなわち、2つまたは3つの匿名化された顔、署名またはコード位置と重複する)は重複する匿名化された位置に匿名化された位置に寄与する各ブランチによって返される修正画像から平均画像を計算することによってマージされる。図2に開示された方法の終わりに、匿名化画像である修正画像72が提供され、保存される。加えて、別個の匿名化された位置ファイル73が提供され、保存され、これは、全ての匿名化された位置を示す情報を含む。
図7は、図2~図6に関連して説明された手法を実行するための手段を含むデータ処理システム74を示す。具体的には、システム74は、未修正画像データをロードすることができる画像データベース75と、この方法を実行し、それぞれの未修正画像および匿名化画像72および匿名化位置ファイル73を保存するためのデータ処理手段76とを備える。
図8Aは、図1Aに類似する個人ID文書の未修正画像1を示す。同じ要素は、同じ参照符号によって示され、これらの要素に関しては、図1Aの詳細な説明を参照する。図1Aとは対照的に、図8Aに示す個人ID文書は追加のポートレート77(すなわち、顔の追加の画像、または単に追加の顔)を含む。この例では、誕生日78のコピーが追加のポートレート77と重複して配置される。追加のポートレート77はポートレート5の修正バージョン、例えば、ポートレート5のホログラフィックバージョンである。追加のポートレート77は、機密個人情報に属する。
図8Bは、図1Bに類似する、詳細に上述された方法による改変後の、図8Aと同じ個人ID文書の修正画像10を示す。再び、同じ要素は、同じ参照符号によって示され、これらの要素に関しては、図1Bの詳細な説明を参照する。図1Bとは対照的に、修正された画像10は追加のポートレート79のぼかしたバージョンを含み、すなわち、追加のポートレート77を含む部分は、追加のポートレート79のぼかしたバージョンに置き換えられる。さらに、追加のポートレート79のぼかしたバージョンは、生年月日78のコピーのぼかしたバージョンも含む。
生年月日のコピー78もまた、書かれた情報の一部であり、したがって、匿名化されたバージョン13と同様に、生年月日の匿名化されたバージョンに置き換えられ得るが、文字部分はそれらの背景を形成する追加のポートレート78のために、機密個人情報を含み得る。本方法による書かれた情報の匿名化はいくつかの文字部分のみを置き換えるか、またはそれらの配列のみを変更し、そうでなければ個々の文字部分をそのまま残す(すなわち、変更されない)ので、各文字部分内の背景もまた、変更された画像10内で変更されずに複製され得る。予防策として、複数のタイプの潜在的に機密性のある個人情報が重複する場合、各々のタイプは異なる処理ブランチで処理され得るので、本方法は、匿名化に対する最も破壊的なアプローチを優先するように構成され得る。すなわち、匿名化に対する最も破壊的なアプローチの結果が、修正された画像10において優先される。
この例では、生年月日78のコピーの文字部分を含む部分が顔領域の匿名化を担当する処理ブランチ(例えば、上述の実施形態における第2のブランチ21)において修正されたバージョンに置き換えられる。したがって、生年月日78のコピーの一部として検出される可能性があり、変更されていない機密テキスト領域を匿名化する責任を負う別の処理ブランチを通過したものであろう任意の選択されていない文字領域も、機密個人情報のより信頼できる保護に有利になるように、トレーニングの目的のために修正され、効果的に価値を低減される。
Claims (19)
- 画像データを修正するコンピュータ実施方法であって、
未修正の画像データをロードし、
ロードされた前記画像データによって表される画像内の少なくとも2つの英数字文字を検出し(24)、
検出された前記英数字文字のうちの1つ以上を選択し(32)、
選択される前記英数字文字の数は検出された前記英数字文字の総数よりも小さく、
ロードされた前記画像データの1つ以上の文字部分を除去することによって、ロードされた前記画像データを修正し(33)、
各文字部分は、選択された英数字文字の領域に対応し、
修正された前記画像データを保存する、
コンピュータ実施方法。 - 選択された英数字文字の数は、検出された全ての英数字文字の数の約半分である、請求項1に記載のコンピュータ実施方法。
- ロードされた前記画像データによって表される前記画像内の2つ以上の英数字文字を含む少なくとも1つの単語を検出し(28)、
検出された各単語の検出された前記英数字文字のうちの1つ以上を選択する(32)、
請求項1または請求項2に記載のコンピュータ実施方法。 - 各単語の検出された前記英数字文字の数の約半分を選択する(32)、
請求項3に記載のコンピュータ実施方法。 - ロードされた前記画像データの除去された前記文字部分の少なくとも1つを、選択されていない英数字文字の領域に対応するロードされた前記画像データの文字部分と置き換えることによって、ロードされた前記画像データを修正する(33)、
請求項1~請求項4のいずれか1項に記載のコンピュータ実施方法。 - 少なくとも1つの前記単語に属するロードされた前記画像データの除去された前記文字部分のうちの少なくとも1つを、除去された前記文字部分と同じ単語に属する選択されていない英数字文字の領域に対応するロードされた前記画像データの文字部分と置き換えることによって、ロードされた画像データを修正する、
請求項3または請求項4に記載のコンピュータ実施方法。 - ロードされた前記画像データの1つ以上の文字部分をシャッフルすることによってロードされた前記画像データを修正し、
各文字部分は、選択されていない英数字文字の領域に対応する、
請求項1~請求項6のいずれか1項に記載のコンピュータ実施方法。 - 少なくとも1つの単語に属する英数字文字に対応する文字部分のシャッフリングは、同じ単語内のシャッフリングに限定される、
請求項3または請求項7に記載のコンピュータ実施方法。 - ロードされた前記画像データによって表される画像内の少なくとも1つの顔を検出し(39)、
ロードされた前記画像データの1つ以上のポートレート部分を除去することによってロードされた前記画像データを修正し、
各ポートレート部分は、検出された顔の領域に対応する、
請求項1~請求項8のいずれか1項に記載のコンピュータ実施方法。 - ロードされた前記画像データの1つ以上のポートレート部分を除去することは、少なくとも1つの除去されたポートレート部分を、同じポートレート部分のぼかしたバージョンに置き換えることを含む、
請求項9に記載のコンピュータ実施方法。 - 少なくとも1つの検出された前記顔をテンプレートとして使用して、ロードされた前記画像データによって表される画像内の少なくとも1つの追加の顔を検出し(41)、
ロードされた前記画像データの1つ以上の追加のポートレート部分を除去することによって、ロードされた前記画像データを修正し(44)、
各追加のポートレート部分は、検出された追加の顔の領域に対応する、
請求項9または請求項10に記載のコンピュータ実施方法。 - ロードされた前記画像データの1つ以上の追加のポートレート部分を除去することは、少なくとも1つの追加のポートレート部分を、同じ追加のポートレート部分のぼかしたバージョンと置き換えることを含む、
請求項11に記載のコンピュータ実施方法。 - ロードされた前記画像データによって表される画像内の少なくとも1つの書き込み署名を検出し(47)、
ロードされた前記画像データの1つ以上の署名部分を除去することによってロードされた前記画像データを修正し(62)、
各署名部分は、検出された書き込み署名の領域に対応する、
請求項1~請求項12のいずれか1項に記載のコンピュータ実施方法。 - ロードされた前記画像データの1つ以上の署名部分を除去することは、少なくとも1つの除去された署名部分を、同じ署名部分のぼかしたバージョンと置き換えることを含む、
請求項13に記載のコンピュータ実施方法。 - ロードされた前記画像データによって表される画像内の少なくとも1つの機械可読コードを検出し(67)、
ロードされた前記画像データの1つ以上のコード部分を除去することによってロードされた前記画像データを修正し(69)、
各コード部分は、検出された機械可読コードの領域に対応する、
請求項1~請求項14のいずれか1項に記載のコンピュータ実施方法。 - ロードされた前記画像データの1つ以上のコード部分を除去することは、少なくとも1つの除去されたコード部分を、同じコード部分のぼかしたバージョンと置き換えることを含む、
請求項15に記載のコンピュータ実施方法。 - 請求項1~請求項16のいずれか1項に記載の前記コンピュータ実施方法を実行する手段を含む、
データ処理システム(74)。 - コンピュータによって実行されると、請求項1~請求項16のいずれか1項に記載の前記コンピュータ実施方法をコンピュータに実行させる命令を含む、コンピュータプログラム製品。
- コンピュータによって実行されると、請求項1~請求項16のいずれか1項に記載の前記コンピュータ実施方法をコンピュータに実行させる命令を含む、コンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20190903.3A EP3955150A1 (en) | 2020-08-13 | 2020-08-13 | Anonymizing textual content in image training data |
EP20190903.3 | 2020-08-13 | ||
PCT/EP2021/072565 WO2022034202A1 (en) | 2020-08-13 | 2021-08-13 | Anonymizing textual content in image training data |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023538857A true JP2023538857A (ja) | 2023-09-12 |
Family
ID=72086752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023509740A Pending JP2023538857A (ja) | 2020-08-13 | 2021-08-13 | 画像トレーニングデータにおけるテキストコンテンツの匿名化 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20240028763A1 (ja) |
EP (2) | EP3955150A1 (ja) |
JP (1) | JP2023538857A (ja) |
KR (1) | KR20230051215A (ja) |
WO (1) | WO2022034202A1 (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9892278B2 (en) * | 2012-11-14 | 2018-02-13 | International Business Machines Corporation | Focused personal identifying information redaction |
EP3188058A1 (en) | 2015-12-30 | 2017-07-05 | Adam Szczepanik | A method and a system for anonymizing image data in medical images |
EP3451209B1 (en) | 2017-08-31 | 2020-08-12 | Nokia Technologies Oy | Apparatus and method for anonymizing image content |
US10970418B2 (en) * | 2018-08-23 | 2021-04-06 | Servicenow, Inc. | System and method for anonymized data repositories |
KR20200092101A (ko) * | 2019-01-24 | 2020-08-03 | 삼성전자주식회사 | 전자 장치 및 그 동작방법 |
-
2020
- 2020-08-13 EP EP20190903.3A patent/EP3955150A1/en not_active Withdrawn
-
2021
- 2021-08-13 JP JP2023509740A patent/JP2023538857A/ja active Pending
- 2021-08-13 WO PCT/EP2021/072565 patent/WO2022034202A1/en active Application Filing
- 2021-08-13 KR KR1020237007944A patent/KR20230051215A/ko unknown
- 2021-08-13 EP EP21751825.7A patent/EP4196897A1/en active Pending
- 2021-08-13 US US18/041,418 patent/US20240028763A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20230051215A (ko) | 2023-04-17 |
EP4196897A1 (en) | 2023-06-21 |
EP3955150A1 (en) | 2022-02-16 |
WO2022034202A1 (en) | 2022-02-17 |
US20240028763A1 (en) | 2024-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5845728B2 (ja) | コンテンツ・プライバシー保護のためのマイクロタスクを生成する技術 | |
US9436882B2 (en) | Automated redaction | |
JP2012048724A (ja) | タスク値付け技術 | |
US20200210688A1 (en) | Image data processing system and method | |
CN112088378A (zh) | 图像隐藏信息检测器 | |
US11961094B2 (en) | Fraud detection via automated handwriting clustering | |
RU2715515C2 (ru) | Система и способ выявления изображения, содержащего идентификационный документ | |
CN108646988B (zh) | 文档打印方法和系统 | |
US20180342038A1 (en) | Systems and methods for rendering a secure document with a text selection capability | |
CN113850066A (zh) | 一种协议文本生成方法、装置及设备 | |
JP2023538857A (ja) | 画像トレーニングデータにおけるテキストコンテンツの匿名化 | |
CN110706121B (zh) | 确定医保欺诈结果的方法、装置、电子设备及存储介质 | |
US9088735B2 (en) | Computer-based system and method for adding variable security data in printing operations | |
KR102531368B1 (ko) | 원본 의료 이미지의 영역별로 서로 다른 컨실링 프로세스가 수행되도록 하여 원본 의료 이미지를 컨실링 처리하는 변조 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고 이를 이용한 학습 장치 및 테스트 장치 | |
US8693052B2 (en) | Electronic document generating apparatus, electronic document generation method, and storage medium | |
Nguyen et al. | Features selection in microscopic printing analysis for source printer identification with machine learning | |
Kroll | ACM TechBrief: Facial Recognition | |
Santiago Garcia | Country-independent MRTD layout extraction and its applications | |
AU2017301370B2 (en) | Identification of duplicate copies of a form in a document | |
Desai et al. | An approach for text recognition from document images | |
JP2006277399A (ja) | 認識処理システム | |
JP2020154562A (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN109358822B (zh) | 一种合同打印保证方法 | |
Okamoto et al. | Image Generation and Learning Strategy for Deep Document Forgery Detection | |
JP2024022550A (ja) | 画像処理装置、画像処理方法、及びプログラム |