WO2023132076A1

WO2023132076A1 - 画像加工装置、画像加工方法及び画像加工プログラム

Info

Publication number: WO2023132076A1
Application number: PCT/JP2022/000417
Authority: WO
Inventors: 秀継内田
Original assignee: 富士通株式会社
Priority date: 2022-01-07
Filing date: 2022-01-07
Publication date: 2023-07-13

Abstract

画像加工装置は、人物の顔を含む画像を取得する取得部と、画像に含まれる顔の向きの正面向きに対する相対角度が閾値未満の場合に、画像に対してノイズを付与する加工部と、を有する。

Description

画像加工装置、画像加工方法及び画像加工プログラム

　本発明は、画像加工装置、画像加工方法及び画像加工プログラムに関する。

　ＳＮＳ（Social　Networking　Service）やテレビ通話の普及によって、個人の顔が撮影された画像（以下、「顔画像」と記載）や動画がネットワーク上に流通する機会が増加している。

　それに伴い、ネットワークを介して入手される顔画像を用いて、第三者が顔認証で保護されているデータやサービスへアクセスする不正アクセス、ひいては不正アクセスを通じたプライバシー侵害を始めとする様々な被害の発生が懸念されている。

　このことから、オリジナルの顔画像を加工することにより、顔画像を非識別化する技術が注目を集めている。このような顔画像の非識別化技術の例として、いわゆる敵対的サンプルと呼ばれるものや画像変換を用いるものが挙げられる。

国際公開第２０１８／２２５０６１号

Xiao　Yang,　Yinpeng　Dong,　Tianyu　Pang,　Hang　Su,　Jun　Zhu,　Yuefeng　Chen,　Hui　Xue,　"Towards　Face　Encryption　by　Generating　Adversarial　Identity　Masks"　arXiv:2003.06814v2

　しかしながら、上記の顔画像の非識別化技術は、顔認証しやすい顔画像および顔認証が困難である顔画像のいずれにも画一的に適用される。それ故、顔認証が困難である顔画像は、非識別化の目的が達せられているのも関わらず、本来必要のない余計な加工によってオリジナルの顔画像から歪められてしまう一面がある。

　１つの側面では、オリジナル顔画像に対する加工を顔認証しやすい顔画像に絞り込んで実施できる画像加工装置、画像加工方法及び画像加工プログラムを提供することを目的とする。

　一態様の画像加工装置は、人物の顔を含む画像を取得する取得部と、前記画像に含まれる前記顔の向きの正面向きに対する相対角度が閾値未満の場合に、前記画像に対してノイズを付与する加工部と、を有する。

　一実施形態によれば、オリジナル顔画像に対する加工を顔認証しやすい顔画像に絞り込んで実施できる。

図１は、情報処理装置の機能構成例を示すブロック図である。図２は、画像加工リクエストの受付画面の一例を示す図である。図３は、判定部の動作例を示す図（１）である。図４は、判定部の動作例を示す図（２）である。図５は、第１の加工顔画像及び第２の加工顔画像の一例を示す図である。図６は、第２の加工顔画像の利用シーンの一例を示す図である。図７は、画像加工処理の手順を示すフローチャートである。図８は、ハードウェア構成例を示す図である。

　以下、添付図面を参照して本願に係る画像加工装置、画像加工方法及び画像加工プログラムの実施例について説明する。各実施例には、あくまで１つの例や側面を示すに過ぎず、このような例示により数値や機能の範囲、利用シーンなどは限定されない。そして、各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

　図１は、情報処理装置の機能構成例を示すブロック図である。図１に示す情報処理装置１は、顔画像の非識別化を実現する側面から、オリジナルの顔画像を加工する画像加工機能を搭載するものである。

　以下、上記の画像加工機能の利用シーンの例として、スマートフォンやタブレット端末などが有するカメラ機能に組み込まれる例を挙げるが、この例はあくまで一例に過ぎない。例えば、上記の画像加工機能は、画像の投稿を受け付けるＳＮＳのアプリケーション、あるいはＷｅｂ会議やテレビ通話などを実現するソフトフォンなどのユーザアプリケーションに組み込まれてもよい。なお、上記の画像加工機能は、上記のユーザアプリケーションに限らず、Ｗｅｂアプリケーション、あるいはＳａａＳ（Software　as　a　Service）型のアプリケーションとして実現することで、サービスとして提供することもできる。

　図１には、情報処理装置１が有する画像加工機能に関連するブロックが模式化されている。図１に示すように、情報処理装置１は、表示入力部２と、撮像部３と、記憶部４と、制御部５とを有する。なお、図１には、上記の画像加工機能に関連する機能部が抜粋して示されているに過ぎず、図示以外の機能部、例えば既存のコンピュータがデフォルトまたはオプションで装備する機能部、例えば通信制御部などが情報処理装置１に備わることとしてもよい。

　表示入力部２は、各種の操作の入力および各種の情報の表示を行う機能部である。あくまで一例として、表示入力部２は、入力デバイス及び表示デバイスが一体化されたタッチパネルにより実現され得る。これはあくまで一例に過ぎず、各種の操作の入力機能および各種の情報の表示機能は、必ずしも一体化されて実現されずともよく、入力部および表示部の各々が個別に備わることを妨げない。

　撮像部３は、画像を撮像する機能部である。ここで言う「画像」は、静止画または動画のいずれであってもよい。あくまで一例として、撮像部３は、表示入力部２のスクリーン表面と同一の向きに配置されるフロントカメラや表示入力部２のスクリーンの背面に配置されるリアカメラなどにより実現され得る。

　記憶部４は、各種のデータを記憶する機能部である。あくまで一例として、記憶部４は、内部、外部または補助のストレージにより実現され得る。例えば、記憶部４は、撮像部３により撮像されたオリジナル顔画像４０と、オリジナル顔画像に後述の第１の加工部７Ｃおよび第２の加工部７Ｅによる加工が実施されることにより得られた第２の加工顔画像４５とを記憶する。これらオリジナル顔画像４０や第２の加工顔画像４５以外にも、記憶部４は、制御部５内の機能部が処理に用いるパラメータの他、情報処理装置１のユーザデータなどの各種のデータを記憶することができる。

　制御部５は、情報処理装置１の全体制御を行う処理部である。例えば、制御部５は、ハードウェアプロセッサにより実現される。この他、制御部５は、ハードワイヤードロジックにより実現されてもよい。

　あくまで一例として、制御部５は、上記の画像加工機能を実現する画像加工プログラムがプロセッサにより実行されることにより、上記の画像加工機能に対応する機能部がプロセスとして仮想的に実現された画像加工部７を有する。

　画像加工部７は、図１に示すように、取得部７Ａと、判定部７Ｂと、第１の加工部７Ｃと、分離部７Ｄと、第２の加工部７Ｅと、合成部７Ｆとを有する。

　取得部７Ａは、オリジナル顔画像を取得する処理部である。ここで言う「オリジナル顔画像」とは、あくまで１つの側面として、第１の加工部７Ｃおよび第２の加工部７Ｅによる加工が施される前の、原本の顔画像を指すこととする。

　あくまで一例として、取得部７Ａは、撮像部３からオリジナル顔画像をフレーム単位で取得することができる。ここで、取得部７Ａがオリジナル顔画像を取得する情報ソースは、任意の情報ソースであってよく、必ずしも撮像部３に限定されない。例えば、取得部７Ａは、内蔵または付属のストレージ、情報処理装置１に着脱可能なリムーバブルメディア、あるいはネットワークを介して接続された任意のコンピュータなどからオリジナル顔画像を取得することとしてもよい。

　判定部７Ｂは、オリジナル顔画像を加工するか否かを判定する処理部である。一実施形態として、判定部７Ｂは、取得部７Ａにより取得されたオリジナル顔画像から得られる顔の向きの正面向きに対する相対角度が閾値以上であるか否かにより、オリジナル顔画像を加工するか否かを判定する。ここで言う「正面向き」とは、あくまで例示として、撮像部３が有する撮像素子が配置される撮像面および顔の正面が正対する向き、あるいは光学中心を通る光軸が顔面の法線方向に対応する向きを指すこととする。以下、正面向きを基準とする顔の向きの相対角度のことを指して、「顔の向きの相対角度」と記載する場合がある。

　より詳細には、判定部７Ｂは、取得部７Ａにより取得されたオリジナル顔画像を加工するリクエストを表示入力部２を介して受け付ける。図２は、画像加工リクエストの受付画面の一例を示す図である。図２に示すように、判定部７Ｂは、撮像部３から取得部７Ａを介して取得されたオリジナル顔画像４０Ａを加工するリクエストを受け付ける受付画面２０を表示入力部２に表示させる。例えば、受付画面２０には、オリジナル顔画像４０Ａおよびそれに対する加工を実施するか否かの意思確認を促すメッセージと共に、意思確認を受け付けるＧＵＩ（Graphical　User　Interface）部品として、Ｙｅｓボタン２１およびＮｏボタン２２とが表示される。このような受付画面２０に表示されたＹｅｓボタン２１に対する操作を介して画像加工リクエストが受け付けられる。

　上記の画像加工リクエストの受付後、判定部７Ｂは、オリジナル顔画像に含まれる顔の向きの相対角度を算出する。このような顔の向きの相対角度の算出には、任意の頭部姿勢推定技術を用いることができるが、あくまで一例として、ＯＳＳ（Open　Source　Software）のライブラリとして公開された訓練済みの機械学習モデルを用いることができる。あくまで一例として、機械学習モデルは、ＣＮＮ（Convolved　Neural　Network）などのニューラルネットワークが用いられる。この機械学習モデルは、画像および当該画像から求められた特徴量、例えば目や鼻、口、眉などの顔パーツの端点の座標を入力として顔の向きの相対角度を出力する。

　このような機械学習モデルにオリジナル顔画像を入力することにより、オリジナル顔画像４０に含まれる顔の向きの相対角度を算出する。その上で、判定部７Ｂは、オリジナル画像の顔認証のしやすさの評価のあくまで一例として、顔の向きの相対角度が閾値未満であるか否かを判定する。

　ここで、顔の向きの相対角度が閾値未満である場合、オリジナル顔画像に含まれる顔の正面が撮像部３の撮像面に正対する状態からズレる度合いが小さいことが判明する。この場合、オリジナル顔画像に顔認証に用いられる特徴が十分に含まれている可能性が高まる。

　図３は、判定部７Ｂの動作例を示す図（１）である。図３には、あくまで１つの側面として、情報処理装置１のユーザが撮像部３に顔の正面を向けた状態で撮影されたオリジナル顔画像４０Ａを例に挙げる。

　図３に示すように、オリジナル顔画像４０Ａが上記の例で挙げる頭部姿勢推定用の機械学習モデル７ＢＭに入力される。このようにオリジナル顔画像４０Ａが入力された機械学習モデル７ＢＭは、オリジナル顔画像４０Ａに含まれる顔の向きの相対角度（θ_pitch、θ_roll、θ_yaw）を出力する。例えば、「θ_pitch」は、ｘ軸回りの回転角度を指し、「θ_roll」は、ｚ軸回りの回転角度指し、「θ_yaw」は、ｙ軸回りの回転角度を指す。これら相対角度（θ_pitch、θ_roll、θ_yaw）は、いわゆるカメラポジションやカメラアングルなどの撮像部３の撮影位置により変わったり、ユーザによる上下の首振り動作、首をかしげる動作、あるいは左右の首振り動作などにより変化したりする。

　これらθ_pitch、θ_roll及びθ_yawの３つの回転角度の全てを顔認証のしやすさの評価に用いることもできるが、ここでは、あくまで例示として、θ_pitch及びθ_yawの２つの回転角度を顔認証のしやすさの評価に用いる例を挙げる。このようにθ_pitch及びθ_yawの２つの回転角度を用いる理由の１つには、顔認証エンジンでは、入力される画像を回転して顔の傾きを補正する処理が組み込まれることにより、ロール方向の回転にはロバスト性を有する側面があるからである。

　あくまで一例として、判定部７Ｂは、θ_pitchがθ_th1未満であるか否か、かつθ_yawがθ_th2未満であるか否かを判定する。このような判定を通じて、撮像部３の撮像面および情報処理装置１のユーザの顔の正面が正対する状態からズレる度合いが評価される。

　図３に示す例で言えば、情報処理装置１のユーザの顔の正面が撮像部３の撮像面に正対する状態で撮影されているので、θ_pitchがθ_th1未満であり、かつθ_yawがθ_th2未満であると判定される。

　この場合、オリジナル顔画像４０Ａには、顔認証に用いられる特徴が十分に含まれている可能性が高まる。例えば、顔パーツの端点などの特徴点の一部にオクルージョンが発生したり、特徴点間の位置関係に歪みが生じることより顔モデル、あるいは顔認証タスクを実現する機械学習モデルの生成に用いられた訓練データとの間で差が拡大したりといった可能性が狭まる。したがって、オリジナル顔画像４０Ａの顔認証がしやすいと推定する。この場合、オリジナル顔画像４０Ａの現物のままでは非識別化の目的が達せられないので、オリジナル顔画像４０Ａに対する加工の実施を抑制せず、オリジナル顔画像４０Ａが後述の第１の加工部７Ｃへ入力される。

　一方、顔の向きの相対角度が閾値以上である場合、オリジナル顔画像に含まれる顔の正面が撮像部３の撮像面に正対する状態からズレる度合いが大きいことが判明する。この場合、オリジナル顔画像に含まれる顔が左右または上下の方向を向いている可能性が高まる結果、オリジナル顔画像に顔認証に用いられる特徴が十分に含まれていない可能性も高まる。

　図４は、判定部７Ｂの動作例を示す図（２）である。図４には、あくまで１つの側面として、情報処理装置１のユーザが撮像部３に顔の右側面の上部を向けた状態で撮影されたオリジナル顔画像４０Ｂが例に挙げられている。

　図４に示すように、オリジナル顔画像４０Ｂが上記の例で挙げる頭部姿勢推定用の機械学習モデル７ＢＭに入力される。このようにオリジナル顔画像４０Ｂが入力された機械学習モデル７ＢＭは、オリジナル顔画像４０Ｂに含まれる顔の向きの相対角度（θ_pitch、θ_roll、θ_yaw）を出力する。

　図４に示す例で言えば、情報処理装置１のユーザが撮像部３に顔の右側面の上部を向けた状態で撮影されているので、θ_pitchがθ_th1未満でなく、かつθ_yawがθ_th2未満でないと判定される。

　この場合、オリジナル顔画像４０Ｂには、顔認証に用いられる特徴が十分に含まれていない可能性が高まる。例えば、顔パーツの端点などの特徴点の一部にオクルージョンが発生したり、特徴点間の位置関係に歪みが生じることより顔モデル、あるいは顔認証タスクを実現する機械学習モデルの生成に用いられた訓練データとの間で差が拡大したりといった可能性が高まる。したがって、オリジナル顔画像４０Ｂの顔認証がしにくいと推定する。この場合、オリジナル顔画像４０Ｂの現物のままで非識別化の目的が達せられているので、オリジナル顔画像４０Ｂに対する加工の実施を抑制し、オリジナル顔画像４０Ｂが記憶部４に保存される。

　なお、図２には、画像加工リクエストが受け付けられて始めて判定部７Ｂによる顔の向きの相対角度を判定する判定処理が起動される例を挙げたが、必ずしもユーザリクエストを受け付けずとも上記の判定処理が起動されることとしてもよい。例えば、オリジナル顔画像が取得された場合、上記の判定処理を自動的に実行することができるのは言うまでもない。

　また、図２には、利用シーンのあくまで一例として、上記の画像加工機能がカメラ機能に組み込まれる例を挙げたが、利用シーンに合わせて上記の判定処理を実行するタイミングは任意に変更できる。例えば、ＳＮＳのアプリケーションに組み込まれる場合、オリジナル顔画像がＳＮＳへ投稿されるタイミングで、上記の判定処理を手動または自動で起動することができる。また、ソフトフォンに組み込まれる場合、Ｗｅｂ会議等の映像がオン状態へ切り替えられるタイミングで、上記の判定処理を手動または自動で起動することができる。

　さらに、図４には、あくまで一例として、θ_pitchがθ_th1未満でなく、かつθ_yawがθ_th2未満でない例を挙げたが、θ_pitchがθ_th1未満であるか、あるいはθ_yawがθ_th2未満でない場合、オリジナル顔画像に対する加工の実施を抑制することができる。さらに、θ_pitch及びθ_yawの２つの回転角度を必ずしも判定せずともよく、いずれか１つのみを判定することができるのも言うまでもない。

　なお、顔認証のしやすさの評価のあくまで一例として、顔の向きの相対角度が閾値未満であるか否かを判定する例を挙げたが、他の方法、例えば照明の強度、あるいは画像のぼけの度合いにより顔認証のしやすさを評価することもできる。例えば、オリジナル顔画像から検出される照明の強度が閾値未満である場合に絞ってオリジナル顔画像に対する加工を実施することができる。また、オリジナル顔画像から検出されるブラーの評価値が閾値未満である場合に絞ってオリジナル顔画像に対する加工を実施することができる。この他、オリジナル顔画像から抽出される特徴点の個数が閾値以上である場合、あるいはオリジナル顔画像から抽出される特徴点の割合が閾値以上である場合に絞ってオリジナル顔画像に対する加工を実施することができる。

　図１の説明に戻り、第１の加工部７Ｃは、第１の加工を実行する処理部である。一実施形態として、第１の加工部７Ｃは、顔の向きの相対角度が閾値未満である場合、オリジナル顔画像に第１の加工を実行する。ここで言う「第１の加工」とは、顔画像の非識別化技術の中でも、画像変換を用いる匿名化加工に対応する。例えば、第１の加工部７Ｃは、顔画像の主観的な個人性を維持したまま、オリジナル顔画像との客観的な（顔認証システムが算出する）個人性が一致しないように、オリジナル顔画像に含まれる顔のジオメトリ測度、例えば顔の幾何学的な構造に関する特徴（顔パーツの位置関係や形状など）を変更する。

　あくまで例示として、第１の加工は、オリジナル顔画像から得られる特徴量と加工後の特徴量の類似度を低減させる機械学習が実行された機械学習モデルにより実現される。ここで、一般的な顔認証システムでは、登録画像として正面を向いた識別性の高い画像が使用されており、その特徴量との類似度を用いて顔認証を行っている。したがって、顔画像の解像度や顔の角度、表情によっては、顔認証が正常に行われない場合がある。匿名化対象の顔画像がそのような顔認証がむずかしい画像である場合、不本意な認証を抑制するという本来の目的は達成しているため、匿名化加工を行う必要はない。そこで、オリジナル顔画像の特徴量との類似度ではなく、オリジナル画像に対応する正面顔の特徴量に相当するものとの類似度を低減する機械学習を機械学習モデルに実行する。これにより、もともと顔認証がむずかしいオリジナル顔画像に対して不必要な加工を避けることができ、画像の品質低下を抑制できる。

　このような第１の加工を実現する機械学習モデルの生成には、異なるアングルで同一の人物が撮影された複数の顔画像を訓練サンプルとし、このような訓練サンプルの集合が訓練データセットとして用いることができる。なお、上記の機械学習モデルには、あくまで例示として、ＣＮＮなどのニューラルネットワークを適用できる。

　あくまで一例として、上記の訓練データセットに含まれる訓練サンプルごとに、次のような処理を実行することにより、顔画像を入力として第１の加工顔画像を出力とする機械学習モデルを生成できる。

　まず、複数の顔画像を代表する特徴量の代表値が算出される。例えば、代表値は、複数の顔画像の間で特徴量の統計値、例えば平均値や中央値、最頻値を算出することにより算出したり、あるいは下記文献に記載された顔画像品質に基づいた特徴量マージを行うことにより算出したりすることができる。

　Yichun　Shi,　Anil　K.　Jain,　“Probabilistic　Face　Embeddings”　Submitted　on　21　Apr　2019

　このような訓練サンプルの特徴量の代表値と、訓練サンプルに含まれるオリジナル顔画像が入力された機械学習モデルが出力する第１の加工顔画像から求まる特徴量とが閾値以下となる問題に定式化された目的関数が最適化される。これにより、機械学習モデルのパラメータの訓練が実現される。

　上記の目的関数のあくまで一例として、下記の式（１）に示す損失関数Lossが挙げられる。下記の式（１）の損失関数を最小化するパラメータ更新が繰り返される。下記の式（１）における「Ii」は、オリジナル顔画像を指し、「fic」は、訓練サンプルの特徴量の代表値を指し、「T(Ii)」は、第１の加工顔画像を指し、「F(T(Ii))」は、第１の加工顔画像の特徴量を指す。また、「sim()」は、類似度関数を指し、「dis()」は、距離関数を指し、「max()」は、最大値を返す関数を指す。

　Loss＝SUM_(i=1…N)max(sim(F(T(Ii)),　fic),thr)＋dis(T(Ii),Ii)・・・（１）

　ここで、上記の式（１）では、max()の引数を(sim(F(T(Ii)),　fic),thr)に設定することにより、類似度が閾値thrを超える場合のみ損失が発生するように損失関数Lossを機能させることができる。

　その一方で、上記の式（１）では、dis(T(Ii),Ii)をペナルティ項の１つとして設定することにより、第１の加工顔画像がオリジナル顔画像から大幅に改変されることを抑制するように損失関数Lossを機能させることができる。

　さらに、max(sim(F(T(Ii)),　fic),thr)およびdis(T(Ii),Ii)の項により、オリジナル顔画像の特徴量が訓練サンプルの特徴量の代表値と十分に離れている場合、T（）による第１の加工を恒等写像に近い変換へ近付けることができる。また、閾値thrを超える場合についても、閾値thr超過分に対してのみ損失が発生するので、余計な加工を避けることができる。

　このようにして得られる訓練済みの機械学習モデルに取得部７Ａにより取得されたオリジナル顔画像を入力することにより、機械学習モデルの出力として、オリジナル顔画像に第１の加工が行われた第１の加工顔画像を得ることができる。

　分離部７Ｄは、顔画像の周波数分離を実行する処理部である。このような周波数分離は、あくまで一例として、フィルタ処理により実現され得る。

　図５は、第１の加工顔画像及び第２の加工顔画像の一例を示す図である。図５には、分離部７Ｄ、第２の加工部７Ｅおよび合成部７Ｆの入出力が模式化して示されている。図５に示すように、第１の加工部７Ｃによりオリジナル顔画像４０Ａに第１の加工が行われた第１の加工顔画像４３が分離部７Ｄへ入力される。すると、分離部７Ｄは、第１の加工顔画像４３にハイパスフィルタ、例えばソーベルフィルタなどを適用することにより、第１の加工顔画像４３の高周波成分が抽出された高周波レイヤ４３Ｈ１を分離することができる。また、分離部７Ｄは、第１の加工顔画像４３にローパスフィルタ、例えばラプラシアンフィルタやガウシアンフィルタなどを適用することにより、第１の加工顔画像４３の低周波成分が抽出された低周波レイヤ４３Ｌを抽出することができる。

　第２の加工部７Ｅは、第２の加工を実行する処理部である。ここで言う「第２の加工」とは、顔画像の非識別化技術の中でも、敵対的サンプルを用いるノイズベースの加工に対応する。例えば、第２の加工は、顔認証エンジンに用いられる機械学習モデルが出力するラベルを正解のラベル、すなわち情報処理装置１のユーザ以外のラベルに誤認識させつつ、加工前後で当該ユーザの顔の視認類似性を維持する摂動を加えることにより実現される。ここで言う「摂動」は、顔認証エンジンに用いられ得る機械学習モデルへの入力データ、例えば顔画像のピクセルの値に与える変化を指す。このような第２の加工は、ＣＮＮなどのニューラルネットワークを用いた機械学習モデルにより実現されてよい。

　ここで、第２の加工は、顔認証エンジンに用いられる機械学習モデルおよびそのパラメータが既知である場合、すなわちホワイトボックスである場合、微小なノイズで顔画像の非識別化を達成できる。その一方で、顔認証エンジンに用いられる機械学習モデルのタスク以外が未知である場合、すなわちブラックボックスである場合、顔画像の非識別化を達成するには、汎化性能を高める側面からホワイトボックスである場合に比べて大きい強度のノイズが求められる。そして、ノイズの強度が大きくなると、加工後に縞模様のようなパターンが現れるので、画質を損ねる一因となる。

　このようにノイズが縞模様のパターンとして現れる点に着目し、第２の加工部７Ｅは、第１の加工顔画像の高周波成分にノイズを加える第２の加工を実現する。このような第２の加工には、ノイズによる影響が視認されにくい第２の加工顔画像４５が得られる点にその技術的意義がある。

　あくまで一例として、第２の加工部７Ｅは、高周波成分が支配的な領域、例えば顔のしわや髪の毛などの部分、あるいは高周波成分により構築される領域、例えば顔の輪郭など部分を抽出する。例えば、図５には、第１の加工顔画像４３のうち高周波成分に対応するピクセルの濃淡値を「白」、例えば２５５に近付ける一方で、高周波成分に対応しないピクセルの濃淡値を「黒」、例えば０に近付けて高周波レイヤ４３Ｈ１が表現されている。このような高周波レイヤ４３Ｈ１のうち、第２の加工部７Ｅは、濃淡値が閾値ＴＨ以上であるピクセルに絞り込んで摂動を加える第２の加工を実行する。これにより、高周波レイヤ４３Ｈ２が得られる。

　さらに、第２の加工部７Ｅは、顔の向きの相対角度に応じて第１の加工顔画像の高周波成分に加える摂動の上限を設定することができる。例えば、第２の加工部７Ｅは、顔の向きの相対角度が減少するに連れて値が大きい上限を設定する一方で、顔の向きの相対角度が増加するに連れて値が小さい上限を設定する。

　このような摂動の上限Ｌは、あくまで例示として、下記の式（２）に従って設定することができる。下記の式（２）における「Ｌ０」は、上限Ｌの最大値を指し、「θ_pitch」は、ｘ軸回りの回転角度を指し、「θ_yaw」は、ｙ軸回りの回転角度を指す。また、「α」および「β」は、θ_pitchおよびθ_yawに付与する重みを指す。

　Ｌ＝Ｌ０／（１＋α｜θ_pitch｜＋β｜θ_yaw｜）・・・（２）

　このように、上記の式（２）に従って摂動の上限Ｌを設定することで、オリジナル顔画像の顔認証のしやすさに相応しい強度のノイズを重畳させることができる。

　合成部７Ｆは、画像の低周波成分および高周波成分を合成する処理部である。例えば、図５に示す例で言えば、合成部７Ｆは、分離部７Ｄにより出力された第１の加工顔画像４３の低周波レイヤ４３Ｌと、第２の加工部７Ｅにより第２の加工が行われた高周波レイヤ４３Ｈ２との合成画像を生成する。これにより得られた第２の加工顔画像４５は、記憶部４に保存される。

　このように第１の加工および第２の加工が行われた第２の加工顔画像４５には、顔画像の非識別化が実現される。図６は、第２の加工顔画像４５の利用シーンの一例を示す図である。図６には、図５に示された第２の加工顔画像４５がＳＮＳへ投稿される例が示されている。図６に示す第２の加工顔画像４５および図２に示すオリジナル顔画像４０Ａによれば、両者が加工前後で同一の人物と視認できる程度に高い視認類似性を有することが明らかである。さらに、図６には、第三者が第２の加工顔画像４５を顔認証に使用する不正アクセスが行われる例が示されている。同図に示すように、顔認証エンジンに用いられる機械学習モデル８Ｍは、入力された第２の加工顔画像４５のクラスを情報処理装置１のユーザ本人に対応するクラスに分類することが困難である。したがって、第２の加工顔画像４５は、顔認証エンジンに用いられる機械学習モデル８Ｍの顔認証を誤認識させる匿名性を有することも明らかである。以上のように、本実施例に係る画像加工機能によれば、視認類似性および匿名性を両立する顔画像の非識別化を実現できる。

　次に、本実施例に係る情報処理装置１の処理の流れについて説明する。図７は、画像加工処理の手順を示すフローチャートである。図７に示すように、撮像部３により顔画像が撮影されると（ステップＳ１０１）、取得部７Ａは、オリジナル顔画像を取得する（ステップＳ１０２）。

　すると、判定部７Ｂは、ステップＳ１０２で取得されたオリジナル顔画像に含まれる顔の向きの正面向きに対する相対角度を算出する（ステップＳ１０３）。その上で、判定部７Ｂは、ステップＳ１０３で算出された顔の向きの相対角度が閾値未満であるか否かを判定する（ステップＳ１０４）。

　このとき、顔の向きの相対角度が閾値未満でない場合（ステップＳ１０４Ｎｏ）、オリジナル顔画像に含まれる顔の正面が撮像部３の撮像面に正対する状態からズレる度合いが大きいことが判明する。この場合、顔画像の非識別化の目的が達せられている可能性が高まるので、判定部７Ｂは、ステップＳ１０２で取得されたオリジナル顔画像を記憶部４へ保存し（ステップＳ１０５）、処理を終了する。

　一方、顔の向きの相対角度が閾値未満である場合（ステップＳ１０４Ｙｅｓ）、オリジナル顔画像に含まれる顔の正面が撮像部３の撮像面に正対する状態からズレる度合いが小さいことが判明するので、顔画像の非識別化の目的が達せられていない可能性が高まる。

　この場合、第１の加工部７Ｃは、ステップＳ１０２で取得された顔のジオメトリ測度、例えば顔の幾何学的な構造に関する特徴（顔パーツの位置関係や形状など）を変更する第１の加工を実行する（ステップＳ１０６）。続いて、分離部７Ｄは、ステップＳ１０６で第１の加工が行われた第１の加工顔画像を周波数で分離する（ステップＳ１０７）。

　そして、第２の加工部７Ｅは、ステップＳ１０３で算出された顔の向きの相対角度に応じて第１の加工顔画像の高周波成分に加える摂動の上限を設定する（ステップＳ１０８）。続いて、第２の加工部７Ｅは、ステップＳ１０７で第１の加工顔画像が周波数分離された低周波成分および高周波成分のうち高周波成分にノイズを加える第２の加工を実行する（ステップＳ１０９）。

　その後、合成部７Ｆは、ステップＳ１０７で分離された第１の加工顔画像の低周波成分と、ステップＳ１０９で第２の加工が行われた高周波成分とを合成することにより、第２の加工顔画像を生成する（ステップＳ１１０）。最後に、合成部７Ｆは、ステップＳ１１０で得られた第２の加工顔画像を記憶部４に保存し（ステップＳ１１１）、処理を終了する。

　なお、図７には、あくまで例示として、画像加工機能がカメラ機能にインプリメントされる利用シーンに対応するフローチャートが示されているが、これは一例に過ぎない。例えば、図７には、顔画像の撮影を行うユーザ操作により処理が起動される例を挙げたが、撮像部３、例えばイメージセンサからの画像入力などのセンサイベントにより処理を起動してもよいし、その他のトリガー、例えばタイマー起動により処理が行われてよい。

　上述してきたように、本実施例に係る画像加工機能は、オリジナル顔画像に含まれる顔の向きの正面向きに対する相対角度が閾値未満である場合、オリジナル顔画像に顔画像の非識別化を実現する加工、例えば第１の加工や第２の加工などを実行する。したがって、本実施例に係る画像加工機能によれば、オリジナル顔画像に対する加工を顔認証しやすい顔画像に絞り込んで実施できる。

　さて、これまで開示の装置に関する実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。そこで、以下では、本発明に含まれる他の実施例を説明する。

＜応用例＞
　例えば、上記の実施例１では、顔の向きの相対角度が閾値未満である場合、第１の加工および第２の加工が実行される例を挙げたが、必ずしも第１の加工および第２の加工の両方が実行されずともよい。例えば、画像加工部７は、第１の加工のみを実行したり、第２の加工のみを実行したりすることができる。この他、画像加工部７は、第１の加工もしくは第２の加工のうち選択していずれか加工を入力されるオリジナル顔画像の情報、例えば顔の向きの相対角度や照明の強度、あるいはブラーの評価値などに応じて切り替えて実行することもできる。

　さらに、上記の実施例１では、第２の加工が第１の加工顔画像の高周波成分に実行される例を挙げたが、第２の加工を第１の加工顔画像の低周波成分にも実行することもできる。この場合、第２の加工は、高周波成分に加える摂動よりも少ない摂動を追加することにより、視認類似性や画質の低下を抑制しつつ、匿名性を高めることができる。

＜機能の分散および統合＞
　また、図示した各装置の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、取得部７Ａ、判定部７Ｂ、第１の加工部７Ｃ、分離部７Ｄ、第２の加工部７Ｅまたは合成部７Ｆを情報処理装置１の外部装置としてネットワーク経由で接続するようにしてもよい。また、取得部７Ａ、判定部７Ｂ、第１の加工部７Ｃ、分離部７Ｄ、第２の加工部７Ｅまたは合成部７Ｆを別の装置がそれぞれ有し、ネットワーク接続されて協働することで、情報処理装置１の機能を実現するようにしてもよい。

＜ハードウェア＞
　また、上記の実施例で説明した各種の処理は、予め用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図８を用いて、実施例１及び実施例２と同様の機能を有する画像加工プログラムを実行するコンピュータの一例について説明する。

　図８は、ハードウェア構成例を示す図である。図８に示すように、コンピュータ１００は、操作部１１０ａと、スピーカ１１０ｂと、カメラ１１０ｃと、ディスプレイ１２０と、通信部１３０とを有する。さらに、このコンピュータ１００は、ＣＰＵ１５０と、ＲＯＭ１６０と、ＨＤＤ１７０と、ＲＡＭ１８０とを有する。これら１１０～１８０の各部はバス１４０を介して接続される。

　ＨＤＤ１７０には、図８に示すように、上記の実施例１で示した画像加工部７と同様の機能を発揮する画像加工プログラム１７０ａが記憶される。この画像加工プログラム１７０ａは、図１に示す画像加工部７の各構成要素と同様、統合又は分離してもかまわない。すなわち、ＨＤＤ１７０には、必ずしも上記の実施例１で示した全てのデータが格納されずともよく、処理に用いるデータがＨＤＤ１７０に格納されればよい。

　このような環境の下、ＣＰＵ１５０は、ＨＤＤ１７０から画像加工プログラム１７０ａを読み出した上でＲＡＭ１８０へ展開する。この結果、画像加工プログラム１７０ａは、図８に示すように、画像加工プロセス１８０ａとして機能する。この画像加工プロセス１８０ａは、ＲＡＭ１８０が有する記憶領域のうち画像加工プロセス１８０ａに割り当てられた領域にＨＤＤ１７０から読み出した各種データを展開し、この展開した各種データを用いて各種の処理を実行する。例えば、画像加工プロセス１８０ａが実行する処理の一例として、図７に示す処理などが含まれる。なお、ＣＰＵ１５０では、必ずしも上記の実施例１で示した全ての処理部が動作せずともよく、実行対象とする処理に対応する処理部が仮想的に実現されればよい。

　なお、上記の画像加工プログラム１７０ａは、必ずしも最初からＨＤＤ１７０やＲＯＭ１６０に記憶されておらずともかまわない。例えば、コンピュータ１００に挿入されるフレキシブルディスク、いわゆるＦＤ、ＣＤ－ＲＯＭ、ＤＶＤディスク、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」に各プログラムを記憶させる。そして、コンピュータ１００がこれらの可搬用の物理媒体から各プログラムを取得して実行するようにしてもよい。また、公衆回線、インターネット、ＬＡＮ、ＷＡＮなどを介してコンピュータ１００に接続される他のコンピュータまたはサーバ装置などに各プログラムを記憶させておき、コンピュータ１００がこれらから各プログラムを取得して実行するようにしてもよい。

　　　１　　情報処理装置
　　　２　　表示入力部
　　　３　　撮像部
　　　４　　記憶部
　　　５　　制御部
　　　７　　画像加工部
　　　７Ａ　取得部
　　　７Ｂ　判定部
　　　７Ｃ　第１の加工部
　　　７Ｄ　分離部
　　　７Ｅ　第２の加工部
　　　７Ｆ　合成部
　　４０　　オリジナル顔画像
　　４３　　第１の加工顔画像
　　４３Ｌ　低周波レイヤ
　　４３Ｈ１，４３Ｈ２　高周波レイヤ
　　４５　　第２の加工顔画像

Claims

　人物の顔を含む画像を取得する取得部と、
　前記画像に含まれる前記顔の向きの正面向きに対する相対角度が閾値未満の場合に、前記画像に対してノイズを付与する加工部と、
　を有することを特徴とする画像加工装置。
　前記加工部は、前記画像に対して、前記画像内の周波数成分が閾値以上の領域に対して前記ノイズを付与する、
　ことを特徴とする請求項１に記載の画像加工装置。
　前記加工部は、前記顔の向きの正面向きに対する相対角度に応じて、前記画像に付与するノイズの上限を変更する、
　ことを特徴とする請求項１に記載の画像加工装置。
　前記加工部は、前記相対角度が減少するに連れて値が大きい上限を設定するか、あるいは前記相対角度が増加するに連れて値が小さい上限を設定する、
　ことを特徴とする請求項３に記載の画像加工装置。
　前記加工部は、前記画像に含まれる前記顔を形成するパーツの位置関係または形状を変更する加工をさらに実行する、
　ことを特徴とする請求項１に記載の画像加工装置。
　人物の顔を含む画像を取得する取得部と、
　前記画像内の周波数成分が閾値以上の領域に対してノイズを付与する加工部と、
　を有することを特徴とする画像加工装置。
　人物の顔を含む画像を取得し、
　前記画像に含まれる前記顔の向きの正面向きに対する相対角度が閾値未満の場合に、前記画像に対してノイズを付与する、
　処理をコンピュータが実行することを特徴とする画像加工方法。
　前記付与する処理は、前記画像に対して、前記画像内の周波数成分が閾値以上の領域に対して前記ノイズを付与する処理を含む、
　ことを特徴とする請求項７に記載の画像加工方法。
　前記付与する処理は、前記顔の向きの正面向きに対する相対角度に応じて、前記画像に付与するノイズの上限を変更する処理を含む、
　ことを特徴とする請求項７に記載の画像加工方法。
　前記付与する処理は、前記相対角度が減少するに連れて値が大きい上限を設定するか、あるいは前記相対角度が増加するに連れて値が小さい上限を設定する処理を含む、
　ことを特徴とする請求項９に記載の画像加工方法。
　前記画像に含まれる前記顔を形成するパーツの位置関係または形状を変更する処理を前記コンピュータがさらに実行する、
　ことを特徴とする請求項７に記載の画像加工方法。
　人物の顔を含む画像を取得し、
　前記画像に含まれる前記顔の向きの正面向きに対する相対角度が閾値未満の場合に、前記画像に対してノイズを付与する、
　処理をコンピュータに実行させることを特徴とする画像加工プログラム。
　前記付与する処理は、前記画像に対して、前記画像内の周波数成分が閾値以上の領域に対して前記ノイズを付与する処理を含む、
　ことを特徴とする請求項１２に記載の画像加工プログラム。
　前記付与する処理は、前記顔の向きの正面向きに対する相対角度に応じて、前記画像に付与するノイズの上限を変更する処理を含む、
　ことを特徴とする請求項１２に記載の画像加工プログラム。
　前記付与する処理は、前記相対角度が減少するに連れて値が大きい上限を設定するか、あるいは前記相対角度が増加するに連れて値が小さい上限を設定する処理を含む、
　ことを特徴とする請求項１４に記載の画像加工プログラム。
　前記画像に含まれる前記顔を形成するパーツの位置関係または形状を変更する処理を前記コンピュータにさらに実行させる、
　ことを特徴とする請求項１２に記載の画像加工プログラム。