JP2022034752A

JP2022034752A - 情報処理装置、情報処理方法、及びプログラム

Info

Publication number: JP2022034752A
Application number: JP2020138602A
Authority: JP
Inventors: 茂之酒澤; Shigeyuki Sakasawa; 絵美明堂; Emi Meido; 和之田坂; Kazuyuki Tasaka
Original assignee: KDDI Corp
Current assignee: KDDI Corp
Priority date: 2020-08-19
Filing date: 2020-08-19
Publication date: 2022-03-04
Anticipated expiration: 2040-08-19
Also published as: JP7339219B2

Abstract

【課題】ニューラルネットワーク学習モデルが他のニューラルネットワークの学習モデルに依拠しているか否かを推定する。【解決手段】モデル取得部３０は、ニューラルネットワークの学習モデルである第１学習モデルを取得する。層選択部３１は、第１学習モデルの層の中から層を選択する。第１取得部３２０は、検査用の入力データセットのデータを第１学習モデルに入力した場合における選択された層の入力層側の隣接層に入力される入力値を取得する。第２取得部３２１は、検査用の入力データセットのデータを改変の検査対象となる第２学習モデルに入力したときの出力値を取得する。学習部３３は、出力値を入力したときに入力値を出力する逆フィルタを学習する。評価部３４は、逆フィルタの精度を示す情報とパラメータの変動と学習の収束回数を示す情報とに基づく評価値を算出する。推定部３５は、評価値の変動を解析して、改変の有無を推定する。【選択図】図２

Description

本発明は、情報処理装置、情報処理方法、及びプログラムに関する。

近年、ＣＰＵ（Central Processing Unit）及びＧＰＵ（Graphics Processing Unit）の高速化、メモリの大容量化、及びニューラルネットワークを用いた機械学習技術が急速に進んできている。このため、数十万から百万といったオーダーの学習データを用いる機械学習が可能となり、精度の高い認識技術や分類技術が確立されつつある。

大量の学習データに基づく機械学習を実行するためには大量の計算コストがかかる。また、大量の学習データを用意すること、及び用意した学習データを機械学習に用いるためにする前処理にも膨大な労力を要する。このため、機械学習によって生成された学習モデルは一種の知的財産とも言える。

一方で、ニューラルネットワークを用いた機械学習によって生成された学習モデルはデジタルデータであり、その複製は容易である。そのため、その知的財産を守るための一つの方法として、学習モデルの中に電子透かしを埋め込む技術がある（例えば、非特許文献１を参照）。

J. Zhang, Z. Gu, J. Jang, H. Wu, M.P. Stoechlin, H.Huang and I. Molloy, "Protecting intellectual property of deep neural networks with watermarking," Proc. ACM ASIACCS2018, pp.159-172, 2018.

上記のような透かし埋め込み技術は、特定の入力データ（トリガ）を入力すると、入力データに対応する特定の出力ラベル（透かしデータ）を出力するように学習されている。このため、例えば転移学習等の手法によって学習モデルが再学習されると、透かしデータが消去されかねない。

本発明はこれらの点に鑑みてなされたものであり、ニューラルネットワーク学習モデルが他のニューラルネットワークの学習モデルに依拠しているか否かを推定するための技術を提供することを目的とする。

本発明の第１の態様は、情報処理装置である。この装置は、複数の層から構成されるニューラルネットワークの学習モデルである第１学習モデルを取得するモデル取得部と、前記第１学習モデルの層の中から所定の順番で層を選択する層選択部と、検査用の入力データセットのデータを前記第１学習モデルに入力した場合における選択された前記層の入力層側の隣接層に入力される入力値を取得する第１取得部と、前記データを前記第１学習モデルの出力層を含む少なくとも一部を改変した学習モデルであるか否かの検査対象となる第２学習モデルに入力したとき前記第２学習モデルの出力層から出力される出力値を取得する第２取得部と、前記出力値を入力したときに前記入力値を出力する新たなニューラルネットワークの学習モデルである逆フィルタを学習する学習部と、前記逆フィルタのパラメータの変動の大小を示す情報と、前記逆フィルタの学習が収束するまでの学習回数を示す情報と、前記逆フィルタの精度を示す情報との少なくとも一つの情報に基づく評価値を算出する評価部と、前記評価値の変動を解析して、前記改変の有無を推定する推定部と、を備える。

前記学習部は、前記逆フィルタの出力層のパラメータを、選択された前記層の入力層側の隣接層に関する逆フィルタのパラメータとなるように初期化して学習してもよい。

前記学習部は、前記逆フィルタの出力層のパラメータを乱数で初期化した場合の第１学習と、選択された前記層の入力層側の隣接層に関する逆フィルタとなるように初期化した場合の第２学習と、を実行してもよく、前記推定部は、前記第１学習における前記評価値と前記第２学習における前記評価値との差の変動を解析して前記改変の有無を推定してもよい。

前記推定部は、前記評価値の変動を解析して、前記第１学習モデルのうち改変された層を推定してもよい。

前記第１学習モデルは、透かし検出用データを入力したとき当該透かし検出用データに対応する透かしデータを出力するように学習された学習モデルであってもよく、前記情報処理装置は、前記第２学習モデルの出力層の後段に前記逆フィルタを接続するとともに、前記逆フィルタの出力層に替えて前記第２学習モデルで改変された層に相当する前記第１学習モデルの改変前の層を接続した連結モデルを生成する連結モデル生成部と、前記連結モデルに前記透かし検出用データを入力して得られる出力値と、前記透かし検出用データに対応する透かしデータとの一致度を算出する改変度算出部と、をさらに備えてもよい。

前記層選択部は、前記第１学習モデルの出力層から入力層に向かって順番に層を選択してもよい。

本発明の第２の態様は、情報処理方法である。この方法において、プロセッサが、複数の層から構成されるニューラルネットワークの学習モデルである第１学習モデルを取得するステップと、前記第１学習モデルの層の中から所定の順番で層を選択するステップと、検査用の入力データセットのデータを前記第１学習モデルに入力した場合における選択された前記層の入力層側の隣接層に入力される入力値を取得するステップと、前記データを前記第１学習モデルの出力層を含む少なくとも一部を改変した学習モデルであるか否かの検査対象となる第２学習モデルに入力したとき前記第２学習モデルの出力層から出力される出力値を取得するステップと、前記出力値を入力したときに前記入力値を出力する新たなニューラルネットワークの学習モデルである逆フィルタを学習するステップと、前記逆フィルタのパラメータの変動の大小を示す情報と、前記逆フィルタの学習が収束するまでの学習回数を示す情報と、前記逆フィルタの精度を示す情報との少なくとも一つの情報に基づく評価値を算出するステップと、前記評価値の変動を解析して、前記改変の有無を推定するステップと、を実行する。

本発明の第３の態様は、プログラムである。このプログラムは、コンピュータに、複数の層から構成されるニューラルネットワークの学習モデルである第１学習モデルを取得する機能と、前記第１学習モデルの層の中から所定の順番で層を選択する機能と、検査用の入力データセットのデータを前記第１学習モデルに入力した場合における選択された前記層の入力層側の隣接層に入力される入力値を取得する機能と、前記データを前記第１学習モデルの出力層を含む少なくとも一部を改変した学習モデルであるか否かの検査対象となる第２学習モデルに入力したとき前記第２学習モデルの出力層から出力される出力値を取得する機能と、前記出力値を入力したときに前記入力値を出力する新たなニューラルネットワークの学習モデルである逆フィルタを学習する機能と、前記逆フィルタのパラメータの変動の大小を示す情報と、前記逆フィルタの学習が収束するまでの学習回数を示す情報と、前記逆フィルタの精度を示す情報との少なくとも一つの情報に基づく評価値を算出する機能と、前記評価値の変動を解析して、前記改変の有無を推定する機能と、を実現させる。

本発明の第４の態様も、情報処理装置である。この装置は、複数の層から構成されるニューラルネットワークの学習モデルであってあらかじめ透かしが埋め込まれている第１学習モデルを取得するモデル取得部と、前記第１学習モデルを構成する層のうち、前記第１学習モデルの出力層を含む少なくとも一部を改変した学習モデルであるか否かの検査対象となる第２学習モデルと共通する層である共通層の指定を受け付ける共通層受付部と、検査用の入力データセットのデータを前記第１学習モデルに入力した場合における前記共通層の出力値である第１出力値を取得する第１取得部と、前記データを前記第２学習モデルに入力したとき前記第２学習モデルの出力層から出力される出力値である第２出力値を取得する第２取得部と、前記第２出力値を入力したときに前記第１出力値を出力する新たなニューラルネットワークの学習モデルである逆フィルタを学習する学習部と、前記第２学習モデルの出力層の後段に前記逆フィルタを接続するとともに、前記逆フィルタの後段に前記第１学習モデルを構成する層のうち前記共通層を除く層を接続した連結モデルを生成する連結モデル生成部と、前記連結モデルに透かし検出用データを入力して得られる出力値と、前記透かし検出用データに対応する透かしデータとの一致度を算出する改変度算出部と、を備える。

上記のプログラムを提供するため、あるいはプログラムの一部をアップデートするために、このプログラムを記録したコンピュータ読み取り可能な記録媒体が提供されてもよく、また、このプログラムが通信回線で伝送されてもよい。

なお、以上の構成要素の任意の組み合わせ、本発明の表現を方法、装置、システム、コンピュータプログラム、データ構造、記録媒体などの間で変換したものもまた、本発明の態様として有効である。

本発明によれば、ニューラルネットワーク学習モデルが他のニューラルネットワークの学習モデルに依拠しているか否かを推定することができる。

実施の形態に係る情報処理装置が実行する処理の概要を説明するための図である。実施の形態に係る情報処理装置の機能構成を模式的に示す図である。実施の形態に係る学習部が実行する逆フィルタの学習を説明するための図である。逆フィルタの学習における第１学習と第２学習との評価値の変動を模式的に示す図である。実施の形態に係る連結モデル生成部が生成する連結モデルを模式的に示す図である。実施の形態に係る情報処理装置が実行する情報処理の流れを説明するためのフローチャートである。実施の形態の変形例に係る情報処理装置の機能構成を模式的に示す図である。

＜実施の形態の概要＞
本発明の実施の形態に係る情報処理装置の概要を述べる。実施の形態に係る情報処理装置は、ニューラルネットワークの学習モデルの後段部分を構成する１又は複数の層について、その層の逆フィルタを学習する。ニューラルネットワークの学習モデルを構成する１又は複数の層の入力データをベクトルｘ、出力データをベクトルｙとすると、１又は複数の層は、ベクトルｘをベクトルｙに変換する関数Ｆ（ｙ＝Ｆ（ｘ））と抽象化することができる。実施の形態に係る情報処理装置は、１又は複数の層を変更しながらＦの逆フィルタ、すなわち、ｘ＝Ｆ^－１（ｙ）を学習し、学習が収束するまでの学習回数やその収束にかかる時間、パラメータの変化量、及び学習によって得られた逆フィルタの精度等を評価する評価値を算出する。

ここで、実施の形態に係る情報処理装置は、特定の学習モデルを構成する層のパラメータから算出した値を用いて、逆フィルタを構成する層の少なくとも一部のパラメータの初期値を設定する。本願の発明者は、汎化性能が高くならないように逆フィルタを設計しても、逆フィルタの生成を試みる学習モデルが特定の学習モデルに依拠してその学習モデルの後段部分を改変したものである場合、逆フィルタを学習できることを実験により見出した。また、汎化性能が高くならないように逆フィルタを設計することにより、逆フィルタの生成を試みる学習モデルが特定の学習モデルに依拠してその学習モデルの後段部分を改変したものである場合と、特定の学習モデルと無関係な学習モデルの場合とでは、逆フィルタの学習が収束するまでの学習回数やその収束にかかる時間、学習によって変更されるモデルパラメータの変更量や学習によって得られた逆フィルタの精度等に差が出ることを実験により見出した。

そこで、実施の形態に係る情報処理装置は、１又は複数の層を変更しながら算出した評価値の変動を解析することにより、逆フィルタの生成を試みる学習モデルが特定の学習モデルに依拠したモデルか否かを推定する。

図１（ａ）－（ｅ）は、実施の形態に係る情報処理装置が実行する処理の概要を説明するための図である。図１（ａ）は、一般的なニューラルネットワークの学習モデルである第１学習モデルＭを説明するための模式図である。図１（ａ）に示すように、第１学習モデルＭは、入力層と出力層とを含む複数の層から構成されている。既知の技術であるため詳細な説明は省略するが、第１学習モデルＭは、入力Ｉが入力されると、入力Ｉに対応する何らかの出力Ｏ１を出力するように学習されている。例えば、第１学習モデルＭが画像認識用の学習モデルである場合、第１学習モデルＭに画像データである入力Ｉを入力すると、入力Ｉに含まれる被写体を示すラベルが出力Ｏ１として出力される。

図１（ｂ）は、図１（ａ）に示す第１学習モデルＭに依拠しつつ、第１学習モデルＭの後段層が改変された第２学習モデルＰを示す図である。具体的には、図１（ｂ）に示す第２学習モデルＰは、図１（ａ）に示す第１学習モデルＭの後段３層が改変層Ｐ１となっており、残りの層は第１学習モデルＭと共通する共通層Ｍ１である。改変層Ｐ１は第１学習モデルＭの後段３層とは異なるため、第２学習モデルＰに入力Ｉを入力しても、その出力は出力Ｏ１とは異なる出力Ｏ２となる。

このような第１学習モデルＭの一部の改変は、転移学習やファインチューニングとして知られる既知の技術によって実現できる。第１学習モデルＭを１から作成するために要する時間及び手間と比較して、第１学習モデルＭに依拠して第２学習モデルＰを作成するために要する時間及び手間は一般に非常に少ないにもかかわらず、第２学習モデルＰは第１学習モデルＭと同様の認識性能が得られると言われている。このため、第１学習モデルＭの作成者は、作成にコストを要した第１学習モデルＭが他者に盗用されることを抑制したいという要求がある。

そこで、第１学習モデルＭの作成者は、第１学習モデルＭの出所を明らかにするために、第１学習モデルＭに電子的な透かしデータを埋め込むことがよく行われている。具体的には、複数の透かし検出用の入力Ｉと、透かし検出用入力データそれぞれに対応する出力Ｏとを用意し、第１学習モデルＭが透かし検出用の入力Ｉに対して対応する出力Ｏを出力するように学習する。しかしながら、第１学習モデルＭの後段層が改変されるとその出力Ｏも変わってしまうため、透かし検出が困難となりかねない。

第２学習モデルＰ自体が公開されている場合、第１学習モデルＭの作成者は、第２学習モデルＰを入手して前段層を解析することにより、盗用の有無を判定できる。しかしながら、第２学習モデルＰ自体は公開されず、例えば、入出力用のＡＰＩ（Application Programming Interface）のみが公開されているような場合、第１学習モデルＭの作成者は第２学習モデルＰを入手することは困難となる。そこで、実施の形態に係る情報処理装置は、第２学習モデルＰの後段層の逆フィルタを学習し、その学習過程を解析することで、第２学習モデルＰが第１学習モデルＭに依拠して作成された学習モデルであるか否かを推定する。

図１（ｃ）は、第１学習モデルＭの後段２層の逆フィルタの学習を説明するための図である。また、図１（ｄ）は第１学習モデルＭの後段３層の逆フィルタの学習を説明するための図である。説明の便宜上、以下本明細書において、第１学習モデルＭに依拠して後段層を改変した第２学習モデルＰにおいて、改変した後段層と、第１学習モデルＭを流用する前段層との境界面、すなわち共通層と改変層との境界面を「Ｚ面」と呼ぶこととする。図１（ｂ）の例では、出力層から数えて３層目と４層目との間にＺ面が存在する。

図１（ｃ）は、出力層から数えて２層目と３層目との間がＺ面であると仮定した場合の例であり、仮定が正しくない場合の例である。第１学習モデルＭの作成者は第１学習モデルＭを所持しているため、第１学習モデルＭに入力Ｉを入力したとき、Ｚ面での出力ｍ１を算出することができる。また、第１学習モデルＭの作成者は、第２学習モデルＰのＡＰＩを利用して、第２学習モデルＰに入力Ｉを入力した場合の出力Ｏ２を取得する。実施の形態に係る情報処理装置は、出力Ｏ２を入力したときに、Ｚ面での出力ｍ１を出力するように、逆フィルタＩＦ１を学習によって生成する。

図１（ｄ）は、出力層から数えて３層目と４層目との間がＺ面であると仮定した場合の例であり、仮定が正しい場合の例である。図１（ｃ）に示す例と同様に、実施の形態に係る情報処理装置は、第２学習モデルＰに入力Ｉを入力した場合の出力Ｏ２を入力したとき、第１学習モデルＭのＺ面での出力ｍ２を出力するように、逆フィルタＩＦ２を学習によって生成する。

図１（ｅ）は、逆フィルタＩＦの学習と、その学習に関する評価値との関係をグラフ形式で模式的に示す図である。図１（ｅ）のグラフにおいて、横軸はＺ面として仮定する位置を示し、縦軸はそのときの逆フィルタＩＦの学習及び逆フィルタＩＦの精度に関する評価値を示している。図１（ｅ）のグラフは、細い実線は第２学習モデルＰが第１学習モデルＭに依拠していない場合の評価値の変動を示しており、太い実線は第２学習モデルＰが第１学習モデルＭに依拠している場合の評価値の変動を示している。

詳細は後述するが、本願の発明者は、逆フィルタＩＦを構成するパラメータの初期値を工夫することにより、第２学習モデルＰが第１学習モデルＭに依拠している場合はＺ面の前後において評価値を大きく変動させることができることを実験により見出した。そのため、実施の形態に係る情報処理装置は、評価値の変動を解析することにより、第２学習モデルＰが第１学習モデルＭに依拠しているか否か、すなわち、第１学習モデルＭの改変の有無を推定することができる。

＜実施の形態に係る情報処理装置１の機能構成＞
図２は、実施の形態に係る情報処理装置１の機能構成を模式的に示す図である。情報処理装置１は、記憶部２と制御部３とを備える。図２において、矢印は主なデータの流れを示しており、図２に示していないデータの流れがあってもよい。図２において、各機能ブロックはハードウェア（装置）単位の構成ではなく、機能単位の構成を示している。そのため、図２に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に分かれて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。

記憶部２は、情報処理装置１を実現するコンピュータのＢＩＯＳ（Basic Input Output System）等を格納するＲＯＭ（Read Only Memory）や情報処理装置１の作業領域となるＲＡＭ（Random Access Memory）、ＯＳ（Operating System）やアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報を格納するＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等の大容量記憶装置である。

制御部３は、情報処理装置１のＣＰＵやＧＰＵ等のプロセッサであり、記憶部２に記憶されたプログラムを実行することによってモデル取得部３０、層選択部３１、値取得部３２、学習部３３、評価部３４、推定部３５、連結モデル生成部３６、及び改変度算出部３７として機能する。値取得部３２は、第１取得部３２０と第２取得部３２１とを含む。

なお、図２は、情報処理装置１が単一の装置で構成されている場合の例を示している。しかしながら、情報処理装置１は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部３を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。

モデル取得部３０は、複数の層から構成されるニューラルネットワークの学習モデルである第１学習モデルＭを取得する。モデル取得部３０は、あらかじめ記憶部２が第１学習モデルＭを格納している場合には、第１学習モデルＭを記憶部２から読み出して取得する。モデル取得部３０は、インターネット等のネットワークを介して、第１学習モデルＭをオンラインで取得してもよい。

層選択部３１は、第１学習モデルＭの層の中から所定の順番で層を選択する。例えば、層選択部３１は、第１学習モデルＭの出力層から入力層に向かって順番に層を選択する。あるいは、情報処理装置１は、出力層から入力層に向かって所定の数の層をランダムに選択してもよいし、出力層側の層からと入力側の層からとを交互に挟み込むように当該層を選択してもよい。

第１取得部３２０は、検査用の入力データセットのデータを第１学習モデルＭに入力した場合における選択された層に入力される入力値を取得する。例えば、図１（ｃ）に示す例において、出力層から数えて２層目が層選択部３１によって選択されたとする。この場合、出力層から数えて３層目の出力値である出力ｍ１が、出力層から数えて２層目の入力値となる。第１取得部３２０が取得する検査用の入力データセットとは、例えば、第１学習モデルＭの透かし埋め込みに用いた複数の透かし検出用の入力Ｉである。検査用の入力データセットは、モデル取得部３０が第１学習モデルＭとともに取得する。

第２取得部３２１は、検査用の入力データセットのデータを第２学習モデルＰに入力したとき第２学習モデルＰの出力層から出力される出力値を取得する。ここで、第２学習モデルＰは、第１学習モデルＭの出力層を含む少なくとも一部を改変した学習モデルであるか否かの検査対象となる学習モデルである。第２取得部３２１は、例えば第２学習モデルＰのＡＰＩを利用して、検査用の入力データセットのデータを第２学習モデルＰに入力したときの出力値を取得する。

学習部３３は、第２取得部３２１が取得した第２学習モデルＰの出力値を入力したときに、層選択部３１が選択した層に入力される入力値を出力するような新たなニューラルネットワークの学習モデルである逆フィルタＩＦを学習する。評価部３４は、逆フィルタＩＦのパラメータの変動の大小を示す情報と、逆フィルタＩＦの学習が収束するまでの学習回数を示す情報と、逆フィルタＩＦの精度を示す情報との少なくとも一つの情報に基づく評価値を算出する。

具体的には、評価部３４は、逆フィルタＩＦの学習の収束回数Ｔを計測する。また、評価部３４は、学習前の逆フィルタＩＦを構成するパラメータ、すなわち逆フィルタＩＦのパラメータの初期値の総和と、学習が収束した後の逆フィルタＩＦのパラメータの総和との差を差分Ｄとして算出する。さらに、評価部３４は、逆フィルタＩＦの学習前後の出力値と正解値との差を学習の精度Ｒとして算出する。評価部３４は、例えば、評価部３４は、α、β、及びγを０以上の実数として、評価値Ｅを以下の式（１）に基づいて算出する。

評価値Ｅ＝αＴ＋βＤ＋γＲ（１）
ただし、α＋β＋γ＞０、α≧０、β≧０、γ≧０

式（１）は、逆フィルタの学習が収束するまでの学習回数が少ないほど、差分Ｄが小さいほど、また、逆フィルタＩＦの精度Ｒが高い（すなわち、学習前後の出力値と正解値との差が小さい）ほど、評価値Ｅは小さくなる。評価部３４は、層選択部３１が選択した層を示す情報と算出した評価値とを紐づけて、記憶部２に格納する。式（１）においてα＋β＋γ＞０、α≧０、β≧０、かつγ≧＝０であるため、αとβとγとが同時に０になることはない。

推定部３５は、層選択部３１が層を選択する度に評価部３４が算出した評価値Ｅの変動を解析して、第２学習モデルＰが第１学習モデルＭの一部を改変して作成された学習モデルであるか否か、すなわち層選択部３１が選択した層の改変の有無を推定する。具体的には、推定部３５は、評価値Ｅの値の変動が所定値以上（例えば、５０％以上の変動がある場合）、改変が有ると判定する。なお、所定値の具体的な値は一例であり、第１学習モデルＭの層の構造等を考慮して実験により定めればよい。

図３（ａ）－（ｃ）は、実施の形態に係る学習部３３が実行する逆フィルタＩＦの学習を説明するための図である。具体的には、図３（ａ）は真のＺ面の位置を示す図である。図３（ａ）に示す例では、Ｚ面は、出力層ｌ１から入力層（不図示）に向かって４番目の層ｌ４と、５番目の層ｌ５との間にある。Ｚ面が層ｌ４と層ｌ５との間にある場合、第２学習モデルＰの層ｌ５を構成するパラメータは第１学習モデルＭの５番目の層ｌ５と同一であるが、出力層ｌ１から４番目の層ｌ４までの層を構成するパラメータは改変されていることになる。

図３（ａ）において、５番目の層ｌ５の出力値、すなわち４番目の層ｌ４の入力値をデータｍ５４と記載する。データｍ５４は、５番目の層ｌ５と４番目の層ｌ４との間を流れるデータである。同様に、４番目の層ｌ４と３番目の層ｌ３の間を流れるデータをｍ４３と記載する。以下同様である。

図３（ｂ）は、層選択部３１が４番目の層ｌ４を選択した場合の例を示している。この場合、Ｚ面は５番目の層ｌ５と４番目の層ｌ４との間にあり、真のＺ面と一致する。第２学習モデルＰにおいて、出力層から４番目の層までの層のパラメータは改変されているため、図３（ｂ）では、層の表記を変更し、出力層を層ｐ１、２番目の層を層ｐ２、３番目の層を層ｐ３、４番目の層を層ｐ４と記載している。第２学習モデルＰにおいて、出力層から４番目の層までの層のパラメータは改変されているため、第２学習モデルＰの４番目の層ｌ４と３番目の層ｌ３の間を流れるデータの値は、第１学習モデルＭの４番目の層ｌ４と３番目の層ｌ３の間を流れるデータｍ４３とは異なり、ｍ４３＊となる。他の層間を流れるデータの値も同様である。

図３（ｂ）に示すように、学習部３３は、第２学習モデルＰの出力の値ｏ２を入力したときに、Ｚ面の入力層側の隣接層である層Ｉ５の入力値であるデータｍ６５を出力するように逆フィルタＩＦを学習する。図３（ｂ）では、層ｐ１から層ｐ４までの４層が改変していると仮定しているため、逆フィルタＩＦは、層ｆ１から層ｆ５までの５層となる。なお、Ｚ面の入力層側の隣接層は、図３（ｂ）のように層ｌ５の１層のみでなくてもよい。例えば、層ｌ５～層ｌ６（不図示）の２層や層ｌ５から層ｌ７（不図示）までの３層としてもよい。それらの場合には、逆フィルタＩＦは、それぞれ、層ｆ１から層ｆ６までの６層や層ｆ１から層ｆ７までの７層となる。

ここで、学習部３３は、逆フィルタＩＦの出力層のパラメータを、層選択部３１が選択した層の入力層側の隣接層に関する逆フィルタのパラメータとなるように初期化して学習する。

図３（ｂ）に示すように、第２学習モデルＰの４番目の層ｐ４は、第１学習モデルＭの５番目の層ｌ５と隣接している。したがって、図３（ｂ）に示す例では、学習部３３は、逆フィルタＩＦの５番目の層ｆ５の初期値を、第１学習モデルＭの５番目の層ｌ５の逆フィルタＩＦのパラメータで初期化する。第１学習モデルＭの５番目の層ｌ５の逆フィルタはＺ面を流れるデータｍ５４が入力となることが想定されているため、上記の初期化は良い初期化と言える。つまり、学習部３３が逆フィルタＩＦの５番目の層ｆ５を第１学習モデルＭの５番目の層ｌ５の逆フィルタのパラメータで初期化する場合と、単に乱数で初期化する場合とを比較すると、前者の方が後者よりもパラメータの変更が少なく、逆フィルタＩＦの精度が高く、かつ学習の収束回数が少ないこと（言い換えると、学習の収束時間が短いこと）が期待できる。

図３（ｃ）は、層選択部３１が３番目の層ｌ３を選択した場合の例を示している。この場合、Ｚ面は４番目の層ｌ４と３番目の層ｌ３との間にあることを想定していることになり、真のＺ面と一致しない。このとき、図３（ｂ）に示す例と同様に、学習部３３は、逆フィルタＩＦの出力層のパラメータを、層選択部３１が選択した層の入力層側の隣接層（すなわち、第１学習モデルＭの４番目の層Ｉ４）に関する逆フィルタのパラメータとなるように初期化して学習する。

ここで、第１学習モデルＭの４番目の層ｌ４の逆フィルタはデータｍ４３が入力となることが想定されているが、逆フィルタＩＦの４番目の層ｆ４（逆フィルタＩＦの出力層）の入力はデータｍ３４であり、ｍ４３＊を再現するデータである。したがって、逆フィルタＩＦの出力層を第１学習モデルＭの４番目の層Ｉ４の逆フィルタのパラメータで初期化しても、想定される入力が異なるため良い初期化とは言えない。つまり、学習部３３が逆フィルタＩＦの４番目の層ｆ４を第１学習モデルＭの４番目の層ｌ４の逆フィルタのパラメータで初期化する場合と、単に乱数で初期化する場合とを比較すると、逆フィルタＩＦの精度やパラメータの変更量及び学習の収束に要する学習回数に差が生じることは期待できない。

そこで、学習部３３は、逆フィルタＩＦの出力層のパラメータを乱数で初期化した場合の第１学習と、層選択部３１が選択した層の入力層側の隣接層に関する逆フィルタとなるように初期化した場合の第２学習との２つの学習を実行する。推定部３５は、第１学習における評価値と第２学習における評価値との差の変動を解析して改変の有無を推定する。

図４は、逆フィルタＩＦの学習における第１学習と第２学習との評価値の変動を模式的に示す図であり、第２学習モデルＰが第１学習モデルＭに依拠している場合における第１学習と第２学習との評価値の変動を示す図である。具体的には、図４において、太い実線は第１学習における評価値の変動を示しており、細い実線は第２学習における評価値の変動を示している。

図４に示すように、第２学習モデルＰが第１学習モデルＭに依拠している場合、第１学習における評価値はＺ面前後で有意に異なる。図示はしないが、第２学習モデルＰが第１学習モデルＭに依拠していない場合、第１学習における評価値はＺ面前後で変動せず、第２学習における評価値と同様な振る舞いとなる。したがって、推定部３５は、第１学習における評価値と第２学習における評価値との差の変動を解析することにより、第２学習モデルＰが第１学習モデルＭを改変したモデルであるか否かを推定することができる。

さらに、推定部３５は、評価部３４が算出した評価値の変動を解析して、第１学習モデルのうち改変された層を推定することもできる。具体的には、推定部３５は、図４に示す選択層と評価値とのグラフにおいて、第１学習における評価値の差が大きい箇所からＺ面を推定し、改変された層を推定することができる。

この実現を容易とするために、層選択部３１は、第１学習モデルの出力層から入力層に向かって順番に層を選択してもよい。これにより、推定部３５は、第１学習モデルの出力層から入力層に向かって順番に層を選択した場合の評価値を解析し、上述した評価値の差が有意に異なった時点で学習を停止することができる。なお、推定部３５がＺ面を推定することにより、第２学習モデルＰのうち改変された改変層も推定できる。

以上、推定部３５による改変の有無の推定、Ｚ面の推定、及び逆フィルタＩＦの推定について説明した。続いて、第２学習モデルＰが第１学習モデルＭを改変した学習モデルであることを特定する手法について説明する。

上述したように、第１学習モデルＭは、透かし検出用データを入力したときその透かし検出用データに対応する透かしデータを出力するように学習された学習モデルであるとする。このとき、連結モデル生成部３６は、まず、第２学習モデルＰの出力層の後段に逆フィルタＩＦを接続する。続いて、連結モデル生成部３６は、逆フィルタＩＦの出力層に替えて第２学習モデルＰで改変された層に相当する第１学習モデルＭの改変前の層を接続した連結モデルを生成する。

図５は、実施の形態に係る連結モデル生成部３６が生成する連結モデルを模式的に示す図である。図５に示すように、改変層の出力は第２学習モデルＰの出力となるため、その値はｏ２である。逆フィルタＩＦの学習が成功している場合、逆フィルタＩＦに値ｏ２を入力すると、Ｚ面を流れるデータ、すなわち５番目の層Ｉ５と４番目の層Ｉ４との間を流れるデータｍ５４を出力することが期待できる。改変前の層は、データｍ５４を入力すると、第１学習モデルＭの最終的な出力値である値ｏ１を出力する。

改変度算出部３７は、連結モデル生成部３６が生成した連結モデルに透かし検出用データを入力して得られる出力値と、透かし検出用データに対応する透かしデータとの一致度を算出する。

本願の発明者は、逆フィルタＩＦの汎化性能が低い場合であっても、第２学習モデルＰが第１学習モデルＭに依拠して作成されている場合には、学習部３３は改変層の逆フィルタＩＦを学習できることを実験により見出した。このため、連結モデル生成部３６が生成した連結モデルに透かし検出用データを入力して得られる出力値は、改変前の学習モデル、すなわち第１学習モデルＭの出力値に類似することが期待できる。したがって、改変度算出部３７が連結モデル生成部３６によって生成された連結モデルに透かし検出用データを入力して得られる出力値と、透かし検出用データに対応する透かしデータとの一致度を算出することにより、第２学習モデルＰが第１学習モデルＭを改変した学習モデルであることを特定する。

ここで、改変度算出部３７は、算出した一致度が所定の閾値（例えば８０％）以上の一致度である場合、第２学習モデルＰが第１学習モデルＭを改変した学習モデルであることを特定する。この所定の閾値の具体的な値は一例であり、第１学習モデルＭの層の複雑さ（すなわち、逆フィルタＩＦの学習の困難性）等を考慮して実験等により定めればよい。

＜情報処理装置１が実行する情報処理方法の処理フロー＞
図６は、実施の形態に係る情報処理装置１が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置１が起動したときに開始する。

モデル取得部３０は、複数の層から構成されるニューラルネットワークの学習モデルである第１学習モデルＭを取得する（Ｓ２）。層選択部３１は、第１学習モデルＭの層の中から所定の順番で層を選択する（Ｓ４）。

層選択部３１による層の選択が終了するまでの間（Ｓ６のＮｏ）、第１取得部３２０は、検査用の入力データセットのデータを第１学習モデルＭに入力した場合における選択された層の入力層側の隣接層に入力される入力値を取得する（Ｓ８）。第２取得部３２１は、検査用の入力データセットのデータを第２学習モデルＰに入力したとき第２学習モデルＰの出力層から出力される出力値を取得する（Ｓ１０）。

学習部３３は、第２取得部３２１が取得した出力値を入力したときに、第１取得部３２０が取得した入力値を出力する新たなニューラルネットワークの学習モデルである逆フィルタＩＦを学習する（Ｓ１２）。評価部３４は、式（１）に基づいて評価値を算出する（Ｓ１４）。情報処理装置１は、層選択部３１による層の選択が終了するまでの間（Ｓ６のＮｏ）、ステップＳ８の処理からステップＳ１４の処理までを繰り返す。

層選択部３１による層の選択が終了すると（Ｓ６のＹｅｓ）、推定部３５は、評価部３４が算出した評価値の変動を解析して改変の有無を推定する（Ｓ１６）。推定部３５が改変の有無を推定すると、本フローチャートにおける処理は終了する。

＜実施の形態に係る情報処理装置１が奏する効果＞
以上説明したように、実施の形態に係る情報処理装置１によれば、ニューラルネットワーク学習モデルが他のニューラルネットワークの学習モデルに依拠しているか否かを推定することができる。

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果をあわせ持つ。以下、そのような変形例について説明する。

＜変形例＞
図７は、実施の形態の変形例に係る情報処理装置１の機能構成を模式的に示す図である。変形例に係る情報処理装置１は、実施の形態に係る情報処理装置１と比較すると、層選択部３１に替えて共通層受付部３８を備える点、及び評価部３４と推定部３５とを備えない点で異なるが、その他は共通する。以下、図７を参照しながら変形例に係る情報処理装置１を説明するが、図２に示す実施の形態に係る情報処理装置１と共通する部分については適宜省略又は簡略化して記載する。

変形例に係る情報処理装置１は、検査対象の学習モデルである第２学習モデルＰについて、あらかじめ第１学習モデルＭを構成する層との共通部分である共通層に関する先見情報があることを前提としている。そこで、共通層受付部３８は、第１学習モデルＭを構成する層のうち、第２学習モデルＰと共通する層である共通層の指定を受け付ける。第１取得部３２０は、検査用の入力データセットのデータを第１学習モデルＭに入力した場合における共通層の出力値である第１出力値を取得する。

第２取得部３２１は、検査用の入力データセットのデータを第２学習モデルＰに入力したとき第２学習モデルＰの出力層から出力される出力値である第２出力値を取得する。学習部３３は、第２出力値を入力したときに第１出力値を出力する逆フィルタＩＦを学習する。

連結モデル生成部３６は、第２学習モデルＰの出力層の後段に逆フィルタＩＦを接続するとともに、逆フィルタＩＦの後段に第１学習モデルＭを構成する層のうち共通層を除く層を接続した連結モデルを生成する。改変度算出部３７は、連結モデルに透かし検出用データを入力して得られる出力値と、透かし検出用データに対応する透かしデータとの一致度を算出する。

このように、変形例に係る情報処理装置１は、あらかじめ共通層に関する先見情報があることを前提とするため、改変の有無及びＺ面の推定を省略して透かし検出用データで改変の特定を実施することができる。

１・・・情報処理装置
２・・・記憶部
３・・・制御部
３０・・・モデル取得部
３１・・・層選択部
３２・・・値取得部
３２０・・・第１取得部
３２１・・・第２取得部
３３・・・学習部
３４・・・評価部
３５・・・推定部
３６・・・連結モデル生成部
３７・・・改変度算出部
３８・・・共通層受付部

Claims

複数の層から構成されるニューラルネットワークの学習モデルである第１学習モデルを取得するモデル取得部と、
前記第１学習モデルの層の中から所定の順番で層を選択する層選択部と、
検査用の入力データセットのデータを前記第１学習モデルに入力した場合における選択された前記層の入力層側の隣接層に入力される入力値を取得する第１取得部と、
前記データを前記第１学習モデルの出力層を含む少なくとも一部を改変した学習モデルであるか否かの検査対象となる第２学習モデルに入力したとき前記第２学習モデルの出力層から出力される出力値を取得する第２取得部と、
前記出力値を入力したときに前記入力値を出力する新たなニューラルネットワークの学習モデルである逆フィルタを学習する学習部と、
前記逆フィルタのパラメータの変動の大小を示す情報と、前記逆フィルタの学習が収束するまでの学習回数を示す情報と、前記逆フィルタの精度を示す情報との少なくとも一つの情報に基づく評価値を算出する評価部と、
前記評価値の変動を解析して、前記改変の有無を推定する推定部と、
を備える情報処理装置。
前記学習部は、前記逆フィルタの出力層のパラメータを、選択された前記層の入力層側の隣接層に関する逆フィルタのパラメータとなるように初期化して学習する、
請求項１に記載の情報処理装置。
前記学習部は、前記逆フィルタの出力層のパラメータを乱数で初期化した場合の第１学習と、選択された前記層の入力層側の隣接層に関する逆フィルタとなるように初期化した場合の第２学習と、を実行し、
前記推定部は、前記第１学習における前記評価値と前記第２学習における前記評価値との差の変動を解析して前記改変の有無を推定する、
請求項２に記載の情報処理装置。
前記推定部は、前記評価値の変動を解析して、前記第１学習モデルのうち改変された層を推定する、
請求項２又は３に記載の情報処理装置。
前記第１学習モデルは、透かし検出用データを入力したとき当該透かし検出用データに対応する透かしデータを出力するように学習された学習モデルであり、
前記情報処理装置は、
前記第２学習モデルの出力層の後段に前記逆フィルタを接続するとともに、前記逆フィルタの出力層に替えて前記第２学習モデルで改変された層に相当する前記第１学習モデルの改変前の層を接続した連結モデルを生成する連結モデル生成部と、
前記連結モデルに前記透かし検出用データを入力して得られる出力値と、前記透かし検出用データに対応する透かしデータとの一致度を算出する改変度算出部と、
をさらに備える請求項４に記載の情報処理装置。
前記層選択部は、前記第１学習モデルの出力層から入力層に向かって順番に層を選択する、
請求項１から５のいずれか１項に記載の情報処理装置。
プロセッサが、
複数の層から構成されるニューラルネットワークの学習モデルである第１学習モデルを取得するステップと、
前記第１学習モデルの層の中から所定の順番で層を選択するステップと、
検査用の入力データセットのデータを前記第１学習モデルに入力した場合における選択された前記層の入力層側の隣接層に入力される入力値を取得するステップと、
前記データを前記第１学習モデルの出力層を含む少なくとも一部を改変した学習モデルであるか否かの検査対象となる第２学習モデルに入力したとき前記第２学習モデルの出力層から出力される出力値を取得するステップと、
前記出力値を入力したときに前記入力値を出力する新たなニューラルネットワークの学習モデルである逆フィルタを学習するステップと、
前記逆フィルタのパラメータの変動の大小を示す情報と、前記逆フィルタの学習が収束するまでの学習回数を示す情報と、前記逆フィルタの精度を示す情報との少なくとも一つの情報に基づく評価値を算出するステップと、
前記評価値の変動を解析して、前記改変の有無を推定するステップと、
を実行する情報処理方法。
コンピュータに、
複数の層から構成されるニューラルネットワークの学習モデルである第１学習モデルを取得する機能と、
前記第１学習モデルの層の中から所定の順番で層を選択する機能と、
検査用の入力データセットのデータを前記第１学習モデルに入力した場合における選択された前記層の入力層側の隣接層に入力される入力値を取得する機能と、
前記データを前記第１学習モデルの出力層を含む少なくとも一部を改変した学習モデルであるか否かの検査対象となる第２学習モデルに入力したとき前記第２学習モデルの出力層から出力される出力値を取得する機能と、
前記出力値を入力したときに前記入力値を出力する新たなニューラルネットワークの学習モデルである逆フィルタを学習する機能と、
前記逆フィルタのパラメータの変動の大小を示す情報と、前記逆フィルタの学習が収束するまでの学習回数を示す情報と、前記逆フィルタの精度を示す情報との少なくとも一方の情報に基づく評価値を算出する機能と、
前記評価値の変動を解析して、前記改変の有無を推定する機能と、
を実現させるプログラム。
複数の層から構成されるニューラルネットワークの学習モデルであってあらかじめ透かしが埋め込まれている第１学習モデルを取得するモデル取得部と、
前記第１学習モデルを構成する層のうち、前記第１学習モデルの出力層を含む少なくとも一部を改変した学習モデルであるか否かの検査対象となる第２学習モデルと共通する層である共通層の指定を受け付ける共通層受付部と、
検査用の入力データセットのデータを前記第１学習モデルに入力した場合における前記共通層の出力値である第１出力値を取得する第１取得部と、
前記データを前記第２学習モデルに入力したとき前記第２学習モデルの出力層から出力される出力値である第２出力値を取得する第２取得部と、
前記第２出力値を入力したときに前記第１出力値を出力する新たなニューラルネットワークの学習モデルである逆フィルタを学習する学習部と、
前記第２学習モデルの出力層の後段に前記逆フィルタを接続するとともに、前記逆フィルタの後段に前記第１学習モデルを構成する層のうち前記共通層を除く層を接続した連結モデルを生成する連結モデル生成部と、
前記連結モデルに透かし検出用データを入力して得られる出力値と、前記透かし検出用データに対応する透かしデータとの一致度を算出する改変度算出部と、
を備える情報処理装置。