JP7140317B2

JP7140317B2 - 原本データとマークデータとを合成してマーキング済みデータを生成するデータエンベディングネットワークを学習する方法、及びテストする方法、並びに、それを利用した学習装置

Info

Publication number: JP7140317B2
Application number: JP2020564099A
Authority: JP
Inventors: フンキム、テ
Original assignee: ディーピングソースインコーポレイテッド．
Priority date: 2018-08-10
Filing date: 2019-07-19
Publication date: 2022-09-21
Anticipated expiration: 2039-07-19
Also published as: WO2020032420A1; US10789551B2; JP2021521566A; KR102107021B1; US20200050962A1; CN112313645A; KR20200018031A; EP3834107A1; WO2020032348A1; EP3834107A4

Description

本発明は、原本データとマークデータとを合成してマーキング済みデータを生成するデータエンベディングネットワーク（ＤａｔａＥｍｂｅｄｄｉｎｇＮｅｔｗｏｒｋ）を学習する方法、及びそれを利用した学習装置、並びに、原本データとマークデータとを合成してマーキング済みデータを生成するように学習済みデータエンベディングネットワークをテストする方法、及びそれを利用したテスト装置に関する。

ビッグデータ（ＢｉｇＤａｔａ）とは、既存の企業環境や公共機関で使用される定型化されたデータはもちろん、電子商取引データ、メタデータ、ウェブログデータ、ワイヤレス識別（ＲＦＩＤ：ＲａｄｉｏＦｒｅｑｕｅｎｃｙＩｄｅｎｔｉｆｉｃａｔｉｏｎ）データ、センサネットワークデータ、ソーシャルネットワークデータ、インターネットテキストと文書に関するデータ、インターネット検索インデックスデータなど、従来活用できていなかった非定型化又は半定型化されたデータをすべて含むデータであって、このようなデータは一般的に通常のソフトウェアツール及びコンピュータシステムでは扱いにくいレベルのデータ量を有するようになるという意味でビッグデータと称されている。

また、このようなビッグデータは、それ自体では意味がないことがあるが、パターン等に対する機械学習を通じて様々な分野で新たなデータを作り出したり、判断又は予測をするのに有用に使用され得る。

近年、人工知能技術への関心が増大するに伴い、その基盤となるビッグデータの取引又は共有が活性化している。

しかし、データの特性上（例えば、データの量が膨大で誰から提供されたデータであるのかが特定されにくい特性）、一度第三者の手に渡るようになると複製又はコピーが容易であるだけでなく、権利のない者の手に無断で渡っても、それを摘発することが容易ではなかった。これを補完するためにウォーターマーク（Ｗａｔｅｒｍａｒｋ）のような所定の個人識別技術が登場した。

これに関する従来技術の一例として、韓国公開特許公報第１０－２０１８－００５８１１６号に開示された技術を例に挙げることができるが、これによると、第１オーディオ信号をＭＣＬＴ変換する段階、前記ＭＣＬＴ変換された第１オーディオ信号にウォーターマークのビット列を挿入する段階、前記ビット列が挿入された第１オーディオ信号をＩＭＤＣＴ変換する段階、及び前記ＩＭＤＣＴ変換された信号を隣のフレーム信号とスーパーインポーズ（Ｓｕｐｅｒｉｍｐｏｓｉｎｇ）することにより、第１オーディオ信号にウォーターマークを挿入して取得された第２オーディオ信号を生成する段階を含むオーディオウォーターマークエンベディング（Ｅｍｂｅｄｄｉｎｇ）技術が提供される。

また、これに関する他の従来技術の一例として、韓国登録特許公報第１０－１８３７９３９号に開示された技術を例に挙げるが、これによると、予め設定された色相が適用される文書を複数の区域に分割する第１段階、前記複数の区域に分割された文書に互いに重ならないようにウォーターマークを選択して挿入する第２段階、及び前記予め設定された色相が適用された文書の色相と一致するようにウォーターマーク文書を補正し、ウォーターマークの秘匿程度（ＨｉｄｄｅｎＤｅｇｒｅｅ）に応じて色相を補正する第３段階からなることを特徴とする、文書にウォーターマークをエンベディングする技術が提供される。

しかし、上記のような従来技術をはじめとして、これまでに紹介された技術によると、識別処理プロセスは誰のデータであるのか又は誰から受け取ったデータであるのかを容易に識別できるようにし、無断配布されるのを防止することができるものの、識別処理プロセスで原本データの変形又は損傷が引き起こされるため、機械学習、ディープラーニング又は強化学習の際に誤認識（Ｍｉｓｒｅｃｏｇｎｉｚｅｄ）されたり使用しにくい問題があった。

よって、本発明者らは、原本データとマークデータとを合成して原本データと異なるように認識されるマーキング済みデータを生成し、学習モデルに原本データが入力されるに伴って出力される結果と、当該学習モデルにマーキング済みデータが入力されるに伴って出力される結果とが互いに同一又は類似し得るようにさせる技術を提案する。

本発明は、前述した従来技術の問題点をすべて解決することをその目的とする。

また、本発明は、データに対してデジタルウォーターマーク処理のような作業を行って、データの出所を容易に把握できるようにすることを他の目的とする。

そして、本発明は、原本データにマークデータを挿入して取得された識別処理済みデータに対して、機械学習演算を適用して生成された結果を、原本データに機械学習演算を適用して生成された結果と同一又は類似させることをまた他の目的とする。

また、本発明は、人にとっては原本データと識別処理済みデータとが互いに異なって認識されるものの、コンピュータには互いに同一又は類似するように認識される結果を得ることをまた他の目的とする。

また、本発明は、ビッグデータの取引市場においてデータの提供者が安心してデータを取引又は共有できるように支援することをまた他の目的とする。

前記の目的を達成するための本発明の代表的な構成は、以下の通りである。

本発明の一態様によると、原本データとマークデータ（ＭａｒｋＤａｔａ）とを合成してマーキング済みデータ（ＭａｒｋｅｄＤａｔａ）を生成するデータエンベディングネットワーク（ＤａｔａＥｍｂｅｄｄｉｎｇＮｅｔｗｏｒｋ）を学習する方法において、（ａ）原本学習データとマーク学習データとが取得されると、学習装置が、前記原本学習データと前記マーク学習データとをデータエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成させてマーキング済み学習データを生成させる段階と、（ｂ）前記学習装置が、（ｉ）前記マーキング済み学習データを少なくとも一つの学習済みパラメータを有するラーニングネットワークに入力して、前記ラーニングネットワークをもって（ｉ－１）前記学習済みパラメータを利用して、前記マーキング済み学習データに対してネットワーク演算を適用させて（ｉ－２）前記マーキング済み学習データに対応する第１特性情報（ＣｈａｒａｃｔｅｒｉｓｔｉｃＩｎｆｏｒｍａｔｉｏｎ）を生成させ、（ｉｉ）前記原本学習データを前記ラーニングネットワークに入力して、前記ラーニングネットワークをもって（ｉｉ－１）前記学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対応する第２特性情報を生成させる段階と、（ｃ）前記学習装置が、（ｃ１）（ｉ）（ｉ－１）前記第１特性情報と前記第２特性情報とを参照して取得された少なくとも一つの第１エラー、及び（ｉ－２）前記第１特性情報を利用して生成された少なくとも一つのタスク特化出力（ＴａｓｋＳｐｅｃｉｆｉｃＯｕｔｐｕｔ）とこれに対応する少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して取得された少なくとも一つの第２エラーのうち少なくとも一部を参照して算出された少なくとも一つのデータエラーを最小化し、（ｉｉ）入力されるデータが本物であるか偽物であるかを判別する判別器（Ｄｉｓｃｒｉｍｉｎａｔｏｒ）に入力された前記マーキング済み学習データに対応する少なくとも一つのマーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習し、（ｃ２）前記判別器に入力された変換学習データ又は変換マーキング済み学習データにそれぞれ対応する少なくとも一つの変換データスコア又は少なくとも一つの変換マーキング済みデータスコアを最大化し、前記マーキング済みデータスコアを最小化するように、前記判別器を学習し、前記変換学習データ又は前記変換マーキング済み学習データは、それぞれ前記原本学習データ又は前記マーキング済み学習データを変換して生成される段階と、を含む。

一実施例において、前記ラーニングネットワークは、少なくとも１つの第１学習済みパラメータ乃至少なくとも１つの第ｎ学習済みパラメータをそれぞれ有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、前記ｎは１以上の整数（ｉｎｔｅｇｅｒ）であると、前記（ｂ）段階で、前記学習装置は、（ｉ）前記マーキング済み学習データを前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれに入力して、それぞれの前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークをもって（ｉ－１）前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれの前記第１学習済みパラメータ乃至前記第ｎ学習済みパラメータを利用して、前記マーキング済み学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉ－２）前記マーキング済み学習データに対するそれぞれの第１＿１特性情報乃至第１＿ｎ特性情報を出力させ、（ｉｉ）前記原本学習データを前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれに入力して、それぞれの前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークをもって（ｉｉ－１）それぞれの前記第１学習済みパラメータ乃至前記第ｎ学習済みパラメータを利用して、前記原本学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対するそれぞれの第２＿１特性情報乃至第２＿ｎ特性情報を出力させ、前記（ｃ）段階で、前記学習装置は、（ｉ）（ｉ－１）前記第１＿１特性情報と前記第２＿１特性情報とを参照して取得された第１＿１エラー、乃至前記第１＿ｎ特性情報と前記第２＿ｎ特性情報とを参照して取得された第１＿ｎエラー、の平均である前記第１エラー、及び（ｉ－２）前記第１＿１特性情報を利用して生成された少なくとも１つの第１タスク特化出力とこれに対応する少なくとも１つの第１原本正解とを参照して取得された第２＿１エラー、乃至前記第１＿ｎ特性情報を利用して生成された少なくとも一つの第ｎタスク特化出力とこれに対応する少なくとも一つの第ｎ原本正解とを参照して取得された第２＿ｎエラー、の平均である前記第２エラーのうち少なくとも一部を参照して算出された前記データエラーを最小化し、前記判別器に入力された前記マーキング済み学習データに対応する前記マーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習し、（ｉｉ）前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する前記変換データスコア又は前記変換マーキング済みデータスコアを最大化し、前記マーキング済みデータスコアを最小化するように、前記判別器を学習する。

一実施例において、前記ラーニングネットワークは、少なくとも一つの第１学習済みパラメータ乃至少なくとも一つの第ｎ学習済みパラメータを有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、前記ｎは１以上の整数であると、前記（ａ）段階で、前記学習装置は、前記原本学習データと前記マーク学習データとを前記データエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成させて第１マーキング済み学習データを生成させ、前記（ｂ）段階で、前記学習装置は、（ｉ）前記第１マーキング済み学習データを前記第１ラーニングネットワークに入力して、前記第１ラーニングネットワークをもって（ｉ－１）前記第１ラーニングネットワークの前記第１学習済みパラメータを利用して、前記第１マーキング済み学習データに対してネットワーク演算を適用させて（ｉ－２）前記第１マーキング済み学習データに対する第１＿１特性情報を出力させ、（ｉｉ）前記原本学習データを前記第１ラーニングネットワークに入力して、前記第１ラーニングネットワークをもって（ｉｉ－１）前記第１学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対する第２＿１特性情報を出力させ、前記（ｃ）段階で、前記学習装置は、（ｃ１）（ｉ）（ｉ－１）前記第１＿１特性情報と前記第２＿１特性情報とを参照して取得された少なくとも一つの第１＿１エラー、及び（ｉ－２）前記第１＿１特性情報を利用して生成された少なくとも一つの第１タスク特化出力とこれに対応する少なくとも一つの第１原本正解とを参照して取得された少なくとも一つの第２＿１エラーのうち少なくとも一部を参照して算出された少なくとも一つの第１データエラーを最小化し、（ｉｉ）前記判別器に入力された前記第１マーキング済み学習データに対応する少なくとも一つの第１マーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習して前記データエンベディングネットワークが第１学習済みデータエンベディングネットワークとなるようにし、（ｃ２）（ｉ）前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する少なくとも一つの第１変換データスコア又は少なくとも一つの第１変換マーキング済みデータスコアを最大化し、（ｉｉ）前記第１マーキング済みデータスコアを最小化するように、前記判別器を学習して前記判別器が第１学習済み判別器となるようにし、前記学習装置は、整数であるｋを２からｎまで増加させて行き、（ｉ）前記原本学習データと前記マーク学習データとを前記第ｋ－１学習済みデータエンベディングネットワークに入力して、前記第ｋ－１学習済みデータエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成させて第ｋマーキング済み学習データを生成させ、（ｉｉ）前記第ｋマーキング済み学習データを第ｋラーニングネットワークに入力して、前記第ｋラーニングネットワークをもって前記第ｋラーニングネットワークの少なくとも一つの第ｋ学習済みパラメータを利用して、前記第ｋマーキング済み学習データに対してネットワーク演算を適用させて前記第ｋマーキング済み学習データに対応する第１＿ｋ特性情報を出力させ、前記原本学習データを前記第ｋラーニングネットワークに入力して、前記第ｋラーニングネットワークをもって前記第ｋ学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて前記原本学習データに対応する第２＿ｋ特性情報を出力させ、（ｉｉｉ）（ｉｉｉ－１）前記第１＿ｋ特性情報と前記第２＿ｋ特性情報とを参照して取得された少なくとも１つの第１＿ｋデータエラー、及び（ｉｉｉ－２）前記第１＿ｋ特性情報を利用して生成された少なくとも１つの第ｋタスク特化出力とこれに対応する少なくとも一つの第ｋ原本正解とを参照して取得された少なくとも一つの第２＿ｋエラーのうち少なくとも一部を参照して算出された少なくとも一つの第ｋデータエラーを最小化し、第ｋ－１学習済み判別器に入力された前記第ｋマーキング済み学習データに対応する少なくとも一つの第ｋマーキング済みデータスコアを最大化するように、第ｋ－１学習済みデータエンベディングネットワークを学習して前記第ｋ－１学習済みデータエンベディングネットワークが第ｋ学習済みデータエンベディングネットワークとなるようにし、（ｉｖ）前記第ｋ－１学習済み判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する少なくとも一つの第ｋ変換データスコア又は少なくとも一つの第ｋ変換マーキング済みデータスコアを最大化し、前記第ｋマーキング済みデータスコアを最小化するように、前記第ｋ－１学習済み判別器を学習して前記第ｋー１学習済み判別器が第ｋ学習済み判別器となるようにする。

一実施例において、前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する前記変換データスコア又は前記変換マーキング済みデータスコアの最大値は、前記変換学習データ又は前記変換マーキング済み学習データが本物であるものと判別する１であり、前記判別器に入力された前記マーキング済み学習データに対応する前記マーキング済みデータスコアの最小値は、前記マーキング済み学習データが偽物であるものと判別する０である。

一実施例において、前記（ｃ）段階で、前記学習装置は、前記第１特性情報と前記第２特性情報との間の差異を参照して前記第１エラーを取得し、前記タスク特化出力と前記原本正解とを利用して生成された少なくとも１つのロスを参照して前記第２エラーを取得する。

一実施例において、前記学習装置は、前記第１特性情報と前記第２特性情報との間のノルム（Ｎｏｒｍ）又はコサイン類似度（ＣｏｓｉｎｅＳｉｍｉｌａｒｉｔｙ）を参照して前記第１エラーを取得する。

一実施例において、前記（ｃ）段階で、前記学習装置は、前記原本学習データと前記マーキング済み学習データとの間の類似度をさらに参照して前記類似度を最小化するように前記データエンベディングネットワークを学習する。

本発明の他の態様によると、原本データとマークデータとを合成してマーキング済みデータを生成するように学習済みデータエンベディングネットワークをテストする方法において、（ａ）学習装置が、（ｉ）原本学習データとマーク学習データとが取得されると、前記原本学習データと前記マーク学習データとをデータエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成してマーキング済み学習データを生成させるプロセス、（ｉｉ）前記マーキング済み学習データを学習済みパラメータを有するラーニングネットワークに入力して、前記ラーニングネットワークをもって前記学習済みパラメータを利用して、前記マーキング済み学習データに対してネットワーク演算を適用させて前記マーキング済み学習データに対応する第１特性情報を生成させ、前記原本学習データを前記ラーニングネットワークに入力して、前記ラーニングネットワークをもって前記学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて前記原本学習データに対応する第２特性情報を生成させるプロセス、（ｉｉｉ）（ｉｉｉ－１）前記第１特性情報と前記第２特性情報とを参照して取得された少なくとも１つの第１エラー、及び（ｉｉｉ－２）前記第１特性情報を利用して生成された少なくとも１つのタスク特化出力とこれに対応する少なくとも１つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して取得された少なくとも一つの第２エラーのうち少なくとも一部を参照して生成された少なくとも一つのデータエラーを最小化し、入力されるデータが本物であるか偽物であるかを判別する判別器に入力された前記マーキング済み学習データに対応する少なくとも一つのマーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習するプロセス、及び（ｉｖ）前記判別器に入力された変換学習データ又は変換マーキング済み学習データにそれぞれ対応する少なくとも一つの変換データスコア又は少なくとも一つの変換マーキング済みデータスコアを最大化し、前記マーキング済みデータスコアを最小化するように、前記判別器を学習し、前記変換学習データ又は前記変換マーキング済み学習データは、前記原本学習データ又は前記マーキング済み学習データを変換したデータであるプロセスを遂行した状態で、テスト装置が、合成しようとする原本テストデータとマークテストデータとを取得する段階と、（ｂ）前記テスト装置が、前記原本テストデータと前記マークテストデータとを前記データエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記データエンベディングネットワークの少なくとも一つの学習済みパラメータを利用して前記原本テストデータと前記マークテストデータとを合成してマーキング済みテストデータを出力させる段階と、を含む。

一実施例において、前記（ａ）段階で、前記ラーニングネットワークは、少なくとも一つの第１学習済みパラメータ乃至少なくとも一つの第ｎ学習済みパラメータを有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、前記ｎは１以上の整数であると、前記学習装置が、（ｉ）前記マーキング済み学習データを前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれに入力して、それぞれの前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークをもって（ｉ－１）前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれの少なくとも１つの前記第１学習済みパラメータ乃至少なくとも１つの前記第ｎ学習済みパラメータを利用して、前記マーキング済み学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉ－２）前記マーキング済み学習データに対応するそれぞれの第１＿１特性情報乃至第１＿ｎ特性情報を出力させるプロセス、（ｉｉ）前記原本学習データを前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれに入力して、それぞれの前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークをもって（ｉｉ－１）前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれの前記第１学習済みパラメータ乃至前記第ｎ学習済みパラメータを利用して、前記原本学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対するそれぞれの第２＿１特性情報乃至第２＿ｎ特性情報を出力させるプロセス、（ｉｉｉ）（ｉｉｉ－１）（ｉｉｉ－１ａ）前記第１＿１特性情報と前記第２＿１特性情報とを参照して取得された少なくとも一つの第１＿１エラー、乃至前記第１＿ｎ特性情報と前記第２＿ｎ特性情報とを参照して取得された少なくとも一つの第１＿ｎエラー、の平均である前記第１エラー、及び（ｉｉｉ－１ｂ）前記第１＿１特性情報を利用して生成された少なくとも一つの第１タスク特化出力とこれに対応する少なくとも一つの第１原本正解とを参照して取得された第２＿１エラー、乃至前記第１＿ｎ特性情報を利用して生成された少なくとも一つの第ｎタスク特化出力とこれに対応する少なくとも一つの第ｎ原本正解とを参照して取得された第２＿ｎエラー、の平均である前記第２エラーのうち少なくとも一部を参照して算出された前記データエラーを最小化し、（ｉｉｉ－２）前記判別器に入力された前記マーキング済み学習データに対応する前記マーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習するプロセス、及び（ｉｖ）前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する前記変換データスコア又は前記変換マーキング済みデータスコアを最大化し、前記マーキング済みデータスコアを最小化するように、前記判別器を学習するプロセスを遂行した状態である。

一実施例において、前記（ａ）段階で、前記ラーニングネットワークは、少なくとも一つの第１学習済みパラメータ乃至少なくとも一つの第ｎ学習済みパラメータを有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、前記ｎは１以上の整数であると、前記学習装置が、（ｉ）前記原本学習データと前記マーク学習データとを前記データエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成して第１マーキング済み学習データを生成させるプロセス、（ｉｉ）前記第１マーキング済み学習データを前記第１ラーニングネットワークに入力して、前記第１ラーニングネットワークをもって前記第１ラーニングネットワークの前記第１学習済みパラメータを利用して、前記第１マーキング済み学習データに対してネットワーク演算を適用させて前記第１マーキング済み学習データに対応する前記第１＿１特性情報を出力させ、前記原本学習データを前記第１ラーニングネットワークに入力して、前記第１ラーニングネットワークをもって前記第１ラーニングネットワークの前記第１学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて前記原本学習データに対応する前記第２＿１特性情報を出力させるプロセス、（ｉｉｉ）（ｉｉｉ－１）前記第１＿１特性情報と前記第２＿１特性情報とを参照して取得された前記第１＿１エラー、及び（ｉｉｉ－２）前記第１＿１特性情報を利用して生成された前記第１タスク特化出力とこれに対応する前記第１原本正解とを参照して取得された前記第２＿１エラーのうち少なくとも一部を参照して算出された前記第１データエラーを最小化し、前記判別器に入力された前記第１マーキング済み学習データに対応する前記第１マーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習して前記データエンベディングネットワークが第１学習済みデータエンベディングネットワークとなるようにするプロセス、（ｉｖ）前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する少なくとも１つの第１変換データスコア又は少なくとも１つの第１変換マーキング済みデータスコアを最大化し、前記第１マーキング済みデータスコアを最小化するように、前記判別器を学習して前記判別器が第１学習済み判別器となるようにするプロセス、及び（ｖ）整数であるｋを２からｎまで増加させて行き、（ｖ－１）前記原本学習データと前記マーク学習データとを前記第ｋ－１学習済みデータエンベディングネットワークに入力して、前記第ｋ－１学習済みデータエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成して第ｋマーキング済み学習データを生成させ、（ｖ－２）前記第ｋマーキング済み学習データを第ｋラーニングネットワークに入力して、前記第ｋラーニングネットワークをもって前記第ｋラーニングネットワークの少なくとも一つの第ｋ学習済みパラメータを利用して、前記第ｋマーキング済み学習データに対してネットワーク演算を適用させて前記第ｋマーキング済み学習データに対応する第１＿ｋ特性情報を出力させ、前記原本学習データを前記第ｋラーニングネットワークに入力して、前記第ｋラーニングネットワークをもって前記第ｋ学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて前記原本学習データに対応する第２＿ｋ特性情報を出力させ、（ｖ－３）（ｖ－３－１）前記第１＿ｋ特性情報と前記第２＿ｋ特性情報とを参照して取得された少なくとも１つの第１＿ｋエラー、及び（ｖ－３－２）前記第１＿ｋ特性情報を利用して生成された少なくとも１つの第ｋタスク特化出力とこれに対応する少なくとも一つの第ｋ原本正解とを参照して取得された少なくとも一つの第２＿ｋエラーのうち少なくとも一部を参照して算出された少なくとも一つの第ｋデータエラーを最小化し、第ｋ－１学習済み判別器に入力された前記第ｋマーキング済み学習データに対応する少なくとも一つの第ｋマーキング済みデータスコアを最大化するように、第ｋ－１学習済みデータエンベディングネットワークを学習して前記第ｋ－１学習済みデータエンベディングネットワークが第ｋ学習済みデータエンベディングネットワークとなるようにし、（ｖ－４）前記第ｋ－１学習済み判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する少なくとも一つの第ｋ変換データスコア又は少なくとも一つの第ｋ変換マーキング済みデータスコアを最大化し、前記第ｋマーキング済みデータスコアを最小化するように、前記第ｋ－１学習済み判別器を学習して前記第ｋ－１学習済み判別器が第ｋ学習済み判別器となるようにするプロセスを遂行した状態である。

一実施例において、前記学習装置は、前記第１特性情報と前記第２特性情報との間の差異を参照して前記第１エラーを取得し、前記タスク特化出力と前記原本正解とを利用して生成された少なくとも１つのロスを参照して前記第２エラーを取得する。

一実施例において、前記学習装置は、前記原本学習データと前記マーキング済み学習データとの間の類似度をさらに参照して前記類似度を最小化するように前記データエンベディングネットワークを学習する。

本発明のまた他の態様によると、原本データとマークデータ（ＭａｒｋＤａｔａ）とを合成してマーキング済みデータ（ＭａｒｋｅｄＤａｔａ）を生成するデータエンベディングネットワーク（ＤａｔａＥｍｂｅｄｄｉｎｇＮｅｔｗｏｒｋ）を学習する学習装置において、インストラクションを格納する少なくとも１つのメモリと、（Ｉ）原本学習データとマーク学習データとが取得されると、前記原本学習データと前記マーク学習データとをデータエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成させてマーキング済み学習データを生成させるプロセス、（ＩＩ）（ｉ）前記マーキング済み学習データを少なくとも一つの学習済みパラメータを有するラーニングネットワークに入力して、前記ラーニングネットワークをもって（ｉ－１）前記学習済みパラメータを利用して、前記マーキング済み学習データに対してネットワーク演算を適用させて（ｉ－２）前記マーキング済み学習データに対応する第１特性情報（ＣｈａｒａｃｔｅｒｉｓｔｉｃＩｎｆｏｒｍａｔｉｏｎ）を生成させ、（ｉｉ）前記原本学習データを前記ラーニングネットワークに入力して、前記ラーニングネットワークをもって（ｉｉ－１）前記学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対応する第２特性情報を生成させるプロセス、及び（ＩＩＩ）（ＩＩＩ－１）（ｉ）（ｉ－１）前記第１特性情報と前記第２特性情報とを参照して取得された少なくとも１つの第１エラー、及び（ｉ－２）前記第１特性情報を利用して生成された少なくとも１つのタスク特化出力（ＴａｓｋＳｐｅｃｉｆｉｃＯｕｔｐｕｔ）とこれに対応する少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して取得された少なくとも一つの第２エラーのうち少なくとも一部を参照して算出された少なくとも一つのデータエラーを最小化し、（ｉｉ）入力されるデータが本物であるか偽物であるかを判別する判別器（Ｄｉｓｃｒｉｍｉｎａｔｏｒ）に入力された前記マーキング済み学習データに対応する少なくとも一つのマーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習し、（ＩＩＩ－２）前記判別器に入力された変換学習データ又は変換マーキング済み学習データにそれぞれ対応する少なくとも一つの変換データスコア又は少なくとも一つの変換マーキング済みデータスコアを最大化し、前記マーキング済みデータスコアを最小化するように、前記判別器を学習し、前記変換学習データ又は前記変換マーキング済み学習データは、それぞれ前記原本学習データ又は前記マーキング済み学習データを変換して生成されるプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも１つのプロセッサと、を含む。

一実施例において、前記ラーニングネットワークは、少なくとも１つの第１学習済みパラメータ乃至少なくとも１つの第ｎ学習済みパラメータをそれぞれ有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、前記ｎは１以上の整数であると、前記（ＩＩ）プロセスで、前記プロセッサは、（ｉ）前記マーキング済み学習データを前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれに入力して、それぞれの前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークをもって（ｉ－１）前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれの前記第１学習済みパラメータ乃至前記第ｎ学習済みパラメータを利用して、前記マーキング済み学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉ－２）前記マーキング済み学習データに対するそれぞれの第１＿１特性情報乃至第１＿ｎ特性情報を出力させ、（ｉｉ）前記原本学習データを前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれに入力して、それぞれの前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークをもって（ｉｉ－１）それぞれの前記第１学習済みパラメータ乃至前記第ｎ学習済みパラメータを利用して、前記原本学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対するそれぞれの第２＿１特性情報乃至第２＿ｎ特性情報を出力させ、前記（ＩＩＩ）プロセスで、前記プロセッサは、（ｉ）（ｉ－１）前記第１＿１特性情報と前記第２＿１特性情報とを参照して取得された第１＿１エラー、乃至前記第１＿ｎ特性情報と前記第２＿ｎ特性情報とを参照して取得された第１＿ｎエラー、の平均である前記第１エラー、及び（ｉ－２）前記第１＿１特性情報を利用して生成された少なくとも１つの第１タスク特化出力とこれに対応する少なくとも１つの第１原本正解とを参照して取得された第２＿１エラー、乃至前記第１＿ｎ特性情報を利用して生成された少なくとも一つの第ｎタスク特化出力とこれに対応する少なくとも一つの第ｎ原本正解とを参照して取得された第２＿ｎエラー、の平均である前記第２エラーのうち少なくとも一部を参照して算出された前記データエラーを最小化し、前記判別器に入力された前記マーキング済み学習データに対応する前記マーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習し、（ｉｉ）前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する前記変換データスコア又は前記変換マーキング済みデータスコアを最大化し、前記マーキング済みデータスコアを最小化するように、前記判別器を学習する。

一実施例において、前記ラーニングネットワークは、少なくとも一つの第１学習済みパラメータ乃至少なくとも一つの第ｎ学習済みパラメータを有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、前記ｎは１以上の整数であると、前記（Ｉ）プロセスで、前記プロセッサは、前記原本学習データと前記マーク学習データとを前記データエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成させて第１マーキング済み学習データを生成させ、前記（ＩＩ）プロセスで、前記プロセッサは、（ｉ）前記第１マーキング済み学習データを前記第１ラーニングネットワークに入力して、前記第１ラーニングネットワークをもって（ｉ－１）前記第１ラーニングネットワークの前記第１学習済みパラメータを利用して、前記第１マーキング済み学習データに対してネットワーク演算を適用させて（ｉ－２）前記第１マーキング済み学習データに対する第１＿１特性情報を出力させ、（ｉｉ）前記原本学習データを前記第１ラーニングネットワークに入力して、前記第１ラーニングネットワークをもって（ｉｉ－１）前記第１学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対する第２＿１特性情報を出力させ、前記（ＩＩＩ）プロセスで、前記プロセッサは、（ＩＩＩ－１）（ｉ）（ｉ－１）前記第１＿１特性情報と前記第２＿１特性情報とを参照して取得された少なくとも一つの第１＿１エラー、及び（ｉ－２）前記第１＿１特性情報を利用して生成された少なくとも一つの第１タスク特化出力とこれに対応する少なくとも一つの第１原本正解とを参照して取得された少なくとも一つの第２＿１エラーのうち少なくとも一部を参照して算出された少なくとも一つの第１データエラーを最小化し、（ｉｉ）前記判別器に入力された前記第１マーキング済み学習データに対応する少なくとも一つの第１マーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習して前記データエンベディングネットワークが第１学習済みデータエンベディングネットワークとなるようにし、（ＩＩＩ－２）（ｉ）前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する少なくとも一つの第１変換データスコア又は少なくとも一つの第１変換マーキング済みデータスコアを最大化し、（ｉｉ）前記第１マーキング済みデータスコアを最小化するように、前記判別器を学習して前記判別器が第１学習済み判別器となるようにし、前記プロセッサは、整数であるｋを２からｎまで増加させて行き、（ｉ）前記原本学習データと前記マーク学習データとを前記第ｋ－１学習済みデータエンベディングネットワークに入力して、前記第ｋ－１学習済みデータエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成させて第ｋマーキング済み学習データを生成させ、（ｉｉ）前記第ｋマーキング済み学習データを第ｋラーニングネットワークに入力して、前記第ｋラーニングネットワークをもって前記第ｋラーニングネットワークの少なくとも一つの第ｋ学習済みパラメータを利用して、前記第ｋマーキング済み学習データに対してネットワーク演算を適用させて前記第ｋマーキング済み学習データに対応する第１＿ｋ特性情報を出力させ、前記原本学習データを前記第ｋラーニングネットワークに入力して、前記第ｋラーニングネットワークをもって前記第ｋ学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて前記原本学習データに対応する第２＿ｋ特性情報を出力させ、（ｉｉｉ）（ｉｉｉ－１）前記第１＿ｋ特性情報と前記第２＿ｋ特性情報とを参照して取得された少なくとも１つの第１＿ｋデータエラー、及び（ｉｉｉ－２）前記第１＿ｋ特性情報を利用して生成された少なくとも１つの第ｋタスク特化出力とこれに対応する少なくとも一つの第ｋ原本正解とを参照して取得された少なくとも一つの第２＿ｋエラーのうち少なくとも一部を参照して算出された少なくとも一つの第ｋデータエラーを最小化し、第ｋ－１学習済み判別器に入力された前記第ｋマーキング済み学習データに対応する少なくとも一つの第ｋマーキング済みデータスコアを最大化するように、第ｋ－１学習済みデータエンベディングネットワークを学習して前記第ｋ－１学習済みデータエンベディングネットワークが第ｋ学習済みデータエンベディングネットワークとなるようにし、（ｉｖ）前記第ｋ－１学習済み判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する少なくとも１つの第ｋ変換データスコア又は少なくとも一つの第ｋ変換マーキング済みデータスコアを最大化し、前記第ｋマーキング済みデータスコアを最小化するように、前記第ｋ－１学習済み判別器を学習して前記第ｋ－１学習済み判別器が第ｋ学習済み判別器となるようにする。

一実施例において、前記（ＩＩＩ）プロセスで、前記プロセッサは、前記第１特性情報と前記第２特性情報との間の差異を参照して前記第１エラーを取得し、前記タスク特化出力と前記原本正解とを利用して生成された少なくとも１つのロスを参照して前記第２エラーを取得する。

一実施例において、前記プロセッサは、前記第１特性情報と前記第２特性情報との間のノルム（Ｎｏｒｍ）又はコサイン類似度（ＣｏｓｉｎｅＳｉｍｉｌａｒｉｔｙ）を参照して前記第１エラーを取得する。

一実施例において、前記（ＩＩＩ）プロセスで、前記プロセッサは、前記原本学習データと前記マーキング済み学習データとの間の類似度をさらに参照して前記類似度を最小化するように前記データエンベディングネットワークを学習する。

本発明のまた他の態様によると、原本データとマークデータとを合成してマーキング済みデータを生成するように学習済みデータエンベディングネットワークをテストするテスト装置において、インストラクションを格納する少なくとも１つのメモリと、学習装置が、（ｉ）原本学習データとマーク学習データとが取得されると、前記原本学習データと前記マーク学習データとをデータエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成してマーキング済み学習データを生成させるプロセス、（ｉｉ）前記マーキング済み学習データを学習済みパラメータを有するラーニングネットワークに入力して、前記ラーニングネットワークをもって前記学習済みパラメータを利用して、前記マーキング済み学習データに対してネットワーク演算を適用させて前記マーキング済み学習データに対応する第１特性情報を生成させ、前記原本学習データを前記ラーニングネットワークに入力して、前記ラーニングネットワークをもって前記学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて前記原本学習データに対応する第２特性情報を生成させるプロセス、（ｉｉｉ）（ｉｉｉ－１）前記第１特性情報と前記第２特性情報とを参照して取得された少なくとも１つの第１エラー、及び（ｉｉｉ－２）前記第１特性情報を利用して生成された少なくとも１つのタスク特化出力とこれに対応する少なくとも１つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して取得された少なくとも１つの第２エラーのうち少なくとも一部を参照して生成された少なくとも一つのデータエラーを最小化し、入力されるデータが本物であるか偽物であるかを判別する判別器に入力された前記マーキング済み学習データに対応する少なくとも一つのマーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習するプロセス、及び（ｉｖ）前記判別器に入力された変換学習データ又は変換マーキング済み学習データにそれぞれ対応する少なくとも一つの変換データスコア又は少なくとも一つの変換マーキング済みデータスコアを最大化し、前記マーキング済みデータスコアを最小化するように、前記判別器を学習し、前記変換学習データ又は前記変換マーキング済み学習データは、前記原本学習データ又は前記マーキング済み学習データを変換したデータであるプロセスを遂行した状態で、（Ｉ）合成しようとする原本テストデータとマークテストデータとを取得するプロセス、及び（ＩＩ）前記原本テストデータと前記マークテストデータとを前記データエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記データエンベディングネットワークの少なくとも１つの学習済みパラメータを利用して、前記原本テストデータと前記マークテストデータとを合成してマーキング済みテストデータを出力させるプロセスを遂行するか、他の装置をもって遂行するよう支援するための前記インストラクションを実行するように構成された少なくとも１つのプロセッサと、を含む。

一実施例において、前記（Ｉ）プロセスで、前記ラーニングネットワークは、少なくとも一つの第１学習済みパラメータ乃至少なくとも一つの第ｎ学習済みパラメータを有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、前記ｎは１以上の整数であると、前記学習装置が、（ｉ）前記マーキング済み学習データを前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれに入力して、それぞれの前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークをもって（ｉ－１）前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれの少なくとも１つの前記第１学習済みパラメータ乃至少なくとも１つの前記第ｎ学習済みパラメータを利用して、前記マーキング済み学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉ－２）前記マーキング済み学習データに対応するそれぞれの第１＿１特性情報乃至第１＿ｎ特性情報を出力させるプロセス、（ｉｉ）前記原本学習データを前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれに入力して、それぞれの前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークをもって（ｉｉ－１）前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれの前記第１学習済みパラメータ乃至前記第ｎ学習済みパラメータを利用して、前記原本学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対するそれぞれの第２＿１特性情報乃至第２＿ｎ特性情報を出力させるプロセス、（ｉｉｉ）（ｉｉｉ－１）（ｉｉｉ－１ａ）前記第１＿１特性情報と前記第２＿１特性情報とを参照して取得された少なくとも一つの第１＿１エラー、乃至前記第１＿ｎ特性情報と前記第２＿ｎ特性情報とを参照して取得された少なくとも一つの第１＿ｎエラー、の平均である前記第１エラー、及び（ｉｉｉ－１ｂ）前記第１＿１特性情報を利用して生成された少なくとも一つの第１タスク特化出力とこれに対応する少なくとも一つの第１原本正解とを参照して取得された第２＿１エラー、乃至前記第１＿ｎ特性情報を利用して生成された少なくとも一つの第ｎタスク特化出力とこれに対応する少なくとも一つの第ｎ原本正解とを参照して取得された第２＿ｎエラー、の平均である前記第２エラーのうち少なくとも一部を参照して算出された前記データエラーを最小化し、（ｉｉｉ－２）前記判別器に入力された前記マーキング済み学習データに対応する前記マーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習するプロセス、及び（ｉｖ）前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する前記変換データスコア又は前記変換マーキング済みデータスコアを最大化し、前記マーキング済みデータスコアを最小化するように、前記判別器を学習するプロセスを遂行した状態である。

一実施例において、前記（Ｉ）プロセスで、前記ラーニングネットワークは、少なくとも一つの第１学習済みパラメータ乃至少なくとも一つの第ｎ学習済みパラメータを有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、前記ｎは１以上の整数であると、前記学習装置が、（ｉ）前記原本学習データと前記マーク学習データとを前記データエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成して第１マーキング済み学習データを生成させるプロセス、（ｉｉ）前記第１マーキング済み学習データを前記第１ラーニングネットワークに入力して、前記第１ラーニングネットワークをもって前記第１ラーニングネットワークの前記第１学習済みパラメータを利用して、前記第１マーキング済み学習データに対してネットワーク演算を適用させて前記第１マーキング済み学習データに対応する前記第１＿１特性情報を出力させ、前記原本学習データを前記第１ラーニングネットワークに入力して、前記第１ラーニングネットワークをもって前記第１ラーニングネットワークの前記第１学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて前記原本学習データに対応する前記第２＿１特性情報を出力させるプロセス、（ｉｉｉ）（ｉｉｉ－１）前記第１＿１特性情報と前記第２＿１特性情報とを参照して取得された前記第１＿１エラー、及び（ｉｉｉ－２）前記第１＿１特性情報を利用して生成された前記第１タスク特化出力とこれに対応する前記第１原本正解とを参照して取得された前記第２＿１エラーのうち少なくとも一部を参照して算出された前記第１データエラーを最小化し、前記判別器に入力された前記第１マーキング済み学習データに対応する前記第１マーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習して前記データエンベディングネットワークが第１学習済みデータエンベディングネットワークとなるようにするプロセス、（ｉｖ）前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する少なくとも一つの第１変換データスコア又は第１変換マーキング済みデータスコアを最大化し、前記第１マーキング済みデータスコアを最小化するように、前記判別器を学習して前記判別器が第１学習済み判別器となるようにするプロセス、及び（ｖ）整数であるｋを２からｎまで増加させて行き、（ｖ－１）前記原本学習データと前記マーク学習データとを前記第ｋ－１学習済みデータエンベディングネットワークに入力して、前記第ｋ－１学習済みデータエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成して第ｋマーキング済み学習データを生成させ、（ｖ－２）前記第ｋマーキング済み学習データを第ｋラーニングネットワークに入力して、前記第ｋラーニングネットワークをもって前記第ｋラーニングネットワークの少なくとも一つの第ｋ学習済みパラメータを利用して、前記第ｋマーキング済み学習データに対してネットワーク演算を適用させて前記第ｋマーキング済み学習データに対応する第１＿ｋ特性情報を出力させ、前記原本学習データを前記第ｋラーニングネットワークに入力して、前記第ｋラーニングネットワークをもって前記第ｋ学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて前記原本学習データに対応する第２＿ｋ特性情報を出力させ、（ｖ－３）（ｖ－３－１）前記第１＿ｋ特性情報と前記第２＿ｋ特性情報とを参照して取得された少なくとも１つの第１＿ｋエラー、及び（ｖ－３－２）前記第１＿ｋ特性情報を利用して生成された少なくとも１つの第ｋタスク特化出力とこれに対応する少なくとも一つの第ｋ原本正解とを参照して取得された少なくとも一つの第２＿ｋエラーのうち少なくとも一部を参照して算出された少なくとも一つの第ｋデータエラーを最小化し、第ｋ－１学習済み判別器に入力された前記第ｋマーキング済み学習データに対応する少なくとも一つの第ｋマーキング済みデータスコアを最大化するように、第ｋ－１学習済みデータエンベディングネットワークを学習して前記第ｋ－１学習済みデータエンベディングネットワークが第ｋ学習済みデータエンベディングネットワークとなるようにし、（ｖ－４）前記第ｋ－１学習済み判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する少なくとも一つの第ｋ変換データスコア又は少なくとも一つの第ｋ変換マーキング済みデータスコアを最大化し、前記第ｋマーキング済みデータスコアを最小化するように、前記第ｋ－１学習済み判別器を学習して前記第ｋ－１学習済み判別器が第ｋ学習済み判別器となるようにするプロセスを遂行した状態である。

その他にも、本発明の方法を実行するためのコンピュータプログラムを格納するためのコンピュータ読取り可能な記録媒体がさらに提供される。

本発明は、データを処理（例えば、デジタルウォーターマーク処理）することにより、データの出所を容易に識別することができる効果がある。

また、本発明は、原本データにマークデータを入力して取得された処理済みデータに対して機械学習演算を適用して生成された第１の結果を取得することができ、前記第１の結果は、原本データに機械学習演算を適用して生成された第２の結果と同一又は類似した他の効果がある。

また、本発明は、人にとっては原本データと識別処理済みデータとが互いに異なるように認識されるものの、コンピュータには原本データと識別処理済みデータとが互いに同一又は類似して認識され得るまた他の効果がある。

また、本発明は、ビッグデータの取引市場において、データの提供者が安心してデータを取引又は共有することができるように支援し得るまた他の効果がある。

本発明の一実施例において、原本データとマークデータとを合成してマーキング済みデータを生成するデータエンベディングネットワークを学習する学習装置を簡略に示したものである。本発明の一実施例において、原本データとマークデータとを合成してマーキング済みデータを生成するデータエンベディングネットワークを学習する方法を簡略に示したものである。本発明の一実施例において、原本データとマークデータとを合成してマーキング済みデータを生成するデータエンベディングネットワークを学習する他の方法を簡略に示したものである。本発明の一実施例において、学習済みデータエンベディングネットワークをテストするテスト装置を簡略に示したものである。本発明の一実施例において、学習済みデータエンベディングネットワークをテストする方法を簡略に示したものである。

本発明の実施例の説明に利用されるために添付された図面は、本発明の実施例のうち単に一部であるだけであり、本発明の属する技術分野において通常の知識を有する者（以下、「通常の技術者」）にとっては、発明的作業が行われることなく、これらの図面に基づいて他の図面が得られ得る。

後述する本発明に関する詳細な説明は、本発明が実施され得る特定の実施例を例示として示す添付図面を参照する。これらの実施例は、当業者が本発明を実施し得るように十分詳細に説明される。本発明の多様な実施例は互いに異なるものの、相互に排他的である必要はないことが理解されるべきである。例えば、ここに記載されている特定の機能、構造及び特性は、本発明の精神と範囲を逸脱せず、かつ一つの実施例から他の実施例に変更されて具現され得る。また、それぞれの実施例内の個別の構成要素の位置又は配置は、本発明の精神と範囲を逸脱せず、かつ変更され得ることが理解されるべきである。したがって、後述する詳細な説明は、限定的な意味として受け取ろうとするものではなく、本発明の範囲は、特許請求の範囲の請求項が請求する範囲及びそれに均等なすべての範囲を包括するものと受け取られるべきである。図面において類似の参照符号は、様々な側面にわたって同一であるか、類似した構成要素を示す。

以下では、本発明の詳細な説明と請求項に含まれる「含む」とは、用語と当該用語の多様な表現は、他の技術的特徴、追加、構成要素又は段階を排除することを意味するものではない。本発明の他の目的、恩恵及び特徴は、部分的には明細書から、及び部分的には本発明の履行から、技術分野における通常の知識を有する者に明らかにされるであろう。以下の各例示と図面は例示として示されているが、本発明はこれに制限されるわけではない。

本発明の属する技術分野において、通常の知識を有する者が本発明を容易に実施し得るようにするために、本発明の様々な好ましい実施例について添付された図面を参照して詳細に説明する。

図１は、本発明の一実施例において、原本データとマークデータとを合成してマーキング済みデータを生成するデータエンベディングネットワークを学習する学習装置を簡略に示したものである。

図１を参照すると、本発明の一実施例による学習装置１００は、ラーニングネットワーク１００が原本学習データを利用して算出された結果と同一又は類似した結果をマーキング済み学習データを入力して算出するように、原本学習データとマーク学習データとを利用してマーキング済み学習データを生成するデータエンベディングネットワークを学習するためのインストラクションが格納されたメモリ１１０と、メモリ１１０に格納されたインストラクションにしたがってデータエンベディングネットワークを学習するプロセスを遂行するプロセッサ１２０とを含むことができる。この場合、マーキング済みデータ、マーキング済み学習データ、マーキング済みテストデータ等は、マークデータをウォーターマーク（Ｗａｔｅｒｍａｒｋ）として利用してデジタル方式でウォーターマーク処理済みのデータを意味し得る。

具体的に、学習装置１００は、少なくとも一つのコンピューティング装置（例えば、コンピュータプロセッサ、メモリ、ストレージ、入力装置、出力装置、又は、その他既存のコンピューティング装置の構成要素；ルータ、スイッチなどのような電子通信装置；ネットワーク接続ストレージ（ＮＡＳ）及びストレージ領域ネットワーク（ＳＡＮ）のような電子情報ストレージシステム）と少なくとも一つのコンピュータソフトウェア（すなわち、コンピューティング装置をもって特定の方式で機能させるインストラクション）との組み合わせを利用して所望のシステム性能を一般的に達成するものであり得る。

また、このような装置のプロセッサは、ＭＰＵ（ＭｉｃｒｏＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）又はＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、キャッシュメモリ（ＣａｃｈｅＭｅｍｏｒｙ）、データバス（ＤａｔａＢｕｓ）などのハードウェア構成を含むことができる。また、コンピューティング装置は、オペレーティングシステム、特定の目的を遂行するアプリケーションのソフトウェア構成をさらに含むこともできる。

コンピューティング装置が、本発明を実施するためのプロセッサ、メモリ、ミディアム又は他のコンピューティング要素の任意の組み合わせを含む統合装置を排除するものではない。

一方、学習装置１００は、原本学習データとマーク学習データとが取得されると、メモリ１１０に格納されたインストラクションにしたがって学習装置１００のプロセッサ１２０が、原本学習データとマーク学習データとをデータエンベディングネットワークに入力して、データエンベディングネットワークをもって原本学習データとマーク学習データとを合成してマーキング済み学習データを生成させる。そして、学習装置１００は、（ｉ）マーキング済み学習データを少なくとも１つの学習済みパラメータを有するラーニングネットワークに入力して、ラーニングネットワークをもって（ｉ－１）学習済みパラメータを利用して、マーキング済み学習データに対してネットワーク演算を適用させて（ｉ－２）マーキング済み学習データに対応する第１特性情報（ＣｈａｒａｃｔｅｒｉｓｔｉｃＩｎｆｏｒｍａｔｉｏｎ）を生成させ、（ｉｉ）原本学習データをラーニングネットワークに入力して、ラーニングネットワークをもって（ｉｉ－１）学習済みパラメータを利用して、原本学習データに対してネットワーク演算を適用させて（ｉｉ－２）原本学習データに対応する第２特性情報を生成させるプロセスを遂行するか、他の装置をもって遂行するように支援することができる。以後、学習装置１００は、（Ｉ）（ｉ）（ｉ－１）第１特性情報と第２特性情報とを参照して取得された少なくとも１つの第１エラー、及び（ｉ－２）第１特性情報を利用して生成された少なくとも１つのタスク特化出力（ＴａｓｋＳｐｅｃｉｆｉｃＯｕｔｐｕｔ）とこれに対応する少なくとも１つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して取得された少なくとも１つの第２エラーのうち少なくとも一部を参照して算出された少なくとも一つのデータエラーを最小化し、（ｉｉ）入力されるデータが本物であるか偽物であるかを判別する判別器（Ｄｉｓｃｒｉｍｉｎａｔｏｒ）に入力されたマーキング済み学習データに対応する少なくとも一つのマーキング済みデータスコアを最大化するように、データエンベディングネットワークを学習し、（ＩＩ）判別器に入力された変換学習データ又は変換マーキング済み学習データにそれぞれ対応する少なくとも一つの変換データスコア又は少なくとも一つの変換マーキング済みデータスコアを最大化し、マーキング済みデータスコアを最小化するように、判別器を学習することができる。

このように構成された本発明の一実施例による学習装置１００を利用して、原本学習データとマーク学習データとを合成してマーキング済み学習データを生成するデータエンベディングネットワークを学習する方法を、図２と図３を参照して説明すると以下のとおりである。

図２は、本発明の一実施例において、原本学習データとマーク学習データとを合成してマーキング済み学習データを生成するデータエンベディングネットワークを学習する方法を簡略に示したものである。本発明において、ウォーターマーク（すなわち、マーク学習データｗ）がマーキング済み学習データｘ’内で背景にのみ図示されるが、本発明の範囲はそれに制限されず、ウォーターマークは全景やマーキング済み学習データｘ’内のどこにでも存在し得る。

先ず、原本学習データｘとマーク学習データｗとが取得されると、学習装置１００は、原本学習データｘとマーク学習データｗとをデータエンベディングネットワークＧに入力して、データエンベディングネットワークＧをもって原本学習データｘとマーク学習データｗとを合成させてマーキング済み学習データ（ｘ’すなわち、Ｇ（ｘ，ｗ））を生成させる。この際、原本学習データｘは、テキスト、イメージ、動画、音など様々な形態のデータを含むことができる。

そして、マーク学習データｗは、人によって視覚、聴覚、及び触覚のうち少なくとも一つの感覚により認識され得るウォーターマーク、フォレンジックウォーターマーク（ＦｏｒｅｎｓｉｃＷａｔｅｒｍａｒｋ）などのデジタルウォーターマークを含むことができる。そして、デジタルウォーターマークは、原本データに対する著作権証明及び保護のためのロバストウォーターマーク（ＲｏｂｕｓｔＷａｔｅｒｍａｒｋ）、原本データの保護及び証明のためのフラジャイルウォーターマーク（ＦｒａｇｉｌｅＷａｔｅｒｍａｒｋ）、指紋のような固有情報を含むフィンガープリント（Ｆｉｎｇｅｒｐｒｉｎｔ）、情報を秘匿したり他の形態に偽装するステガノグラフィー（Ｓｔｅｇａｎｏｇｒａｐｈｙ）を含み得るが、これに限定されず、オーディオウォーターマークなど原本データに結合され得るすべての種類のウォーターマークを含むことができる。

また、マークデータｗは、原本データに係る権利者に関する情報を含むことができ、一例として、原本データの製作者、配布者又は受領者に関する情報、制作日時、配布日時又は受領日時に関する情報、原本データに付与された権利に関する情報などが含まれ得る。

一方、マーキング済み学習データｘ’からマーク学習データｗを分離して原本学習データが抽出されることを防止するために、原本学習データｘとマーク学習データｗとを合成する際にデータエンベディングネットワークＧはエンベディング関数Ｇ（ｘ，ｗ）を利用して、所定の変形（Ｐｅｒｔｕｒｂａｔｉｏｎ）を追加することができる。

すなわち、データエンベディングネットワークＧは、イメージ、音等の原本学習データの類型や、ピクセル、周波数等の原本データの特性を参照して合成時に加わる変形の種類又はその変形の程度を決定することができる。

例えば、原本学習データｘがイメージデータである場合、データエンベディングネットワークＧは、変形を加えるピクセル基盤の混合因子（ＢｌｅｎｄｉｎｇＦａｃｔｏｒ）及びサブピクセルレベルの空間歪曲（ＳｐａｔｉａｌＤｉｓｔｏｒｔｉｏｎ）の程度を決定し、決定された空間歪曲の程度に応じてマーク学習データｗを変形させて、それを原本学習データｘに合成することができる。

また、データエンベディングネットワークＧは、原本学習データｘから抽出される所定の暗号ハッシュ値（ＣｒｙｐｔｏｇｒａｐｈｙＨａｓｈＶａｌｕｅ）に基づいてマーク学習データｗに追加されるランダム変形を決定し、決定されたランダム変形にしたがってマーク学習データｗを変形して、これを原本学習データｘに合成することができる。

そして、マーキング済み学習データｘ’は、人にとっては原本学習データｘと異なって認識されるものの、ラーニングネットワークでは原本学習データｘと同一又は類似するものと認識され得る。

次に、学習装置１００は、（ｉ）マーキング済み学習データｘ’を少なくとも一つの学習済みパラメータを有するラーニングネットワークＦに入力して、ラーニングネットワークＦをもって（ｉ－１）学習済みパラメータを利用して、マーキング済み学習データｘ’に対してネットワーク演算を適用させて（ｉ－２）マーキング済み学習データｘ’に対応する第１特性情報Ｆ（ｘ’）を生成させるプロセス、及び（ｉｉ）原本学習データｘをラーニングネットワークＦに入力して、ラーニングネットワークＦをもって（ｉｉ－１）学習済みパラメータを利用して原本学習データｘに対してネットワーク演算を適用させて（ｉｉ－２）原本学習データｘに対応する第２特性情報Ｆ（ｘ）を生成させるプロセスを遂行するか、他の装置をもって遂行するように支援することができる。

この際、ラーニングネットワークＦは、マシンラーニングネットワークを含むことができるが、これに限定されず、学習済みパラメータにしたがって入力されるマーキング済み学習データｘ’に対してネットワーク演算を適用して第１特性情報Ｆ（ｘ’）を出力し、原本学習データｘに対してネットワーク演算を適用して第２特性情報Ｆ（ｘ）を出力させる全てのラーニングネットワークを含むことができる。そして、マシンラーニングネットワークは、Ｋ－近傍法（Ｋ－ＮｅａｒｅｓｔＮｅｉｇｈｂｏｒｓ）、線形回帰（ＬｉｎｅａｒＲｅｇｒｅｓｓｉｏｎ）、ロジスティック回帰（ＬｏｇｉｓｔｉｃＲｅｇｒｅｓｓｉｏｎ）、サポートベクトルマシン（ＳＶＭ，ＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅ）、デシジョンツリー（ＤｅｃｉｓｉｏｎＴｒｅｅ）とランダムフォレスト（ＲａｎｄｏｍＦｏｒｅｓｔ）、ニューラルネットワーク（ＮｅｕｒａｌＮｅｔｗｏｒｋ）、クラスタリング（Ｃｌｕｓｔｅｒｉｎｇ）、視覚化（Ｖｉｓｕａｌｉｚａｔｉｏｎ）と次元縮小（ＤｉｍｅｎｓｉｏｎａｌｉｔｙＲｅｄｕｃｔｉｏｎ）、関連規則学習（ＡｓｓｏｃｉａｔｉｏｎＲｕｌｅＬｅａｒｎｉｎｇ）、深層信頼ネットワーク（ＤｅｅｐＢｅｌｉｅｆＮｅｔｗｏｒｋ）、強化学習（ＲｅｉｎｆｏｒｃｅｍｅｎｔＬｅａｒｎｉｎｇ）、及びディープラーニングアルゴリズム（ＤｅｅｐＬｅａｒｎｉｎｇＡｌｇｏｒｉｔｈｍ）のうち少なくとも一つを含むことができるが、マシンラーニングネットワークはこれに限定されず、多様なラーニングアルゴリズムを含むことができる。

そして、第１特性情報Ｆ（ｘ’）と第２特性情報Ｆ（ｘ）とはそれぞれマーキング済み学習データｘ’と原本学習データｘとに対する特徴（Ｆｅａｔｕｒｅ）又はロジット（Ｌｏｇｉｔ）であり得る。また、第１特性情報Ｆ（ｘ’）と第２特性情報Ｆ（ｘ）とは、それぞれマーキング済み学習データｘ’と原本学習データｘ内の所定の特徴と関連する特徴値、又は所定の特徴と関連するベクトル（Ｖｅｃｔｏｒ）、行列（Ｍａｔｒｉｘ）及び座標（Ｃｏｏｒｄｉｎａｔｅ）のうち少なくとも一つに関する値を含むロジットであり得る。例えば、学習データｘが顔のイメージデータである場合に、上記の結果は顔認識のためのクラス、顔の特徴、一例として、笑顔に関する状態、顔の特徴点（ＬａｎｄｍａｒｋＰｏｉｎｔ、例えば、目の両端点）に関する座標であり得る。

次に、学習装置１００は、（Ｉ）（ｉ）（ｉ－１）第１特性情報Ｆ（ｘ’）と第２特性情報Ｆ（ｘ）とを参照して取得された少なくとも１つの第１エラー、及び（ｉ－２）第１特性情報Ｆ（ｘ’）を利用して生成された少なくとも１つのタスク特化出力（ＴａｓｋＳｐｅｃｉｆｉｃＯｕｔｐｕｔ）とこれに対応する少なくとも１つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して取得された少なくとも１つの第２エラーのうち少なくとも一部を参照して算出された少なくとも一つのデータエラーを最小化し、（ｉｉ）入力されるデータが本物であるか偽物であるかを判別する判別器Ｄに入力されたマーキング済み学習データｘ’に対応する少なくとも一つのマーキング済みデータスコアを最大化するように、データエンベディングネットワークを学習し、（ＩＩ）判別器Ｄに入力された変換学習データ又は変換マーキング済み学習データにそれぞれ対応する少なくとも一つの変換データスコア又は少なくとも一つの変換マーキング済みデータスコアを最大化し、マーキング済みデータスコアを最小化するように、判別器を学習することができる。この際、変換学習データ又は変換マーキング済み学習データは、ランダムノイズ生成ネットワーク（図示せず）を通じて生成された少なくとも一つのランダムノイズをそれぞれ原本学習データｘ又はマーキング済み学習データｘ’に追加して生成され得る。一例として、ランダムノイズ生成ネットワークをもって正規分布Ｎ（０，σ）によるランダムノイズを生成させ、生成されたノイズを原本学習データｘ又はマーキング済み学習データｘ’に追加して変換学習データ又は変換マーキング済み学習データを生成することができる。また、変換学習データ又は変換マーキング済み学習データは、ランダムノイズ以外にも、原本学習データｘ又はマーキング済み学習データｘ’をブラー（Ｂｌｕｒ）処理するか原本学習データｘ又はマーキング済み学習データｘ’の解像度を変更して生成することができるが、これに限定されず、原本学習データ又はマーキング済み学習データを変換する多様な方法が適用され得る。

すなわち、学習装置１００は、データエンベディングネットワークＧを学習するにおいて、第１エラーを利用してラーニングネットワークＦでは原本学習データｘと同一又は類似して認識されるように、原本学習データｘとマーク学習データｗとを合成してマーキング済み学習データｘ’を出力するように学習し、マーキング済みデータスコアを利用して原本学習データｘとは異なるものの原本学習データｘとの区別を難しくしたマーキング済み学習データｘ’を出力するように学習させることができる。

この場合、学習装置１００は、第１特性情報Ｆ（ｘ’）と第２特性情報Ｆ（ｘ）との間の差を利用して第１エラーを取得し、タスク特化出力とこれに対応する原本正解とを利用して算出された少なくとも一つのロスによって第２エラーを取得することができる。

一例として、学習装置１００は、第１特性情報Ｆ（ｘ’）と第２特性情報Ｆ（ｘ）とのノルム（Ｎｏｒｍ）又はコサイン類似度（ＣｏｓｉｎｅＳｉｍｉｌａｒｉｔｙ）を参照して第１エラーを取得することができるが、これに限定されず、第１特性情報Ｆ（ｘ’）と第２特性情報Ｆ（ｘ）との間の差異を算出し得る多様なアルゴリズムを適用することができる。

そして、タスク特化出力は、ラーニングネットワークＦが遂行しようとするタスクに対する出力であって、クラス分類のためのクラスに対する確率、位置検出のためのリグレッションによる座標値など、ラーニングネットワークＦの学習済みのタスクによる多様な結果値を有することができ、ラーニングネットワークＦから出力される特性情報に対して活性化ユニット（ＡｃｔｉｖａｔｉｏｎＵｎｉｔ）の活性化関数（ＡｃｔｉｖａｔｉｏｎＦｕｎｃｔｉｏｎ）が適用されて、ラーニングネットワークＦで遂行しようとするタスクによるタスク特化出力を生成することができる。この際、活性化関数としては、シグモイド（Ｓｉｇｍｏｉｄ）関数、線形（Ｌｉｎｅａｒ）関数、ソフトマックス（Ｓｏｆｔｍａｘ）関数、ＲｅＬＵ（Ｒｌｉｎｅａｒ）関数、二乗（Ｓｑｕａｒｅ）関数、ＳＱＲＴ関数、Ｓｒｌｉｎｅａｒ関数、ＡＢＳ関数、ＴＡＮＨ関数、Ｂｒｌｉｎｅａｒ関数などが使用され得るが、これに限定されない。

一例として、ラーニングネットワークＦがクラス分類のためのタスクを遂行する場合、学習装置１００は、ラーニングネットワークＦから出力される第１特性情報をクラスごとにマッピングして、マーキング済み学習データに対するクラスごとの確率を生成することができる。

この際、クラスごとの確率は、設定されたクラスごとにラーニングネットワークＦから出力される第１特性情報Ｆ（ｘ’）が正解である確率を示すことができる。例えば、学習データが顔のイメージデータである場合に、顔が笑顔の状態である確率は０．７５、笑顔でない状態である確率は０．２５等のように出力され得る。この際、ラーニングネットワークＦから出力される第１特性情報Ｆ（ｘ’）をクラスごとにマッピングするのにソフトマックスアルゴリズムを使用することができるが、これに限定されず、第１特性情報Ｆ（ｘ’）をクラスごとにマッピングする様々なアルゴリズムが利用され得る。

また、判別器Ｄに入力された変換学習データ又は変換マーキング済み学習データにそれぞれ対応する変換データスコア又は変換マーキング済みデータスコアの最大値は、変換学習データ又は変換マーキング済み学習データが本物であるものと判別する１であり、判別器Ｄに入力されたマーキング済み学習データに対応するマーキング済みデータスコアの最小値は、マーキング済み学習データｘ’が偽物であるものと判別する０であり得る。すなわち、判別器Ｄは、マーキング済み学習データｘ’を変換学習データ又は変換マーキング済み学習データとして認識するように学習され得る。

そして、学習装置１００が第１エラーを最小化して第２エラーを最大化するように、データエンベディングネットワークＧを学習すると、学習装置１００はラーニングネットワークＦの学習済みパラメータを固定してアップデートせず、データエンベディングネットワークＧに対してのみ学習を進めることができる。

これに加えて、学習装置１００は、原本学習データｘとマーキング済み学習データｘ’との間の類似度をさらに参照して類似度を最小化するように、データエンベディングネットワークＧを学習することができる。すなわち、原本学習データｘとマーキング済み学習データｘ’との間の差異を参照して類似度を算出し、類似度を最小化するようにデータエンベディングネットワークＧを学習することにより、データエンベディングネットワークＧは原本学習データとはかなり差異のあるマーキング済み学習データを出力することが可能となる。

前記の学習方法により、データエンベディングネットワークＧは、ラーニングネットワークＦの出力を参照して取得されたデータエラーを最小化し、判別器Ｄのマーキング済みデータスコアを最大化又は／及び原本学習データｘとマーキング済み学習データｘ’との類似度を最小化するように学習されることにより、原本学習データｘとマーク学習データｗとを利用してマーキング済み学習データが生成されると、マーキング済み学習データｘ’は原本学習データｘとは差異が大きく表れるが、ラーニングネットワークＦでは、原本学習データｘを利用して算出された結果と同一又は類似した結果が出るようにマーキング済み学習データｘ’を利用して算出された結果を出力することができる。すなわち、人又は他のコンピューティング装置にはマーキング済み学習データｘ’からマーク学習データｗが区分されて認識されるものの、ラーニングネットワークＦではマーク学習データｗによる何らの影響もなしに原本学習データｘを認識することが可能となる。

図３は、本発明の一実施例において、原本学習データとマーク学習データとを利用してマーキング済み学習データを生成するデータエンベディングネットワークを学習する他の方法を簡略に示したものであって、すなわち、ラーニングネットワークＦが学習済みパラメータを有する多数のラーニングネットワークＦ１、Ｆ２、…，Ｆｎで構成されたものである。この場合、多数のランニングネットワークＦ１、Ｆ２、…、Ｆｎそれぞれは、互いに異なるタスクを遂行するように学習済みの状態であり得る。下記の説明においては、前記図２の説明で容易に理解可能な部分については詳細な説明を省略することにする。

先ず、原本学習データｘとマーク学習データｗとが取得されると、学習装置１００は、原本学習データｘとマーク学習データｗとをデータエンベディングネットワークＧに入力して、データエンベディングネットワークＧをもって原本学習データｘとマーク学習データｗとを合成させて、マーキング済み学習データ（ｘ’すなわち、Ｇ（ｘ，ｗ））を生成させる。

次に、学習装置１００は、マーキング済み学習データｘ’を第１ラーニングネットワークＦ１乃至第ｎラーニングネットワークＦｎそれぞれに入力して、それぞれの第１ラーニングネットワークＦ１乃至第ｎラーニングネットワークＦｎをもって第１ラーニングネットワークＦ１乃至第ｎラーニングネットワークＦｎそれぞれの第１学習済みパラメータ乃至第ｎ学習済みパラメータを利用して、マーキング済み学習データｘ’に対してそれぞれのネットワークに対応するネットワーク演算を適用させてマーキング済み学習データｘ’に対応するそれぞれの第１＿１特性情報Ｆ１（ｘ’）乃至第１＿ｎ特性情報Ｆｎ（ｘ’）を生成させる。また、学習装置１００は、原本学習データｘを第１ラーニングネットワークＦ１乃至第ｎラーニングネットワークＦｎそれぞれに入力して、それぞれの第１ラーニングネットワークＦ１乃至第ｎラーニングネットワークＦｎをもって第１ラーニングネットワークＦ１乃至第ｎラーニングネットワークＦｎそれぞれの第１学習済みパラメータ乃至第ｎ学習済みパラメータを利用して、原本学習データｘに対してそれぞれのネットワークに対応するネットワーク演算を適用させて原本学習データｘに対応するそれぞれの第２＿１特性情報Ｆ１（ｘ）乃至第２＿ｎ特性情報Ｆｎ（ｘ）を生成させることができる。

次に、学習装置１００は、（ｉ）（ｉ－１）第１＿１特性情報Ｆ１（ｘ’）と第２＿１特性情報Ｆ１（ｘ）とを参照して取得された第１＿１エラー、乃至第１＿ｎ特性情報Ｆｎ（ｘ’）と第２＿ｎ特性情報Ｆｎ（ｘ）とを参照して取得された第１＿ｎエラー、の平均である第１エラー、及び（ｉ－２）第１＿１特性情報Ｆ１（ｘ’）を利用して生成された少なくとも１つの第１タスク特化出力とこれに対応する少なくとも一つの第１原本正解とを参照して取得された第２＿１エラー、乃至前記第１＿ｎ特性情報を利用して生成された少なくとも１つの第ｎタスク特化出力とこれに対応する少なくとも一つの第ｎ原本正解とを参照して取得された第２＿ｎエラー、の平均である第２エラーのうち少なくとも一部を参照して算出されたデータエラーを最小化し、（ｉｉ）入力されるデータが本物であるか偽物であるかを判別する判別器Ｄに入力されたマーキング済み学習データｘ’に対応するマーキング済みデータスコアを最大化するように、データエンベディングネットワークＧを学習することができる。そして、学習装置１００は、判別器Ｄに入力された変換学習データ又は変換マーキング済み学習データに対応する変換データスコア又は変換マーキング済みデータスコアを最大化し、マーキング済みデータスコアを最小化するように、判別器Ｄを学習することができる。

すなわち、学習装置１００は、第１＿１特性情報Ｆ１（ｘ’）と第２＿１特性情報Ｆ１（ｘ）とを参照して算出された第１＿１エラーを取得し、第１＿２特性情報Ｆ２（ｘ’）と第２＿２特性情報Ｆ２（ｘ）とを参照して算出された第１＿２エラーを取得し、同様に第１＿ｎ特性情報Ｆｎ（ｘ’）と第２＿ｎ特性情報Ｆｎ（ｘ）とを参照して算出された第１＿ｎエラーを取得して、取得された第１＿１エラー乃至取得された第１＿ｎエラーの平均である第１エラーを取得することができる。そして、学習装置１００は、第１＿１特性情報Ｆ１（ｘ’）を利用して生成された第１タスク特化出力とこれに対応する第１原本正解とを参照して算出された第２＿１エラーを取得し、第１＿２特性情報Ｆ２（ｘ’）を利用して生成された少なくとも１つの第２タスク特化出力とこれに対応する少なくとも１つの第２原本正解とを参照して算出された第２＿２エラーを取得し、同様に第１＿ｎ特性情報Ｆｎ（ｘ’）を利用して生成された少なくとも１つの第ｎタスク特化出力とこれに対応する少なくとも１つの第ｎ原本正解とを参照して算出された第２＿ｎエラーを取得して、取得された第２＿１エラー乃至取得された第２＿ｎエラーの平均である第２エラーを取得する。そして、学習装置１００は、（Ｉ）第１エラーと第２エラーとのうち少なくとも一部を参照して算出された少なくとも一つのデータエラーを最小化し、判別器Ｄに入力されたマーキング済み学習データｘ’に対応する少なくとも一つのマーキング済みデータスコアを最大化するように、データエンベディングネットワークＧを学習し、（ＩＩ）判別器Ｄに入力された変換学習データ又は変換マーキング済み学習データに対応する少なくとも一つの変換データスコア又は少なくとも一つの変換マーキング済みデータスコアを最大化し、マーキング済みデータスコアを最小化するように、判別器Ｄを学習することができる。

この際、データエラーは、第１エラー、第２エラー、及び第１エラーと第２エラーとの和のうちいずれかであり得るが、本発明がこれに限定されるわけではない。

一方、前記では、（ｉ）（ｉ－１）第１＿１特性情報Ｆ１（ｘ’）と第２＿１特性情報Ｆ１（ｘ）とを参照して取得された第１＿１エラー、乃至第１＿ｎ特性情報Ｆｎ（ｘ’）と第２＿ｎ特性情報Ｆｎ（ｘ）とを参照して取得された第１＿ｎエラー、の平均である第１エラー、及び（ｉ－２）第１＿１特性情報Ｆ１（ｘ’）を利用して生成された第１タスク特化出力とこれに対応する第１原本正解とを参照して取得された第２＿１エラー、乃至第１＿ｎ特性情報Ｆｎ（ｘ’）を利用して生成された第ｎタスク特化出力とこれに対応する第ｎ原本正解とを参照して取得された第２＿ｎエラー、の平均である第２エラーのうち少なくとも一部を参照して算出されたデータエラーを最小化し、（ｉｉ）判別器に入力されたマーキング済み学習データｘ’に対応するマーキング済みデータスコアを最大化するように、データエンベディングネットワークＧを学習することができる。しかし、別の例として、第１＿１エラーと第２＿１エラーとのうち少なくとも一部を参照して算出された少なくとも一つの第１データエラー、乃至第１＿ｎエラーと第２＿ｎエラーとのうち少なくとも一部を参照して算出された少なくとも一つの第ｎデータエラーを最小化するように、データエンベディングネットワークＧを順次学習することもできる。

すなわち、学習装置１００は、原本学習データｘとマーク学習データｗとをデータエンベディングネットワークＧに入力して、データエンベディングネットワークＧをもって原本学習データｘとマーク学習データｗとを合成させて第１マーキング済み学習データｘ１’を生成させる。そして、学習装置１００は、（ｉ）第１マーキング済み学習データｘ１’を第１ラーニングネットワークＦ１に入力して、第１ラーニングネットワークＦ１をもって第１ラーニングネットワークＦ１の第１学習済みパラメータを利用して、第１マーキング済み学習データｘ１’に対してネットワーク演算を適用させて第１マーキング済み学習データｘ１’に対応する第１＿１特性情報Ｆ１（ｘ１’）を出力させ、（ｉｉ）原本学習データｘを第１ラーニングネットワークＦ１に入力して第１ラーニングネットワークＦ１をもって第１学習済みパラメータを利用して、原本学習データｘに対してネットワーク演算を適用させて原本学習データｘに対応する第２＿１特性情報Ｆ１（ｘ）を出力させる。以後、学習装置１００は、（ｉ）（ｉ－１）第１＿１特性情報Ｆ１（ｘ１’）と第２＿１特性情報Ｆ１（ｘ）とを参照して取得された第１＿１エラー、及び（ｉ－２）第１＿１特性情報Ｆ１（ｘ’）を利用して生成された第１タスク特化出力とこれに対応する第１原本正解とを参照して取得された第２＿１エラーのうち少なくとも一部を参照して算出された第１データエラーを最小化し、（ｉｉ）判別器Ｄに入力された第１マーキング済み学習データｘ１’に対応する第１マーキング済みデータスコアを最大化するように、データエンベディングネットワークＧを学習して、データエンベディングネットワークＧが第１学習済みデータエンベディングネットワークＧ１となるようにすることができる。そして、学習装置１００は、判別器Ｄに入力された変換学習データ又は変換マーキング済み学習データに対応する少なくとも一つの第１変換データスコア又は少なくとも一つの第１変換マーキング済みデータスコアを最大化し、第１マーキング済みデータスコアを最小化するように、判別器Ｄを学習して、判別器Ｄが第１学習済み判別器（Ｄ１）となるようにすることができる。

そして、学習装置１００は、整数であるｋを２からｎまで増加させて行き、前記のプロセスを繰り返して第ｎラーニングネットワークＦｎまで遂行することにより、第ｎ学習済みデータエンベディングネットワークＧｎを取得することが可能となる。

すなわち、学習装置１００は、原本学習データｘとマーク学習データｗとを第ｋ－１学習済みデータエンベディングネットワークＧ（ｋ－１）に入力して、第ｋ－１学習済みデータエンベディングネットワークＧ（ｋ－１）をもって原本学習データｘとマーク学習データｗとを合成させて、第ｋマーキング済み学習データｘｋ’を生成させる。そして、学習装置１００は、（ｉ）第ｋマーキング済み学習データｘｋ’を第ｋラーニングネットワークＦｋに入力して、第ｋラーニングネットワークＦｋをもって第ｋラーニングネットワークＦｋの少なくとも一つの第ｋ学習済みパラメータを利用して、第ｋマーキング済み学習データｘｋ’に対してネットワーク演算を適用させて第ｋマーキング済み学習データｘｋ’に対応する第１＿ｋ特性情報Ｆｋ（ｘｋ’）を出力させ、（ｉｉ）原本学習データｘを第ｋラーニングネットワークＦｋに入力して、第ｋラーニングネットワークＦｋをもって第ｋ学習済みパラメータを利用して、原本学習データｘに対してネットワーク演算を適用させて原本学習データｘに対する第２＿ｋ特性情報Ｆｋ（ｘｋ）を出力させる。以後、学習装置１００は、（ｉ）（ｉ－１）第１＿ｋ特性情報Ｆｋ（ｘｋ’）と第２＿ｋ特性情報Ｆｋ（ｘ）とを参照して取得された少なくとも１つの第１＿ｋエラー、及び（ｉ－２）第１＿ｋ特性情報Ｆｋ（ｘ’）を利用して生成された少なくとも１つの第ｋタスク特化出力とこれに対応する少なくとも１つの第ｋ原本正解とを参照して取得された少なくとも１つの第２＿ｋエラーのうち少なくとも一部を参照して算出された少なくとも一つの第ｋデータエラーを最小化し、（ｉｉ）第ｋ－１学習済み判別器Ｄ（ｋ－１）に入力された少なくとも一つの第ｋマーキング済み学習データｘｋ’に対応する少なくとも一つの第ｋマーキング済みデータスコアを最大化するように、第ｋ－１学習済みデータエンベディングネットワークＧ（ｋ－１）を学習して、第ｋ－１学習済みデータエンベディングネットワークＧ（ｋ－１）が第ｋ学習済みデータエンベディングネットワークＧｋとなるようにすることができる。そして、第ｋ－１学習済み判別器Ｄ（ｋ－１）に入力された変換学習データ又は変換マーキング済み学習データに対応する少なくとも一つの第ｋ変換データスコア又は少なくとも一つの第ｋ変換マーキング済みデータスコアを最大化し、少なくとも一つの第ｋマーキング済みデータスコアを最小化するように、第ｋ－１学習済み判別器Ｄ（ｋ－１）を学習して、第ｋ－１学習済み判別器Ｄ（ｋ－１）が第ｋ学習済み判別器Ｄｋとなるようにすることができる。

図４は、本発明の一実施例において、原本データとマークデータとを合成してマーキング済みデータを生成するように学習済みデータエンベディングネットワークＧをテストするテスト装置を簡略に示したものである。

図４を参照すると、本発明の一実施例によるテスト装置２００は、ラーニングネットワークが原本データを利用して算出した結果と同一又は類似した結果をマーキング済みデータを利用して出力するように、原本データとマークデータとを利用してマーキング済みデータを生成する学習済みデータエンベディングネットワークをテストするためのインストラクションが格納されたメモリ２１０と、メモリ２１０に格納されたインストラクションにしたがって学習済みデータエンベディングネットワークをテストする動作を遂行するプロセッサ２２０とを含むことができる。

具体的には、テスト装置２００は、少なくとも一つのコンピューティング装置（例えば、コンピュータプロセッサ、メモリ、ストレージ、入力装置及び出力装置、その他既存のコンピューティング装置の構成要素；ルータ、スイッチなどのような電子通信装置；ネットワーク接続ストレージ（ＮＡＳ）及びストレージ領域ネットワーク（ＳＡＮ）のような電子情報ストレージシステム）と少なくとも一つのコンピュータソフトウェア（すなわち、コンピューティング装置をもって特定の方式で機能させるインストラクション）との組み合わせを利用して所望のシステム性能を一般的に達成するものであり得る。

しかし、コンピューティング装置が、本発明を実施するためのプロセッサ、メモリ、ミディアム又は他のコンピューティング要素の任意の組み合わせを含む統合装置を排除するものではない。

一方、前記図２と図３の説明における方法によりデータエンベディングネットワークが合成された状態である場合、一例として、学習装置が、（ｉ）原本学習データとマーク学習データとが取得されると、原本学習データとマーク学習データとをデータエンベディングネットワークに入力して、データエンベディングネットワークをもって原本学習データとマーク学習データとを合成させてマーキング済み学習データを生成させ、（ｉｉ）（ｉｉ－１）マーキング済み学習データを学習済みパラメータを有するラーニングネットワークに入力して、ラーニングネットワークをもって学習済みパラメータを利用して、マーキング済み学習データに対してネットワーク演算を適用させてマーキング済み学習データに対応する第１特性情報を生成させ、（ｉｉ－２）原本学習データをラーニングネットワークに入力して、ラーニングネットワークをもって学習済みパラメータを利用して、原本学習データに対してネットワーク演算を適用させて原本学習データに対応する第２特性情報を生成させ、（ｉｉｉ）（ｉｉｉ－１）第１特性情報と第２特性情報とを参照して取得された第１エラー、及び（ｉｉｉ－２）第１特性情報を利用して生成されたタスク特化出力とこれに対応する原本正解とを参照して取得された第２エラーのうち少なくとも一部を参照して算出されたデータエラーを最小化し、入力されるデータが本物であるか偽物であるかを判別する判別器に入力されたマーキング済み学習データに対応するマーキング済みデータスコアを最大化するように、データエンベディングネットワークを学習し、（ｉｖ）判別器に入力された変換学習データ又は変換マーキング済み学習データに対応する変換データスコア又は変換マーキング済みデータスコアを最大化し、マーキング済みデータスコアを最小化するように、判別器を学習した状態で、テスト装置２００は、合成しようとする原本テストデータとマークテストデータとを取得し、原本テストデータとマークテストデータとをデータエンベディングネットワークに入力して、データエンベディングネットワークをもってデータエンベディングネットワークの学習済みパラメータを利用して原本テストデータとマークテストデータとを合成して、マーキング済みテストデータを出力させることができる。

図５は、本発明の一実施例において、学習済みデータエンベディングネットワークをテストする方法を簡略に示したものである。

図５を参照すると、図２と図３に説明されているように、学習方法にしたがってデータエンベディングネットワークが学習された状態で、合成しようとする原本テストデータとマークテストデータとが取得されると、テスト装置２００が、原本テストデータとマークテストデータとをデータエンベディングネットワークに入力して、データエンベディングネットワークをもってデータエンベディングネットワークの学習済みパラメータを利用して、原本テストデータとマークテストデータとを合成させてマーキング済みテストデータを出力させることができる。

この際、原本テストデータとマーキング済みテストデータとは、人又はコンピューティング装置には互いに異なるデータとして認識されるものの、ラーニングネットワークでは原本テストデータとマーキング済みテストデータとが同一又は類似した結果として認識され得る。

一方、データエンベディングネットワークは、図２と図３の説明における学習方法により学習済みの状態であり得る。

一例として、学習装置は、（ｉ）原本学習データとマーク学習データとが取得されると、原本学習データとマーク学習データとをデータエンベディングネットワークに入力して、データエンベディングネットワークをもって原本学習データとマーク学習データとを合成させてマーキング済み学習データを生成させ、（ｉｉ）マーキング済み学習データを学習済みパラメータを有するラーニングネットワークに入力して、ラーニングネットワークをもって学習済みパラメータを利用して、マーキング済み学習データに対してネットワーク演算を適用させてマーキング済み学習データに対応する第１特性情報を生成させ、原本学習データをラーニングネットワークに入力して、ラーニングネットワークをもって学習済みパラメータを利用して、原本学習データに対してネットワーク演算を適用させて原本学習データに対応する第２特性情報を生成させ、（ｉｉｉ）（ｉｉｉ－１）第１特性情報と第２特性情報とを参照して取得された第１エラー、及び（ｉｉｉ－２）第１特性情報を利用して生成されたタスク特化出力とこれに対応する原本正解とを参照して取得された第２エラーのうち少なくとも一部を参照して算出されたデータエラーを最小化し、入力されるデータが本物であるか偽物であるかを判別する判別器に入力されたマーキング済み学習データに対応するマーキング済みデータスコアを最大化するように、データエンベディングネットワークを学習し、（ｉｖ）判別器に入力された変換学習データ又は変換マーキング済み学習データに対応する変換データスコア又は変換マーキング済みデータスコアを最大化し、マーキング済みデータスコアを最小化するように、判別器を学習した状態であり得る。

また、前記において、ラーニングネットワークは、それぞれ第１学習済みパラメータ乃至第ｎ学習済みパラメータを有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、学習装置は、（ｉ）マーキング済み学習データを第１ラーニングネットワーク乃至第ｎラーニングネットワークそれぞれに入力して、それぞれの第１ラーニングネットワーク乃至第ｎラーニングネットワークをもって（ｉ－１）第１ラーニングネットワーク乃至第ｎラーニングネットワークそれぞれの第１学習済みパラメータ乃至第ｎ学習済みパラメータを利用して、マーキング済み学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉ－２）マーキング済み学習データに対するそれぞれの第１＿１特性情報乃至第１＿ｎ特性情報を出力させ、（ｉｉ）原本学習データを第１ラーニングネットワーク乃至第ｎラーニングネットワークそれぞれに入力して、それぞれの第１ラーニングネットワーク乃至第ｎラーニングネットワークをもって（ｉｉ－１）第１ラーニングネットワーク乃至第ｎラーニングネットワークそれぞれの第１学習済みパラメータ乃至第ｎ学習済みパラメータを利用して、原本学習データに対してネットワーク演算を適用させて（ｉｉ－２）原本学習データに対するそれぞれの第２＿１特性情報乃至第２＿ｎ特性情報を出力させ、（ｉｉｉ）（ｉｉｉ－１）（ｉｉｉ－１ａ）第１＿１特性情報と第２＿１特性情報とを参照して取得された第１＿１エラー、乃至第１＿ｎ特性情報と第２＿ｎ特性情報とを参照して取得された第１＿ｎエラー、の平均である第１エラー、及び（ｉｉｉ－１ｂ）第１＿１特性情報を利用して生成された少なくとも一つの第１タスク特化出力とこれに対応する少なくとも一つの第１原本正解とを参照して取得された第２＿１エラー、乃至第１＿ｎ特性情報を利用して生成された少なくとも一つの第ｎタスク特化出力とこれに対応する少なくとも一つの第ｎ原本正解とを参照して取得された第２＿ｎエラー、の平均である第２エラーのうち少なくとも一部を参照して算出されたデータエラーを最小化し、（ｉｉｉ－２）判別器に入力されたマーキング済み学習データ対応するマーキング済みデータスコアを最大化するように、データエンベディングネットワークを学習し、（ｉｖ）判別器に入力された変換学習データ又は変換マーキング済み学習データに対応する変換データスコア又は変換マーキング済みデータスコアを最大化し、マーキング済みデータスコアを最小化するように、判別器を学習した状態であり得る。

また、前記において、ラーニングネットワークは、それぞれ第１学習済みパラメータ乃至第ｎ学習済みパラメータを有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、学習装置は、（ｉ）原本学習データとマーク学習データとをデータエンベディングネットワークに入力して、データエンベディングネットワークをもって原本学習データとマーク学習データとを合成して第１マーキング済み学習データを生成させ、（ｉｉ）第１マーキング済み学習データを第１ラーニングネットワークに入力して、第１ラーニングネットワークをもって第１ラーニングネットワークの第１学習済みパラメータを利用して、第１マーキング済み学習データに対してネットワーク演算を適用させて第１マーキング済み学習データに対応する第１＿１特性情報を出力させ、原本学習データを第１ラーニングネットワークに入力して、第１ラーニングネットワークをもって第１ラーニングネットワークの第１学習済みパラメータを利用して、原本学習データに対してネットワーク演算を適用させて原本学習データに対応する第２＿１特性情報を出力させ、（ｉｉｉ）（ｉｉｉ－１）第１＿１特性情報と第２＿１特性情報とを参照して取得された第１＿１エラー、及び（ｉｉｉ－２）第１＿１特性情報を利用して生成された第１タスク特化出力とこれに対応する第１原本正解とを参照して取得された第２＿１エラーのうち少なくとも一部を参照して算出された第１データエラーを最小化し、判別器に入力された第１マーキング済み学習データに対応する第１マーキング済みデータスコアを最大化するように、データエンベディングネットワークを学習して、データエンベディングネットワークが第１学習済みデータエンベディングネットワークとなるようにし、（ｉｖ）判別器に入力された変換学習データ又は変換マーキング済み学習データに対応する第１変換データスコア又は第１変換マーキング済みデータスコアを最大化し、第１マーキング済みデータスコアを最小化するように、判別器を学習して、判別器が第１学習済み判別器となるようにした状態であり得る。そして、整数であるｋを２からｎまで増加させて行き、学習装置は、（ｉ）原本学習データとマーク学習データとを第ｋ－１学習済みデータエンベディングネットワークに入力して、第ｋ－１学習済みデータエンベディングネットワークをもって原本学習データとマーク学習データとを合成させて第ｋマーキング済み学習データを生成させ、（ｉｉ）第ｋマーキング済み学習データを第ｋラーニングネットワークに入力して、第ｋラーニングネットワークをもって第ｋラーニングネットワークの少なくとも一つの第ｋ学習済みパラメータを利用して、第ｋマーキング済み学習データに対してネットワーク演算を適用させて第ｋマーキング済み学習データに対応する第１＿ｋ特性情報を出力させ、原本学習データを第ｋラーニングネットワークに入力して、第ｋラーニングネットワークをもって第ｋ学習済みパラメータを利用して、原本学習データに対してネットワーク演算を適用させて原本学習データに対応する第２＿ｋ特性情報を出力させ、（ｉｉｉ）（ｉｉｉ－１）第１＿ｋ特性情報と第２＿ｋ特性情報とを参照して取得された少なくとも一つの第１＿ｋエラーと、（ｉｉｉ－２）第１＿ｋ特性情報を利用して生成された少なくとも一つの第ｋタスク特化出力とこれに対応する少なくとも一つの第ｋ原本正解とを参照して取得された少なくとも一つの第２＿ｋエラーのうち少なくとも一部を参照して算出された少なくとも一つの第ｋデータエラーを最小化し、第ｋ－１学習済み判別器に入力された第ｋマーキング済み学習データに対応する少なくとも一つの第ｋマーキング済みデータスコアを最大化するように、第ｋ－１学習済みデータエンベディングネットワークを学習して、第ｋ－１学習済みデータエンベディングネットワークが第ｋ学習済みデータエンベディングネットワークとなるようにし、（ｉｖ）第ｋ－１学習済み判別器に入力された変換学習データ又は変換マーキング済み学習データに対応する少なくとも一つの第ｋ変換データスコア又は少なくとも一つの第ｋ変換マーキング済みデータスコアを最大化し、第ｋマーキング済みデータスコアを最小化するように、第ｋ－１学習済み判別器を学習して、前記第ｋ－１学習済み判別器が第ｋ学習済み判別器となるようにした状態であり得る。

一方、本発明の実施例において、データエンベディングネットワークで原本データとマークデータとを合成して生成されたマーキング済みデータは、ビッグデータの購入を希望する購入者に提供又は販売され得る。

この場合に、本発明の一実施例によって生成されたマーキング済みデータはマークデータが合成されているので、購入者の無断コピー又は無断複製を困難にするだけでなく、第三者に無断で提供されても、後に容易に追跡することが可能となる。また、本発明の一実施例によると、マーキング済みデータは人にとっては原本データと互いに異なるように認識され得るが、ラーニングネットワークでは原本データと互いに同一又は類似して認識され得るようになる。

一方、本明細書に明示された「平均」は、加重平均（ＷｅｉｇｈｔｅｄＡｖｅｒａｇｅ）を意味するが、これに限定されるわけではない。

以上にて説明された本発明による実施例は、多様なコンピュータの構成要素を通じて実行することができるプログラム命令語の形態で具現されて、コンピュータ読取り可能な記録媒体に格納され得る。前記コンピュータ読取り可能な記録媒体は、プログラム命令語、データファイル、データ構造などを単独で又は組み合わせて含むことができる。前記コンピュータ読取り可能な記録媒体に格納されるプログラム命令語は、本発明のために特別に設計され、構成されたものであるか、コンピュータソフトウェア分野の当業者に公知にされて使用可能なものであり得る。コンピュータ読取り可能な記録媒体の例には、ハードディスク、フロッピー（登録商標）ディスク及び磁気テープのような磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤのような光記録媒体、フロプティカルディスク（ＦｌｏｐｔｉｃａｌＤｉｓｋ）のような磁気－光メディア（Ｍａｇｎｅｔｏ－ＯｐｔｉｃａｌＭｅｄｉａ）、及びＲＯＭ、ＲＡＭ、フラッシュメモリなどのようなプログラム命令語を格納して遂行するように特別に構成されたハードウェア装置が含まれる。プログラム命令語の例には、コンパイラによって作られるもののような機械語コードだけでなく、インタープリターなどを使用してコンピュータによって実行され得る高級言語コードも含まれる。前記ハードウェア装置は、本発明による処理を遂行するために一つ以上のソフトウェアモジュールとして作動するように構成され得、その反対も同様である。

以上にて本発明が具体的な構成要素などのような特定事項と限定された実施例及び図面によって説明されたが、これは本発明のより全般的な理解の一助とするために提供されたものであるに過ぎず、本発明が前記実施例に限られるものではなく、本発明が属する技術分野において通常の知識を有する者であれば、かかる記載から多様な修正及び変形が行われ得る。

したがって、本発明の思想は、前記説明された実施例に局限されて定められてはならず、後述する特許請求の範囲だけでなく、本特許請求の範囲と均等又は等価的に変形されたものすべては、本発明の思想の範囲に属するといえる。

１００：学習装置
１１０：メモリ
１２０：プロセッサ
２００：テスト装置
２１０：メモリ
２２０：プロセッサ

Claims

原本データとマークデータ（ＭａｒｋＤａｔａ）とを合成してマーキング済みデータ（ＭａｒｋｅｄＤａｔａ）を生成するデータエンベディングネットワーク（ＤａｔａＥｍｂｅｄｄｉｎｇＮｅｔｗｏｒｋ）を学習する方法において、
（ａ）原本学習データとマーク学習データとが取得されると、学習装置が、前記原本学習データと前記マーク学習データとをデータエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成させてマーキング済み学習データを生成させる段階と、
（ｂ）前記学習装置が、（ｉ）前記マーキング済み学習データを少なくとも一つの学習済みパラメータを有するラーニングネットワークに入力して、前記ラーニングネットワークをもって（ｉ－１）前記学習済みパラメータを利用して、前記マーキング済み学習データに対してネットワーク演算を適用させて（ｉ－２）前記マーキング済み学習データに対応する第１特性情報（ＣｈａｒａｃｔｅｒｉｓｔｉｃＩｎｆｏｒｍａｔｉｏｎ）を生成させ、（ｉｉ）前記原本学習データを前記ラーニングネットワークに入力して、前記ラーニングネットワークをもって（ｉｉ－１）前記学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対応する第２特性情報を生成させる段階と、
（ｃ）前記学習装置が、（ｃ１）（ｉ）（ｉ－１）前記第１特性情報と前記第２特性情報とを参照して取得された少なくとも一つの第１エラー、及び（ｉ－２）前記第１特性情報を利用して生成された少なくとも一つのタスク特化出力（ＴａｓｋＳｐｅｃｉｆｉｃＯｕｔｐｕｔ）とこれに対応する少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して取得された少なくとも一つの第２エラーのうち少なくとも一部を参照して算出された少なくとも一つのデータエラーを最小化し、（ｉｉ）入力されるデータが本物であるか偽物であるかを判別する判別器（Ｄｉｓｃｒｉｍｉｎａｔｏｒ）に入力された前記マーキング済み学習データに対応する少なくとも一つのマーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習し、（ｃ２）前記判別器に入力された変換学習データ又は変換マーキング済み学習データにそれぞれ対応する少なくとも一つの変換データスコア又は少なくとも一つの変換マーキング済みデータスコアを最大化し、前記マーキング済みデータスコアを最小化するように、前記判別器を学習し、前記変換学習データ又は前記変換マーキング済み学習データは、それぞれ前記原本学習データ又は前記マーキング済み学習データを変換して生成される段階と、
を含む方法。
前記ラーニングネットワークは、少なくとも１つの第１学習済みパラメータ乃至少なくとも１つの第ｎ学習済みパラメータをそれぞれ有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、前記ｎは１以上の整数（ｉｎｔｅｇｅｒ）であると、
前記（ｂ）段階で、
前記学習装置は、（ｉ）前記マーキング済み学習データを前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれに入力して、それぞれの前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークをもって（ｉ－１）前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれの前記第１学習済みパラメータ乃至前記第ｎ学習済みパラメータを利用して、前記マーキング済み学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉ－２）前記マーキング済み学習データに対するそれぞれの第１＿１特性情報乃至第１＿ｎ特性情報を出力させ、（ｉｉ）前記原本学習データを前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれに入力して、それぞれの前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークをもって（ｉｉ－１）それぞれの前記第１学習済みパラメータ乃至前記第ｎ学習済みパラメータを利用して、前記原本学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対するそれぞれの第２＿１特性情報乃至第２＿ｎ特性情報を出力させ、
前記（ｃ）段階で、
前記学習装置は、（ｉ）（ｉ－１）前記第１＿１特性情報と前記第２＿１特性情報とを参照して取得された第１＿１エラー、乃至前記第１＿ｎ特性情報と前記第２＿ｎ特性情報とを参照して取得された第１＿ｎエラー、の平均である前記第１エラー、及び（ｉ－２）前記第１＿１特性情報を利用して生成された少なくとも１つの第１タスク特化出力とこれに対応する少なくとも１つの第１原本正解とを参照して取得された第２＿１エラー、乃至前記第１＿ｎ特性情報を利用して生成された少なくとも一つの第ｎタスク特化出力とこれに対応する少なくとも一つの第ｎ原本正解とを参照して取得された第２＿ｎエラー、の平均である前記第２エラーのうち少なくとも一部を参照して算出された前記データエラーを最小化し、前記判別器に入力された前記マーキング済み学習データに対応する前記マーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習し、（ｉｉ）前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する前記変換データスコア又は前記変換マーキング済みデータスコアを最大化し、前記マーキング済みデータスコアを最小化するように、前記判別器を学習する請求項１に記載の方法。
前記ラーニングネットワークは、少なくとも一つの第１学習済みパラメータ乃至少なくとも一つの第ｎ学習済みパラメータを有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、前記ｎは１以上の整数であると、
前記（ａ）段階で、
前記学習装置は、前記原本学習データと前記マーク学習データとを前記データエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成させて第１マーキング済み学習データを生成させ、
前記（ｂ）段階で、
前記学習装置は、（ｉ）前記第１マーキング済み学習データを前記第１ラーニングネットワークに入力して、前記第１ラーニングネットワークをもって（ｉ－１）前記第１ラーニングネットワークの前記第１学習済みパラメータを利用して、前記第１マーキング済み学習データに対してネットワーク演算を適用させて（ｉ－２）前記第１マーキング済み学習データに対する第１＿１特性情報を出力させ、（ｉｉ）前記原本学習データを前記第１ラーニングネットワークに入力して、前記第１ラーニングネットワークをもって（ｉｉ－１）前記第１学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対する第２＿１特性情報を出力させ、
前記（ｃ）段階で、
前記学習装置は、（ｃ１）（ｉ）（ｉ－１）前記第１＿１特性情報と前記第２＿１特性情報とを参照して取得された少なくとも一つの第１＿１エラー、及び（ｉ－２）前記第１＿１特性情報を利用して生成された少なくとも一つの第１タスク特化出力とこれに対応する少なくとも一つの第１原本正解とを参照して取得された少なくとも一つの第２＿１エラーのうち少なくとも一部を参照して算出された少なくとも一つの第１データエラーを最小化し、（ｉｉ）前記判別器に入力された前記第１マーキング済み学習データに対応する少なくとも一つの第１マーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習して前記データエンベディングネットワークが第１学習済みデータエンベディングネットワークとなるようにし、（ｃ２）（ｉ）前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する少なくとも一つの第１変換データスコア又は少なくとも一つの第１変換マーキング済みデータスコアを最大化し、（ｉｉ）前記第１マーキング済みデータスコアを最小化するように、前記判別器を学習して前記判別器が第１学習済み判別器となるようにし、
前記学習装置は、整数であるｋを２からｎまで増加させて行き、（ｉ）前記原本学習データと前記マーク学習データとを第ｋ－１学習済みデータエンベディングネットワークに入力して、前記第ｋ－１学習済みデータエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成させて第ｋマーキング済み学習データを生成させ、（ｉｉ）前記第ｋマーキング済み学習データを第ｋラーニングネットワークに入力して、前記第ｋラーニングネットワークをもって前記第ｋラーニングネットワークの少なくとも一つの第ｋ学習済みパラメータを利用して、前記第ｋマーキング済み学習データに対してネットワーク演算を適用させて前記第ｋマーキング済み学習データに対応する第１＿ｋ特性情報を出力させ、前記原本学習データを前記第ｋラーニングネットワークに入力して、前記第ｋラーニングネットワークをもって前記第ｋ学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて前記原本学習データに対応する第２＿ｋ特性情報を出力させ、（ｉｉｉ）（ｉｉｉ－１）前記第１＿ｋ特性情報と前記第２＿ｋ特性情報とを参照して取得された少なくとも１つの第１＿ｋデータエラー、及び（ｉｉｉ－２）前記第１＿ｋ特性情報を利用して生成された少なくとも１つの第ｋタスク特化出力とこれに対応する少なくとも一つの第ｋ原本正解とを参照して取得された少なくとも一つの第２＿ｋエラーのうち少なくとも一部を参照して算出された少なくとも一つの第ｋデータエラーを最小化し、第ｋ－１学習済み判別器に入力された前記第ｋマーキング済み学習データに対応する少なくとも一つの第ｋマーキング済みデータスコアを最大化するように、第ｋ－１学習済みデータエンベディングネットワークを学習して前記第ｋ－１学習済みデータエンベディングネットワークが第ｋ学習済みデータエンベディングネットワークとなるようにし、（ｉｖ）前記第ｋ－１学習済み判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する少なくとも一つの第ｋ変換データスコア又は少なくとも一つの第ｋ変換マーキング済みデータスコアを最大化し、前記第ｋマーキング済みデータスコアを最小化するように、前記第ｋ－１学習済み判別器を学習して前記第ｋー１学習済み判別器が第ｋ学習済み判別器となるようにする請求項１に記載の方法。
前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する前記変換データスコア又は前記変換マーキング済みデータスコアの最大値は、前記変換学習データ又は前記変換マーキング済み学習データが本物であるものと判別する１であり、前記判別器に入力された前記マーキング済み学習データに対応する前記マーキング済みデータスコアの最小値は、前記マーキング済み学習データが偽物であるものと判別する０である請求項１に記載の方法。
前記（ｃ）段階で、
前記学習装置は、前記第１特性情報と前記第２特性情報との間の差異を参照して前記第１エラーを取得し、前記タスク特化出力と前記原本正解とを利用して生成された少なくとも１つのロスを参照して前記第２エラーを取得する請求項１に記載の方法。
前記学習装置は、前記第１特性情報と前記第２特性情報との間のノルム（Ｎｏｒｍ）又はコサイン類似度（ＣｏｓｉｎｅＳｉｍｉｌａｒｉｔｙ）を参照して前記第１エラーを取得する請求項５に記載の方法。
前記（ｃ）段階で、
前記学習装置は、前記原本学習データと前記マーキング済み学習データとの間の類似度をさらに参照して前記類似度を最小化するように前記データエンベディングネットワークを学習する請求項１に記載の方法。
原本データとマークデータとを合成してマーキング済みデータを生成するように学習済みデータエンベディングネットワークをテストする方法において、
（ａ）学習装置が、（ｉ）原本学習データとマーク学習データとが取得されると、前記原本学習データと前記マーク学習データとをデータエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成してマーキング済み学習データを生成させるプロセス、（ｉｉ）前記マーキング済み学習データを学習済みパラメータを有するラーニングネットワークに入力して、前記ラーニングネットワークをもって前記学習済みパラメータを利用して、前記マーキング済み学習データに対してネットワーク演算を適用させて前記マーキング済み学習データに対応する第１特性情報を生成させ、前記原本学習データを前記ラーニングネットワークに入力して、前記ラーニングネットワークをもって前記学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて前記原本学習データに対応する第２特性情報を生成させるプロセス、（ｉｉｉ）（ｉｉｉ－１）（ｉｉｉ－１ａ）前記第１特性情報と前記第２特性情報とを参照して取得された少なくとも１つの第１エラー、及び（ｉｉｉ－１ｂ）前記第１特性情報を利用して生成された少なくとも１つのタスク特化出力とこれに対応する少なくとも１つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して取得された少なくとも一つの第２エラーのうち少なくとも一部を参照して生成された少なくとも一つのデータエラーを最小化し、（ｉｉｉ－２）入力されるデータが本物であるか偽物であるかを判別する判別器に入力された前記マーキング済み学習データに対応する少なくとも一つのマーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習するプロセス、及び（ｉｖ）前記判別器に入力された変換学習データ又は変換マーキング済み学習データにそれぞれ対応する少なくとも一つの変換データスコア又は少なくとも一つの変換マーキング済みデータスコアを最大化し、前記マーキング済みデータスコアを最小化するように、前記判別器を学習し、前記変換学習データ又は前記変換マーキング済み学習データは、前記原本学習データ又は前記マーキング済み学習データを変換したデータであるプロセスを遂行した状態で、テスト装置が、合成しようとする原本テストデータとマークテストデータとを取得する段階と、
（ｂ）前記テスト装置が、前記原本テストデータと前記マークテストデータとを前記データエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記データエンベディングネットワークの少なくとも一つの学習済みパラメータを利用して前記原本テストデータと前記マークテストデータとを合成してマーキング済みテストデータを出力させる段階と、
を含む方法。
前記（ａ）段階で、
前記ラーニングネットワークは、少なくとも一つの第１学習済みパラメータ乃至少なくとも一つの第ｎ学習済みパラメータを有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、前記ｎは１以上の整数であると、
前記学習装置が、（ｉ）前記マーキング済み学習データを前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれに入力して、それぞれの前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークをもって（ｉ－１）前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれの少なくとも１つの前記第１学習済みパラメータ乃至少なくとも１つの前記第ｎ学習済みパラメータを利用して、前記マーキング済み学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉ－２）前記マーキング済み学習データに対応するそれぞれの第１＿１特性情報乃至第１＿ｎ特性情報を出力させるプロセス、（ｉｉ）前記原本学習データを前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれに入力して、それぞれの前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークをもって（ｉｉ－１）前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれの前記第１学習済みパラメータ乃至前記第ｎ学習済みパラメータを利用して、前記原本学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対するそれぞれの第２＿１特性情報乃至第２＿ｎ特性情報を出力させるプロセス、（ｉｉｉ）（ｉｉｉ－１）（ｉｉｉ－１ａ）前記第１＿１特性情報と前記第２＿１特性情報とを参照して取得された少なくとも一つの第１＿１エラー、乃至前記第１＿ｎ特性情報と前記第２＿ｎ特性情報とを参照して取得された少なくとも一つの第１＿ｎエラー、の平均である前記第１エラー、及び（ｉｉｉ－１ｂ）前記第１＿１特性情報を利用して生成された少なくとも一つの第１タスク特化出力とこれに対応する少なくとも一つの第１原本正解とを参照して取得された第２＿１エラー、乃至前記第１＿ｎ特性情報を利用して生成された少なくとも一つの第ｎタスク特化出力とこれに対応する少なくとも一つの第ｎ原本正解とを参照して取得された第２＿ｎエラー、の平均である前記第２エラーのうち少なくとも一部を参照して算出された前記データエラーを最小化し、（ｉｉｉ－２）前記判別器に入力された前記マーキング済み学習データに対応する前記マーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習するプロセス、及び（ｉｖ）前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する前記変換データスコア又は前記変換マーキング済みデータスコアを最大化し、前記マーキング済みデータスコアを最小化するように、前記判別器を学習するプロセスを遂行した状態である請求項８に記載の方法。
前記（ａ）段階で、
前記ラーニングネットワークは、少なくとも一つの第１学習済みパラメータ乃至少なくとも一つの第ｎ学習済みパラメータを有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、前記ｎは１以上の整数であると、
前記学習装置が、（ｉ）前記原本学習データと前記マーク学習データとを前記データエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成して第１マーキング済み学習データを生成させるプロセス、（ｉｉ）前記第１マーキング済み学習データを前記第１ラーニングネットワークに入力して、前記第１ラーニングネットワークをもって前記第１ラーニングネットワークの前記第１学習済みパラメータを利用して、前記第１マーキング済み学習データに対してネットワーク演算を適用させて前記第１マーキング済み学習データに対応する前記第１＿１特性情報を出力させ、前記原本学習データを前記第１ラーニングネットワークに入力して、前記第１ラーニングネットワークをもって前記第１ラーニングネットワークの前記第１学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて前記原本学習データに対応する第２＿１特性情報を出力させるプロセス、（ｉｉｉ）（ｉｉｉ－１）前記第１＿１特性情報と前記第２＿１特性情報とを参照して取得された前記第１＿１エラー、及び（ｉｉｉ－２）前記第１＿１特性情報を利用して生成された第１タスク特化出力とこれに対応する第１原本正解とを参照して取得された前記第２＿１エラーのうち少なくとも一部を参照して算出された第１データエラーを最小化し、前記判別器に入力された前記第１マーキング済み学習データに対応する前記第１マーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習して前記データエンベディングネットワークが第１学習済みデータエンベディングネットワークとなるようにするプロセス、（ｉｖ）前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する少なくとも１つの第１変換データスコア又は少なくとも１つの第１変換マーキング済みデータスコアを最大化し、前記第１マーキング済みデータスコアを最小化するように、前記判別器を学習して前記判別器が第１学習済み判別器となるようにするプロセス、及び（ｖ）整数であるｋを２からｎまで増加させて行き、（ｖ－１）前記原本学習データと前記マーク学習データとを前記第ｋ－１学習済みデータエンベディングネットワークに入力して、前記第ｋ－１学習済みデータエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成して第ｋマーキング済み学習データを生成させ、（ｖ－２）前記第ｋマーキング済み学習データを第ｋラーニングネットワークに入力して、前記第ｋラーニングネットワークをもって前記第ｋラーニングネットワークの少なくとも一つの第ｋ学習済みパラメータを利用して、前記第ｋマーキング済み学習データに対してネットワーク演算を適用させて前記第ｋマーキング済み学習データに対応する第１＿ｋ特性情報を出力させ、前記原本学習データを前記第ｋラーニングネットワークに入力して、前記第ｋラーニングネットワークをもって前記第ｋ学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて前記原本学習データに対応する第２＿ｋ特性情報を出力させ、（ｖ－３）（ｖ－３－１）前記第１＿ｋ特性情報と前記第２＿ｋ特性情報とを参照して取得された少なくとも１つの第１＿ｋエラー、及び（ｖ－３－２）前記第１＿ｋ特性情報を利用して生成された少なくとも１つの第ｋタスク特化出力とこれに対応する少なくとも一つの第ｋ原本正解とを参照して取得された少なくとも一つの第２＿ｋエラーのうち少なくとも一部を参照して算出された少なくとも一つの第ｋデータエラーを最小化し、第ｋ－１学習済み判別器に入力された前記第ｋマーキング済み学習データに対応する少なくとも一つの第ｋマーキング済みデータスコアを最大化するように、第ｋ－１学習済みデータエンベディングネットワークを学習して前記第ｋ－１学習済みデータエンベディングネットワークが第ｋ学習済みデータエンベディングネットワークとなるようにし、（ｖ－４）前記第ｋ－１学習済み判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する少なくとも一つの第ｋ変換データスコア又は少なくとも一つの第ｋ変換マーキング済みデータスコアを最大化し、前記第ｋマーキング済みデータスコアを最小化するように、前記第ｋ－１学習済み判別器を学習して前記第ｋ－１学習済み判別器が第ｋ学習済み判別器となるようにするプロセスを遂行した状態である請求項８に記載の方法。
前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する前記変換データスコア又は前記変換マーキング済みデータスコアの最大値は、前記変換学習データ又は前記変換マーキング済み学習データが本物であるものと判別する１であり、前記判別器に入力された前記マーキング済み学習データに対応する前記マーキング済みデータスコアの最小値は、前記マーキング済み学習データが偽物であるものと判別する０である請求項８に記載の方法。
前記学習装置は、前記第１特性情報と前記第２特性情報との間の差異を参照して前記第１エラーを取得し、前記タスク特化出力と前記原本正解とを利用して生成された少なくとも１つのロスを参照して前記第２エラーを取得する請求項８に記載の方法。
前記学習装置は、前記第１特性情報と前記第２特性情報との間のノルム（Ｎｏｒｍ）又はコサイン類似度（ＣｏｓｉｎｅＳｉｍｉｌａｒｉｔｙ）を参照して前記第１エラーを取得する請求項１２に記載の方法。
前記学習装置は、前記原本学習データと前記マーキング済み学習データとの間の類似度をさらに参照して前記類似度を最小化するように前記データエンベディングネットワークを学習する請求項８に記載の方法。
原本データとマークデータ（ＭａｒｋＤａｔａ）とを合成してマーキング済みデータ（ＭａｒｋｅｄＤａｔａ）を生成するデータエンベディングネットワーク（ＤａｔａＥｍｂｅｄｄｉｎｇＮｅｔｗｏｒｋ）を学習する学習装置において、
インストラクションを格納する少なくとも１つのメモリと、
（Ｉ）原本学習データとマーク学習データとが取得されると、前記原本学習データと前記マーク学習データとをデータエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成させてマーキング済み学習データを生成させるプロセス、（ＩＩ）（ｉ）前記マーキング済み学習データを少なくとも一つの学習済みパラメータを有するラーニングネットワークに入力して、前記ラーニングネットワークをもって（ｉ－１）前記学習済みパラメータを利用して、前記マーキング済み学習データに対してネットワーク演算を適用させて（ｉ－２）前記マーキング済み学習データに対応する第１特性情報（ＣｈａｒａｃｔｅｒｉｓｔｉｃＩｎｆｏｒｍａｔｉｏｎ）を生成させ、（ｉｉ）前記原本学習データを前記ラーニングネットワークに入力して、前記ラーニングネットワークをもって（ｉｉ－１）前記学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対応する第２特性情報を生成させるプロセス、及び（ＩＩＩ）（ＩＩＩ－１）（ｉ）（ｉ－１）前記第１特性情報と前記第２特性情報とを参照して取得された少なくとも１つの第１エラー、及び（ｉ－２）前記第１特性情報を利用して生成された少なくとも１つのタスク特化出力（ＴａｓｋＳｐｅｃｉｆｉｃＯｕｔｐｕｔ）とこれに対応する少なくとも一つの原本正解（ＧｒｏｕｎｄＴｒｕｔｈ）とを参照して取得された少なくとも一つの第２エラーのうち少なくとも一部を参照して算出された少なくとも一つのデータエラーを最小化し、（ｉｉ）入力されるデータが本物であるか偽物であるかを判別する判別器（Ｄｉｓｃｒｉｍｉｎａｔｏｒ）に入力された前記マーキング済み学習データに対応する少なくとも一つのマーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習し、（ＩＩＩ－２）前記判別器に入力された変換学習データ又は変換マーキング済み学習データにそれぞれ対応する少なくとも一つの変換データスコア又は少なくとも一つの変換マーキング済みデータスコアを最大化し、前記マーキング済みデータスコアを最小化するように、前記判別器を学習し、前記変換学習データ又は前記変換マーキング済み学習データは、それぞれ前記原本学習データ又は前記マーキング済み学習データを変換して生成されるプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも１つのプロセッサと、
を含む学習装置。
前記ラーニングネットワークは、少なくとも１つの第１学習済みパラメータ乃至少なくとも１つの第ｎ学習済みパラメータをそれぞれ有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、前記ｎは１以上の整数であると、
前記（ＩＩ）プロセスで、
前記プロセッサは、（ｉ）前記マーキング済み学習データを前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれに入力して、それぞれの前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークをもって（ｉ－１）前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれの前記第１学習済みパラメータ乃至前記第ｎ学習済みパラメータを利用して、前記マーキング済み学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉ－２）前記マーキング済み学習データに対するそれぞれの第１＿１特性情報乃至第１＿ｎ特性情報を出力させ、（ｉｉ）前記原本学習データを前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークそれぞれに入力して、それぞれの前記第１ラーニングネットワーク乃至前記第ｎラーニングネットワークをもって（ｉｉ－１）それぞれの前記第１学習済みパラメータ乃至前記第ｎ学習済みパラメータを利用して、前記原本学習データに対してそれぞれのネットワークに対応するネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対するそれぞれの第２＿１特性情報乃至第２＿ｎ特性情報を出力させ、
前記（ＩＩＩ）プロセスで、
前記プロセッサは、（ｉ）（ｉ－１）前記第１＿１特性情報と前記第２＿１特性情報とを参照して取得された第１＿１エラー、乃至前記第１＿ｎ特性情報と前記第２＿ｎ特性情報とを参照して取得された第１＿ｎエラー、の平均である前記第１エラー、及び（ｉ－２）前記第１＿１特性情報を利用して生成された少なくとも１つの第１タスク特化出力とこれに対応する少なくとも１つの第１原本正解とを参照して取得された第２＿１エラー、乃至前記第１＿ｎ特性情報を利用して生成された少なくとも一つの第ｎタスク特化出力とこれに対応する少なくとも一つの第ｎ原本正解とを参照して取得された第２＿ｎエラー、の平均である前記第２エラーのうち少なくとも一部を参照して算出された前記データエラーを最小化し、前記判別器に入力された前記マーキング済み学習データに対応する前記マーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習し、（ｉｉ）前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する前記変換データスコア又は前記変換マーキング済みデータスコアを最大化し、前記マーキング済みデータスコアを最小化するように、前記判別器を学習する請求項１５に記載の学習装置。
前記ラーニングネットワークは、少なくとも一つの第１学習済みパラメータ乃至少なくとも一つの第ｎ学習済みパラメータを有する第１ラーニングネットワーク乃至第ｎラーニングネットワークを含み、前記ｎは１以上の整数であると、
前記（Ｉ）プロセスで、
前記プロセッサは、前記原本学習データと前記マーク学習データとを前記データエンベディングネットワークに入力して、前記データエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成させて第１マーキング済み学習データを生成させ、
前記（ＩＩ）プロセスで、
前記プロセッサは、（ｉ）前記第１マーキング済み学習データを前記第１ラーニングネットワークに入力して、前記第１ラーニングネットワークをもって（ｉ－１）前記第１ラーニングネットワークの前記第１学習済みパラメータを利用して、前記第１マーキング済み学習データに対してネットワーク演算を適用させて（ｉ－２）前記第１マーキング済み学習データに対する第１＿１特性情報を出力させ、（ｉｉ）前記原本学習データを前記第１ラーニングネットワークに入力して、前記第１ラーニングネットワークをもって（ｉｉ－１）前記第１学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて（ｉｉ－２）前記原本学習データに対する第２＿１特性情報を出力させ、
前記（ＩＩＩ）プロセスで、
前記プロセッサは、（ＩＩＩ－１）（ｉ）（ｉ－１）前記第１＿１特性情報と前記第２＿１特性情報とを参照して取得された少なくとも一つの第１＿１エラー、及び（ｉ－２）前記第１＿１特性情報を利用して生成された少なくとも一つの第１タスク特化出力とこれに対応する少なくとも一つの第１原本正解とを参照して取得された少なくとも一つの第２＿１エラーのうち少なくとも一部を参照して算出された少なくとも一つの第１データエラーを最小化し、（ｉｉ）前記判別器に入力された前記第１マーキング済み学習データに対応する少なくとも一つの第１マーキング済みデータスコアを最大化するように、前記データエンベディングネットワークを学習して前記データエンベディングネットワークが第１学習済みデータエンベディングネットワークとなるようにし、（ＩＩＩ－２）（ｉ）前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する少なくとも一つの第１変換データスコア又は少なくとも一つの第１変換マーキング済みデータスコアを最大化し、（ｉｉ）前記第１マーキング済みデータスコアを最小化するように、前記判別器を学習して前記判別器が第１学習済み判別器となるようにし、
前記プロセッサは、整数であるｋを２からｎまで増加させて行き、（ｉ）前記原本学習データと前記マーク学習データとを前記第ｋ－１学習済みデータエンベディングネットワークに入力して、前記第ｋ－１学習済みデータエンベディングネットワークをもって前記原本学習データと前記マーク学習データとを合成させて第ｋマーキング済み学習データを生成させ、（ｉｉ）前記第ｋマーキング済み学習データを第ｋラーニングネットワークに入力して、前記第ｋラーニングネットワークをもって前記第ｋラーニングネットワークの少なくとも一つの第ｋ学習済みパラメータを利用して、前記第ｋマーキング済み学習データに対してネットワーク演算を適用させて前記第ｋマーキング済み学習データに対応する第１＿ｋ特性情報を出力させ、前記原本学習データを前記第ｋラーニングネットワークに入力して、前記第ｋラーニングネットワークをもって前記第ｋ学習済みパラメータを利用して、前記原本学習データに対してネットワーク演算を適用させて前記原本学習データに対応する第２＿ｋ特性情報を出力させ、（ｉｉｉ）（ｉｉｉ－１）前記第１＿ｋ特性情報と前記第２＿ｋ特性情報とを参照して取得された少なくとも１つの第１＿ｋデータエラー、及び（ｉｉｉ－２）前記第１＿ｋ特性情報を利用して生成された少なくとも１つの第ｋタスク特化出力とこれに対応する少なくとも一つの第ｋ原本正解とを参照して取得された少なくとも一つの第２＿ｋエラーのうち少なくとも一部を参照して算出された少なくとも一つの第ｋデータエラーを最小化し、第ｋ－１学習済み判別器に入力された前記第ｋマーキング済み学習データに対応する少なくとも一つの第ｋマーキング済みデータスコアを最大化するように、第ｋ－１学習済みデータエンベディングネットワークを学習して前記第ｋ－１学習済みデータエンベディングネットワークが第ｋ学習済みデータエンベディングネットワークとなるようにし、（ｉｖ）前記第ｋ－１学習済み判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する少なくとも１つの第ｋ変換データスコア又は少なくとも一つの第ｋ変換マーキング済みデータスコアを最大化し、前記第ｋマーキング済みデータスコアを最小化するように、前記第ｋ－１学習済み判別器を学習して前記第ｋ－１学習済み判別器が第ｋ学習済み判別器となるようにする請求項１５に記載の学習装置。
前記判別器に入力された前記変換学習データ又は前記変換マーキング済み学習データにそれぞれ対応する前記変換データスコア又は前記変換マーキング済みデータスコアの最大値は、前記変換学習データ又は前記変換マーキング済み学習データが本物であるものと判別する１であり、前記判別器に入力された前記マーキング済み学習データに対応する前記マーキング済みデータスコアの最小値は、前記マーキング済み学習データが偽物であるものと判別する０である請求項１５に記載の学習装置。
前記（ＩＩＩ）プロセスで、
前記プロセッサは、前記第１特性情報と前記第２特性情報との間の差異を参照して前記第１エラーを取得し、前記タスク特化出力と前記原本正解とを利用して生成された少なくとも１つのロスを参照して前記第２エラーを取得する請求項１５に記載の学習装置。
前記プロセッサは、前記第１特性情報と前記第２特性情報との間のノルム（Ｎｏｒｍ）又はコサイン類似度（ＣｏｓｉｎｅＳｉｍｉｌａｒｉｔｙ）を参照して前記第１エラーを取得する請求項１９に記載の学習装置。
前記（ＩＩＩ）プロセスで、
前記プロセッサは、前記原本学習データと前記マーキング済み学習データとの間の類似度をさらに参照して前記類似度を最小化するように前記データエンベディングネットワークを学習する請求項１５に記載の学習装置。