JP6204318B2 - 類似度評価装置、類似度評価システム、類似度評価装置方法、および、類似度評価プログラム - Google Patents

類似度評価装置、類似度評価システム、類似度評価装置方法、および、類似度評価プログラム Download PDF

Info

Publication number
JP6204318B2
JP6204318B2 JP2014193257A JP2014193257A JP6204318B2 JP 6204318 B2 JP6204318 B2 JP 6204318B2 JP 2014193257 A JP2014193257 A JP 2014193257A JP 2014193257 A JP2014193257 A JP 2014193257A JP 6204318 B2 JP6204318 B2 JP 6204318B2
Authority
JP
Japan
Prior art keywords
comparison
file
section
feature quantity
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014193257A
Other languages
English (en)
Other versions
JP2016066135A (ja
Inventor
慎也 高田
慎也 高田
敏浩 元田
敏浩 元田
隆宏 松村
隆宏 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014193257A priority Critical patent/JP6204318B2/ja
Publication of JP2016066135A publication Critical patent/JP2016066135A/ja
Application granted granted Critical
Publication of JP6204318B2 publication Critical patent/JP6204318B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、類似度評価装置、類似度評価システム、類似度評価装置方法、および、類似度評価プログラムに関する。
マルウェアの検出やDLP(Data Loss Prevention)の分野で、ファイルのエントロピー値を求め、このエントロピー値によりファイルの類似度の評価を行うことがある。ここで、ファイル全体としてのエントロピー値が比較対象のファイルのエントロピー値と近い値となった場合でも、実際には類似していないこともあるため、より詳細な類似度評価を行えるよう、ファイルを複数の区間に分割し、区間ごとのエントロピー値を比較する技術が提案されている(特許文献1参照)。
特開2014−085854号公報
しかし、上記の技術によりファイルの先頭から区間ごとにエントロピー値を比較すると、実際には類似しているファイルであっても類似していないと判断されてしまうことがある。
このことを、図13を用いて説明する。図13は、バージョンの異なる2つの実行ファイル(アドビ社のAcroRd32.exeファイルのバージョン11.0.0およびバージョン11.0.05)について、上記の技術により求めた区間ごとのエントロピー値の分布を示したグラフである。ここで、図13に示すように、実際には類似する2つのファイルについて、それぞれのファイルのエントロピー値の分布のパターン(波形)を見ると、波形の形状は類似しているがずれている場合がある。このような2つのファイルについて、上記の技術により区間ごとのエントロピー値の比較を行うと、両者は類似していないと判断されることがあった。例えば、図13に示す各区間のエントロピー値の平均は0.631であり、この値は、上記の技術において類似度が比較的低いと判定される値である。
そこで、本発明は前記した問題を解決し、比較対象のファイルについて、ファイルの区間ごとのエントロピー値を用いて類似度の評価を行う場合に、精度よく評価を行うことを課題とする。
前記した課題を解決するため、本発明は、比較元ファイルと比較先ファイルとの類似度を評価する類似度評価装置であって、前記比較元ファイルを複数の区間に分割した比較元分割ファイルと、前記比較先ファイルを前記複数の区間に分割した比較先分割ファイルとを生成する区間分割部と、前記比較元分割ファイルの区間ごとの所定のエントロピー値である比較元区間特徴量と、前記比較先分割ファイルの区間ごとの前記エントロピー値である比較先区間特徴量とを生成する区間特徴量算出部と、前記比較元区間特徴量と前記比較先区間特徴量それぞれに対し、DP(Dynamic Programming)マッチングにより前記比較元区間特徴量と前記比較先区間特徴量との距離をできるだけ小さくする補正を行う補正部と、前記補正が行われた前記比較元区間特徴量と前記比較先区間特徴量とを区間ごとに比較することにより前記比較元ファイルと前記比較先ファイルとの類似度を評価する類似度評価部とを備えることを特徴とする。
本発明によれば、比較対象のファイルについて、ファイルの区間ごとのエントロピー値を用いて類似度の評価を行う場合に、精度よく評価を行うことができる。つまり、本来類似しているファイルの類似性を高く評価でき、本来非類似のファイルの類似性の評価には影響を与えない。
図1は、第1の実施形態の類似度評価システムの構成の一例を示す図である。 図2(a)は、図1の利用者端末の構成の一例を示す図であり、図2(b)は、図1の類似度評価装置の構成の一例を示す図である。 図3は、図1の類似度評価装置の処理フローの一例を示す図である。 図4は、全体特徴量の算出結果の一例を示す図である。 図5は、全体類似度の評価結果の一例を示す図である。 図6は、ローリングハッシュの処理フローの一例を示す図である。 図7(a)は、比較元ファイルの区間特徴量の算出結果の一例を示す図であり、図7(b)は、比較先ファイルの区間特徴量の算出結果の一例を示す図である。 図8は、DPマッチングによる補正後の各ファイルの区間特徴量の一例を示すグラフである。 図9は、第2の実施形態の類似度評価システムの構成の一例を示す図である。 図10(a)は、図9の利用者端末の構成の一例を示す図であり、図10(b)は、図9の類似度評価装置の構成の一例を示す図である。 図11は、図9の利用者端末の処理フローの一例を示す図である。 図12は、図9の類似度評価装置の処理フローの一例を示す図である。 図13は、バージョンの異なる2つの実行ファイルの区間ごとのエントロピー値の分布を示すグラフである。 図14は、AcroRd32.exeおよびagent.exeそれぞれの区間ごとのエントロピー値の分布を示すグラフである。 図15は、DPマッチングによる補正後のAcroRd32.exeおよびagent.exeそれぞれの区間ごとのエントロピー値の分布を示すグラフである。
以下、本発明を実施するための形態(実施形態)を説明する。なお、本発明は本実施形態に限定されない。まず、本実施形態の類似度評価システムにおける、ファイルのエントロピー値を用いたファイル間の類似度の評価方法を説明する。
ファイルのエントロピー値の計算は順序性を考慮しない場合には式(1)により行われる。順序性を考慮する場合には式(2)により行われる。以下、順序性を考慮したエントロピー値は、M1エントロピーと呼ぶ。式(1)および(2)において、Pは対象ファイルの中で値がiとなる確率である。
Figure 0006204318
このようにファイルのエントロピー値により類似度を評価することで、例えば、原本ファイルに対して意図的に変更を加えて検知を逃れるタイプのマルウェアやアンチフォレンジック手法が用いられた場合でもこれを検知しやすくなる。
なお、エントロピー値を用いた類似度評価をより正確に行うため、式(3)のように、ファイルサイズでエントロピー値に重み付けを行ってもよい。
Figure 0006204318
重み付きエントロピー値を用いた類似度は、Eを比較元ファイルの重み付きエントロピー値とし、Eを比較先ファイルの重み付きエントロピー値とし、Sを比較元ファイルのファイルサイズとし、Sを比較先ファイルのファイルサイズとして、式(4)により計算される。
Figure 0006204318
式(4)は計算例であり通常のファイルに適用した場合、有意な値を取らないこともある。この場合、例えば、式(5)により類似度を計算する。
Figure 0006204318
(第1の実施形態)
(構成)
図1を参照して、第1の実施形態の類似度評価システムの構成例を説明する。類似度評価システムは、1以上の利用者端末2と、類似度評価装置3を含む。利用者端末2と類似度評価装置3はネットワーク4に接続される。ネットワーク4は、接続される各装置が相互に通信可能なように構成されていればよく、例えばインターネットやLAN(Local Area Network)、WAN(Wide Area Network)等で構成することができる。なお、各装置は必ずしもネットワークを介してオンラインで通信可能である必要はない。例えば、利用者端末2の出力する情報を磁気テープやUSB(Universal Serial Bus)メモリなどの可搬型記録媒体に記憶し、その可搬型記録媒体からオフラインで類似度評価装置3へ入力するように構成してもよい。
図2(a)を参照して利用者端末2の構成例を説明する。利用者端末2は、制御部201、メモリ202、ファイル記憶部21、投入部22、表示部23を備える。利用者端末2は、例えば、CPU(Central Processing Unit)、RAM(Random Access Memory)等を有するコンピュータにより実現される。
制御部201は、利用者端末2全体の制御を司る。メモリ202は、利用者端末2に入力されたデータや各処理で得られたデータが格納される。このメモリ202に格納されたデータは必要に応じて読み出されて他の処理に利用される。
ファイル記憶部21は2以上のファイルが記憶されている。このファイル記憶部21は、例えば、RAM等の主記憶装置、ハードディスクや光ディスクもしくはフラッシュメモリなどの半導体メモリ素子により構成される補助記憶装置等により構成することができる。
投入部22は、利用者の操作に従って、ファイル記憶部21から選択された、類似度を評価する比較対象ファイル群を類似度評価装置3へ送信する。
比較対象ファイル群に含まれるファイルの数は2つであってもよいし、3つ以上であってもよい。以降の説明では、2つのファイルの類似度を評価する場合について説明し、3つ以上の場合に相違する点があれば適宜説明する。また、比較対象の2つのファイルは、それぞれ比較元ファイル、比較先ファイルと呼ぶ。
表示部23は、類似度評価装置3から送信された比較対象のファイルの類似度評価結果を表示する。例えば、表示部23は、利用者端末2に接続されたディスプレイ等に類似度評価結果を表示する。
図2(b)を参照して、類似度評価装置3の構成例を説明する。
類似度評価装置3は、制御部301、メモリ302、入力部31、全体特徴量算出部32、全体類似度評価部33、区間分割部34、区間特徴量算出部35、補正部36、区間類似度評価部37、出力部38、特徴量記憶部39を備える。
類似度評価装置3は、例えば、CPU、RAM等を有するコンピュータにより実現される。
制御部301は、類似度評価装置3全体の制御を司る。メモリ302は、類似度評価装置3に入力されたデータや各処理で得られたデータが格納される。このメモリ302に格納されたデータは必要に応じて読み出されて他の処理に利用される。
入力部31は、外部装置から類似度評価装置3への各種データの入力を受け付ける。例えば、入力部31は、利用者端末2から比較元ファイル、比較先ファイルとなるファイルの入力を受け付ける。
全体特徴量算出部32は、比較元ファイルのファイル全体から所定のエントロピー値を算出し、比較元全体特徴量を生成する。また、全体特徴量算出部32は、比較先ファイルのファイル全体から所定のエントロピー値を算出し、比較先全体特徴量を生成する。ここでのエントロピー値の算出には、例えば、前記した式(1)、式(2)または式(3)を用いる。
全体類似度評価部33は、比較元全体特徴量と比較先全体特徴量から全体類似度を算出する。そして、全体類似度評価部33は、算出した全体類似度を所定の閾値と比較することにより、ファイル全体として類似しているか否かの判定を行う。なお、ここでの全体類似度の算出には、例えば、前記した式(5)を用いる。
区間分割部34は、比較元ファイルと比較先ファイルそれぞれを複数の区間に分割し、比較元分割ファイルと比較先分割ファイルとを生成する。例えば、区間分割部34は、各ファイルを所定サイズで分割したり、所定数で分割したりする。
区間特徴量算出部35は、比較元分割ファイルの区間ごとの所定のエントロピー値を示す比較元区間特徴量を生成する。また、区間特徴量算出部35は、比較先分割ファイルの区間ごとの所定のエントロピー値を示す比較先区間特徴量を生成する。ここでのエントロピー値の算出にも、例えば、前記した式(1)、式(2)または式(3)を用いる。
補正部36は、比較元区間特徴量および比較先区間特徴量それぞれに対し、DP(Dynamic Programming)マッチングを適用した補正を行う。例えば、比較元区間特徴量が以下の式(6)に示すX(x,x,…,x)であり、比較先区間特徴量が以下の式(6)に示すY(y,y,…,y)であるとする。なお、x,x,…,xは比較元ファイルの各区間のエントロピー値であり、y,y,…,yは比較先ファイルの各区間のエントロピー値である。補正部36は、以下の式(7)によりXとYとの距離D(X,Y)をできるだけ小さくするようにX,Yの補正を行う。このように、補正部36が比較元区間特徴量および比較先区間特徴量についてDPマッチングによる補正を行うことで、比較元区間特徴量と比較先区間特徴量の対応付け(整列化)を行うことができる。これにより、類似度評価装置3は、例えば、比較対象のファイルの区間ごとのエントロピー値の分布のパターン(波形)がずれている場合(図13参照)であっても、ファイル間の類似度を精度よく評価することができる。
Figure 0006204318
Figure 0006204318
区間類似度評価部37は、補正が行われた比較元区間特徴量と比較先区間特徴量とを区間ごとに比較することにより比較元ファイルと比較先ファイルとの類似度を評価する。ここでの類似度の評価は、例えば、以下の式(8)により、比較元区間特徴量に含まれる区間ごとのエントロピー値と、比較先区間特徴量に含まれる区間ごとのエントロピー値との差をそれぞれ算出し、その平均を算出することにより行われる。そして、区間類似度評価部37は、式(8)で算出した平均(D)を所定の閾値と比較することにより類似しているか否かの判定を行う。判定の結果(類似度評価結果)は利用者端末2へ送信する。
Figure 0006204318
なお、式(8)におけるnは区間の総数であり、H1は比較元ファイルの区間iのエントロピー値であり、H2は比較先ファイルの区間iのエントロピー値である。
出力部38は、類似度評価装置3の各種データを外部装置へ出力する。例えば、出力部38は、区間類似度評価部37から比較対象のファイルが類似しているか否かの判定の結果(類似度評価結果)を利用者端末2へ出力する。
特徴量記憶部39は、全体特徴量算出部32により算出された比較元全体特徴量および比較先全体特徴量や、区間特徴量算出部35により算出された比較元区間特徴量と比較先区間特徴量を記憶する。この特徴量記憶部39は、例えば、RAM等の主記憶装置、ハードディスクや光ディスクもしくはフラッシュメモリなどの半導体メモリ素子により構成される補助記憶装置等により構成することができる。
このような類似度評価システムによれば、例えば、比較対象のファイルの区間ごとのエントロピー値の分布のパターン(波形)がずれている場合であっても、類似度を精度よく評価することができる。
(処理手順)
図3を参照して類似度評価装置3の処理手順の例を説明する。まず、類似度評価装置3の入力部31は利用者端末2が送信した比較対象ファイル群の入力を受け付ける(S31)。
S31の後、全体特徴量算出部32は、比較対象ファイル群の比較元ファイルと比較先ファイルそれぞれから所定のエントロピー値を算出する。つまり、全体特徴量算出部32は、比較元ファイルと比較先ファイルそれぞれのファイル全体のエントロピー値を特徴量として算出する(S32:ファイル全体の特徴量を算出)。比較元ファイルから算出したエントロピー値は比較元全体特徴量、比較先ファイルから算出したエントロピー値は比較先全体特徴量と呼ぶ。算出するエントロピー値は、様々な種類のエントロピー値を適用することができる。例えば、上記の式(1)で算出されるエントロピー値でもよい。上記の式(2)で算出されるM1エントロピー値でもよい。上記の式(3)で算出されるファイルサイズ重み付きエントロピー値でもよい。また例えば、N-gramエントロピーを算出してもよい。N-gramエントロピーとは、決められたバイト数(Nバイト)の単位でファイル中における各ビットパターンの出現数から算出するエントロピー値である。比較対象ファイル群が3つ以上のファイルを含む場合には、すべての2つのファイルの組み合わせについて、所定のエントロピー値を算出すればよい。
図4にファイル全体の特徴量の算出結果の例を示す。「File Name」列は比較対象ファイルの物理的なファイル名である。「No.」列は比較対象ファイルを一意に識別する数値である。「Entropy」列は比較対象ファイルから式(1)で算出したエントロピー値である。「M1Entropy」列は比較対象ファイルから式(2)で算出したM1エントロピー値である。「WEntropy」列は比較対象ファイルから式(3)で算出したファイルサイズ重み付きエントロピー値である。「File Size」列は比較対象ファイルのバイト単位のファイルサイズである。この例では、15個の比較対象ファイルが投入されている。例えば、No.1のae.bmpは、エントロピー値が7.36303であり、M1エントロピー値が4.758377であり、ファイルサイズ重み付きエントロピー値が87.8226であり、ファイルサイズが151,374バイトであることを表している。
図3のS32で算出された比較元全体特徴量および比較先全体特徴量は特徴量記憶部39に記憶される。全体類似度評価部33は、特徴量記憶部39から読み出した比較元全体特徴量と比較先全体特徴量から全体類似度を算出する(S331:ファイル全体の類似度を算出)。全体類似度の算出は、例えば、上記の式(5)により計算することができる。比較対象ファイル群が3つ以上のファイルを含む場合には、すべての2つのファイルの組み合わせについて、全体類似度を算出すればよい。
全体類似度評価部33は、S331で算出した全体類似度をあらかじめ定めた閾値と比較し、比較元ファイルと比較先ファイルが類似するか否かを判定し、その判定結果(暫定判定結果)を求める(S332:全体類似度が閾値以上のファイル群が存在するか)。全体類似度評価部33は、全体類似度が閾値以上である場合には暫定判定結果にファイルが類似することを示す値を設定し、全体類似度が閾値未満の場合には暫定判定結果にファイルが類似しないことを示す値を設定する。比較対象ファイル群が3つ以上のファイルを含む場合には、暫定判定結果に全体類似度が閾値以上であるファイルの組み合わせが存在する場合に類似するファイルが存在することを示す値を設定し、全体類似度が閾値以上であるファイルの組み合わせが存在しない場合には暫定判定結果に類似するファイルが存在しないことを示す値を設定すればよい。
図5にファイル全体の類似度の評価結果の例を示す。「File Name」列は比較対象ファイルの物理的なファイル名である。「No.」列は比較元ファイルを一意に識別する数値である。「1」〜「15」列は比較先ファイルを示している。つまり、図5は比較元ファイルと比較先ファイルの全体類似度のマトリックスとなっている。例えば、No.1のae.bmpとNo.2のaf.bmpとの全体類似度は89である。類似度を判定する閾値を99に設定すると、図5のマトリックス中のハッチングで示したファイルの組み合わせにおいて、ファイルが類似すると判定される。例えば、No.1のae.bmpであれば、No.5のimagesCA6MA9NM.bmpとNo.6のimagesCA83PY61.bmpとNo.8のimagesCAQI7U2A.bmpと類似すると判定される。
図3のS332で暫定判定結果が比較元ファイルと比較先ファイルとが類似しないことを示す場合には(S332でNo)、全体類似度評価部33は、比較元ファイルと比較先ファイルとが類似しないと判定し(S382:類似ファイルはない)、その判定結果を出力し、処理を終了する。例えば、図6において、比較対象ファイルとして、No.1のae.bmpとNo.2のaf.bmpが投入された場合であれば、全体類似度が89であり閾値99未満であるため、全体類似度評価部33は、2つのファイルは類似しないと判定される。この場合には、2つのファイルは類似しないことを出力して処理を終了する。
一方、暫定判定結果が比較元ファイルと比較先ファイルとが類似することを示す場合には(図3のS332でYes)、S34以降の処理を継続する。比較対象ファイル群が3つ以上のファイルを含む場合であって、複数のファイルの組み合わせでファイルが類似すると判定された場合には、類似するファイルの組み合わせすべてについて以降の処理を繰り返し実行する。
比較元ファイルと比較先ファイルが区間分割部34へ入力されると、区間分割部34は、比較元ファイルと比較先ファイルそれぞれを所定の分割方法で複数の区間に分割する(S34:個々のファイルを区間分割)。比較元ファイルを分割した後のファイルは比較元分割ファイル、比較先ファイルを分割した後のファイルは比較先分割ファイルと呼ぶ。区間分割部34は、例えば、あらかじめ定めた固定サイズで各ファイルを分割する。例えば、区間分割部34は、各ファイルを10Kバイトごとに区間を分割する。また、例えば、区間分割部34は、比較対象ファイルのファイルサイズに比例した均等割りにより分割サイズを決定してもよい。ファイルサイズに比例した均等割りであれば、末端の少量サイズの区間が生じることを回避することができる。また、このほかに、区間分割部34は、例えば、ローリングハッシュによりファイルの区間分割点を決定してもよい。
図6にローリングハッシュによる区間分割の動作例を示す。区間分割部34は、分割対象のファイルが入力されると、そのファイルのバイナリ列からmバイトを読み取る(S341)。このmバイト分のバイナリ列をウィンドウと呼ぶ。ウィンドウのサイズを決定するmは任意の値を取ることができる。例えば、m=7などと設定すればよい。次に、区間分割部34は、読み取ったウィンドウのハッシュ値を計算してメモリ302に記憶する(S342)。ハッシュ関数としては、例えば、文字列を構成する全文字の値を加算する関数、各文字のASCIIコードを全て掛け合わせる関数等が考えられる。続いて、区間分割部34は、計算したハッシュ値の下位tビットがあらかじめ定めた任意のビットパターンと一致する否かを判断する(S343)。ここで、下位tビットがあらかじめ定めた任意のビットパターンと一致する場合には(S343でYes)、区間分割部34は、そのウィンドウの位置を分割点としてメモリ302に記憶する(S344)。一方、下位tビットがあらかじめ定めた任意のビットパターンと一致しない場合には(S343でNo)、S345へ進む。なお、ビットパターンはどのようなものでもよく、例えば、下位tビットがすべて1の場合でもよいし、すべて0の場合でもよい。tは、例えば、Lをファイルサイズとし、Nを区間の総数として、下記の式(9)により決定すればよい。
Figure 0006204318
ここで、
Figure 0006204318
は床関数であり、xを超えない最大の整数である。
S344の後、区間分割部34は、ウィンドウの位置がファイルの終点であるか否かを確認する(S345)。ここで、ファイルのウィンドウの位置がファイルの終点でなければ(S345でNo)、区間分割部34はウィンドウの位置を先頭から1バイト後方へ移動させ、S341以降の処理を再度行う。一方、ファイルのウィンドウの位置がファイルの終点であれば(S345でYes)、処理を終了する。
区間分割部34が上記のローリングハッシュを用いてファイルの区間分割を行うことで、比較対象の2つのファイルの相違点を除いて共通の部分を区間として抽出することができる可能性が高い。
図3の説明に戻る。S34の後、比較元分割ファイルと比較先分割ファイルは区間特徴量算出部35へ入力される。区間特徴量算出部35は、比較元分割ファイルと比較先分割ファイルそれぞれから区間ごとに所定のエントロピー値(特徴量)を算出する(S35:区間ごとの特徴量を算出)。比較元分割ファイルの区間ごとのエントロピー値のスペクトルを比較元区間特徴量と呼び、比較先分割ファイルの区間ごとのエントロピー値のスペクトルを比較先区間特徴量と呼ぶ。算出するエントロピー値は、全体特徴量と同様に、様々な種類のエントロピー値を適用することができる。例えば、上記の式(1)で算出されるエントロピー値でもよい。上記の式(2)で算出されるM1エントロピー値でもよい。上記の式(3)で算出されるファイルサイズ重み付きエントロピー値でもよい。また、例えば、N-gramエントロピーを算出してもよい。
図7(a)に比較元ファイルの区間特徴量の算出結果の例を示し、図7(b)に比較先ファイルの区間特徴量の算出結果の例を示す。「File Name」列は区間分割後の比較対象ファイルのファイル名である。「Entropy」列はその分割ファイルから算出したエントロピー値である。「M1Entropy」列はその分割ファイルから算出したM1エントロピー値である。「WEntropy」列はその分割ファイルから算出したファイルサイズ重み付きエントロピー値である。「File Size」列はその分割ファイルのバイト単位のファイルサイズである。この例では、No.1のae.bmpを比較元ファイルとし、No.5のimagesCA6MA9NM.bmpを比較先ファイルとして、それぞれ100,000バイトの固定サイズで分割している。図7(a)では、No.1のae.bmpがae.001〜ae.016の16個に分割され、分割後のae.001〜ae.016それぞれについて、エントロピー値とM1エントロピー値とファイルサイズ重み付きエントロピー値を算出した結果を示している。図7(b)では、No.5のimagesCA6MA9NM.bmpがIMAGES~1.001〜IMAGES~1.016の16個に分割され、分割後のIMAGES~1.001〜IMAGES~1.016それぞれについて、エントロピー値とM1エントロピー値とファイルサイズ重み付きエントロピー値を算出した結果を示している。
図3のS35の後、補正部36は、比較元区間特徴量および比較先区間特徴量それぞれに対し、DPマッチングによる補正を行う(S36)。例えば、前記したとおり、比較元区間特徴量が式(6)に示すX(x,x,…,x)であり、比較先区間特徴量が式(6)に示すY(y,y,…,y)であるとすると、補正部36は、式(7)によりXとYとの距離D(X,Y)をできるだけ小さくするようにX(x,x,…,x)およびY(y,y,…,y)の補正を行う。
図8に、DPマッチングによる補正後の比較元区間特徴量と比較先区間特徴量の例を示す。ここで補正の対象とした比較元区間特徴量と比較先区間特徴量は、図13に示したアドビ社のAcroRd32.exeファイルのバージョン11.0.0およびバージョン11.0.05それぞれの比較元区間特徴量および比較先区間特徴量である。それぞれのファイルの区間分割数は同じである。補正部36が比較元区間特徴量および比較先区間特徴量それぞれに対し、DPマッチングによる補正を行うことで、図8に示すように、両者のエントロピー値の波形のずれが解消される。
図3の説明に戻る。S36で補正された比較元区間特徴量および比較先区間特徴量は区間類似度評価部37へ入力される。そして、区間類似度評価部37は、補正後の比較元区間特徴量および比較先区間特徴量に基づいて比較元ファイルと比較先ファイルが類似するか否かを示す判定結果を求める。つまり、区間類似度評価部37は、補正後の区間特徴量が評価基準を満たすか否かを判定する(S37)。判定の方法は、例えば、式(8)を用いて、補正後の比較元区間特徴量に含まれる区間ごとのエントロピー値と、補正後の比較先区間特徴量に含まれる区間ごとのエントロピー値との差をそれぞれ算出し、その平均を計算すればよい。
例えば、図8に例示したDPマッチングによる補正後の比較元区間特徴量および比較先区間特徴量について、上記の式(8)によりエントロピー値の差の平均を算出すると0.140であった。つまり、比較元区間特徴量および比較先区間特徴量にDPマッチングによる補正を行わなかった場合、式(8)に基づく両者のエントロピー値の差の平均が0.631であったところ(図13参照)、類似度評価装置3により比較元区間特徴量および比較先区間特徴量にDPマッチングによる補正を行うと、式(8)に基づく両者のエントロピー値の差の平均が0.140に改善され、比較対象のファイルの類似度評価の精度が向上したことが確認された。
なお、類似するか否かの判定には、補正後の比較元区間特徴量および比較先区間特徴量についての各種の統計を用いてもよい。
例えば、区間類似度評価部37は、補正後の比較元区間特徴量および比較先区間特徴量それぞれの標準偏差を算出し、標準偏差の差が閾値未満であればファイルが類似すると判定してもよい。
また、区間類似度評価部37は、類似するか否かの判定に相関係数を用いてもよい。例えば、区間類似度評価部37は、補正後の比較元区間特徴量および比較先区間特徴量の相関係数を求め、その相関係数が閾値以上であればファイルが類似すると判定する。
さらに、区間類似度評価部37は、類似するか否かの判定に最長一致系列比較を用いてもよい。例えば、区間類似度評価部37は、補正後の比較元区間特徴量および比較先区間特徴量で対応する区間エントロピー値が連続して一致する区間の長さを求め、その一致する区間の長さが閾値以上であればファイルが類似すると判定する。
また、区間類似度評価部37は、類似するか否かの判定にフーリエ解析を用いてもよい。例えば、区間類似度評価部37は、補正後の比較元区間特徴量と比較先区間特徴量それぞれをフーリエ変換し、得られたパワースペクトルの系列を比較して一致する要素の数が閾値以上であればファイルが類似すると判定する。
さらに、区間類似度評価部37は、類似するか否かの判定にΧスクエア検定を用いてもよい。例えば、区間類似度評価部37は、補正後の比較元区間特徴量と比較先区間特徴量をそれぞれ所定の関数に近似させて検定統計量を算出することにより、あらかじめ定めた閾値を有意水準としてファイルが類似するか否かの仮説検定を行う。
区間類似度評価部37はS37における判定結果を、出力部38を介して利用者端末2へ送信する。すなわち、区間類似度評価部37は、S37において補正後の区間特徴量が評価基準を満たすと判定したとき(S37でYes)、ファイルが類似すると判定し(S381:類似ファイルがある)、その判定結果を利用者端末2へ送信する。一方、区間類似度評価部37は、S37において補正後の区間特徴量が評価基準を満たさないと判定したとき(S37でNo)、ファイルが類似しないと判定し(S382:類似ファイルはない)、その判定結果を利用者端末2へ送信する。なお、ここで送信する判定結果には、例えば、比較対象ファイルの全体特徴量、比較対象ファイル間の全体類似度、比較対象ファイルの区間特徴量、比較対象ファイル間の類似度判定結果、区間エントロピー値の差の平均等の類似度を判定するために用いた値を含めてもよい。
S381,382の後、利用者端末2の表示部23は、類似度評価装置3から受信した判定結果を表示する。表示の方法はどのような方法であってもよい。例えば、利用者端末2のディスプレイに整形して表示してもよいし、利用者端末2に設定された所定のプリンタへあらかじめ定めた書式で出力してもよい。
このようなシステムによれば、例えば、比較対象のファイルの区間ごとのエントロピー値の分布のパターン(波形)がずれている場合であっても、類似度を精度よく評価することができる。
(第2の実施形態)
(構成)
図9を参照して、第2の実施形態の類似度評価システムの構成例を説明する。前記した第1の実施形態と同じ構成は、同じ符号を付して説明を省略する。この第2の実施形態の類似度評価システムは、1以上の利用者端末2aと、類似度評価装置3aを含む。第2の実施形態の類似度評価システムは、利用者端末2aが全体特徴量算出部32、区間分割部34、区間特徴量算出部35を備えることを特徴とする。
図10(a)を参照して、利用者端末2aの構成例を説明する。利用者端末2aは、制御部601、メモリ602、ファイル記憶部21、投入部22、表示部23、全体特徴量算出部32、区間分割部34、区間特徴量算出部35を備える。この利用者端末2aも、例えば、CPU、RAM等を有するコンピュータにより実現される。
制御部601は、利用者端末2a全体の制御を司る。メモリ602は、利用者端末2aに入力されたデータや各処理で得られたデータが格納される。このメモリ602に格納されたデータは必要に応じて読み出されて他の処理に利用される。
図10(b)を参照して、類似度評価装置3aの構成例を説明する。類似度評価装置3aは、制御部701、メモリ702、入力部31、全体類似度評価部33、補正部36、区間類似度評価部37、出力部38、特徴量記憶部39を備える。この類似度評価装置3aも、例えば、CPU、RAM等を有するコンピュータにより実現される。
制御部701は、類似度評価装置3a全体の制御を司る。メモリ702は、類似度評価装置3に入力されたデータや各処理で得られたデータが格納される。このメモリ702に格納されたデータは必要に応じて読み出されて他の処理に利用される。
(処理手順)
図11を参照して、利用者端末2aの処理手順の例を説明する。まず、利用者端末2aの全体特徴量算出部32は、図3のS32と同様に、比較対象ファイル群の比較元ファイルと比較先ファイルそれぞれから所定のエントロピー値を算出(S32:ファイル全体の特徴量を算出)すると、比較元ファイルと比較先ファイルが区間分割部34へ入力される。区間分割部34は、比較元ファイルと比較先ファイルそれぞれを所定の方法で複数の区間に分割する(S34)。区間分割の方法は、第1の実施形態と同様であるので説明を省略する。
S34の後、比較元分割ファイルと比較先分割ファイルが区間特徴量算出部35へ入力されると、区間特徴量算出部35は、図3のS35と同様に、比較元分割ファイルと比較先分割ファイルそれぞれから区間ごとに所定のエントロピー値(特徴量)を算出する(S35:区間ごとの特徴量を算出)。
S35の後、利用者端末2aの投入部22は、S35で算出した特徴量(つまり、比較元全体特徴量および比較先全体特徴量と、比較元区間特徴量および比較先区間特徴量)を類似度評価装置3aへ送信する。
図12を参照して、類似度評価装置3aの処理手順の例を説明する。まず、類似度評価装置3aの入力部31は利用者端末2aが送信した特徴量の入力を受け付ける(S311)。入力された特徴量は特徴量記憶部39に記憶される。
S311の後、全体類似度評価部33は、図3のS331と同様に、特徴量記憶部39から読み出した比較元全体特徴量と比較先全体特徴量から全体類似度を算出する(S331:ファイル全体の類似度を算出)。全体類似度の算出は、第1の実施形態と同様であるので説明を省略する。
全体類似度評価部33は、図3のS332と同様に、S331で算出した全体類似度をあらかじめ定めた閾値と比較し、比較元ファイルと比較先ファイルが類似するか否かを判定し、その判定結果(暫定判定結果)を求める(S332:全体類似度が閾値以上のファイル群が存在するか)。つまり、全体類似度評価部33は、全体類似度が閾値以上である場合にはファイルが類似することを示す値を暫定判定結果に設定し、全体類似度が閾値未満の場合にはファイルが類似しないことを示す値を暫定判定結果に設定する。
S332における暫定判定結果が比較元ファイルと比較先ファイルとが類似しないことを示す場合(S332でNo)、全体類似度評価部33は、比較元ファイルと比較先ファイルとが類似しないと判定し(S382:類似ファイルはない)、その判定結果を出力し、処理を終了する。
一方、S332で暫定判定結果が比較元ファイルと比較先ファイルとが類似することを示す場合には(S332でYes)、補正部36は、特徴量記憶部39から読み出した比較元区間特徴量と比較先区間特徴量それぞれに対し、図3のS36と同様にDPマッチングによる補正を行う(S36)。
そして、区間類似度評価部37は、S36で補正された比較元区間特徴量および比較先区間特徴量に基づいて比較元ファイルと比較先ファイルが類似するか否かを示す判定結果を求める。つまり、区間類似度評価部37は、補正後の区間特徴量が評価基準を満たすか否かを判定する(S37)。そして、区間類似度評価部37はS37における判定結果を、出力部38を介して利用者端末2へ送信する。すなわち、区間類似度評価部37は、S37において補正後の区間特徴量が評価基準を満たすと判定したとき(S37でYes)、ファイルが類似すると判定し(S381:類似ファイルがある)、その判定結果を利用者端末2aへ送信する。一方、区間類似度評価部37は、S37において補正後の区間特徴量が評価基準を満たさないと判定したとき(S37でNo)、ファイルが類似しないと判定し(S382:類似ファイルはない)、その判定結果を利用者端末2aへ送信する。送信する判定結果に含める情報および利用者端末2aにおける表示方法は第1の実施形態と同様であるので説明を省略する。
第2の実施形態の類似度評価システムによれば、利用者端末2aで各種特徴量を算出して類似度評価装置3aへ送信するので、利用者端末2aから類似度評価装置3aへの送信データ量を低減できる。したがって、ネットワーク4上に流れるトラフィックを抑え、類似度評価システムにおけるレスポンスを向上させることができる。
(実験結果)
なお、関連性がまったくない2つの実行ファイルであるAcroRd32.exeとagent.exeについて区間ごとに所定のエントロピー値(区間特徴量)を算出したところ、図14のグラフに示すような値であった。また、上記の式(8)に基づき、2つの実行ファイルそれぞれの各区間のエントロピー値の差の平均を算出すると0.542であった。そして、この2つの実行ファイル(AcroRd32.exeとagent.exe)の区間特徴量について上記のDPマッチングによる補正を行ったところ、図15のグラフに示すような値となった。そして、このDPマッチングによる補正後の2つの実行ファイルについて、式(8)に基づき各区間のエントロピー値の差の平均を算出すると0.415であった。つまり、関連性がまったくない2つの実行ファイルに対し、DPマッチングによる補正を行っても、両者の各区間のエントロピー値の差の平均は0.542→0.415であり、あまり変化がなかった。
一方で、図8および図13に示したとおり、関連性が高い2つの実行ファイル(AcroRd32.exeファイルのバージョン11.0.0およびバージョン11.0.05)の区間特徴量に対し、類似度評価装置3,3aがDPマッチングによる補正を行うことで、各実行ファイルの各区間のエントロピー値の差の平均は0.631→0.140に変化した。このことから、類似度評価装置3,3aが、関連性が高い(類似度が高い)2つのファイルについて精度よく類似度評価をしていることが確認できた。
(その他の実施形態)
この発明は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。上記実施例において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
また、上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD(Digital Versatile Disc)、CD−ROM(Compact Disc Read Only Memory)等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
2,2a 利用者端末
3,3a 類似度評価装置
21 ファイル記憶部
22 投入部
23 表示部
31 入力部
32 全体特徴量算出部
33 全体類似度評価部
34 区間分割部
35 区間特徴量算出部
36 補正部
37 区間類似度評価部
38 出力部
39 特徴量記憶部

Claims (7)

  1. バージョンが異なる実行ファイルである比較元ファイルと比較先ファイルとの類似度を評価する類似度評価装置であって、
    前記比較元ファイルを複数の区間に分割した比較元分割ファイルと、前記比較先ファイルを前記複数の区間に分割した比較先分割ファイルとを生成する区間分割部と、
    前記比較元分割ファイルの区間ごとの所定のエントロピー値である比較元区間特徴量と、前記比較先分割ファイルの区間ごとの前記エントロピー値である比較先区間特徴量とを生成する区間特徴量算出部と、
    前記比較元区間特徴量と前記比較先区間特徴量それぞれに対し、DP(Dynamic Programming)マッチングにより前記比較元区間特徴量と前記比較先区間特徴量との距離をできるだけ小さくする補正を行う補正部と、
    前記補正が行われた前記比較元区間特徴量と前記比較先区間特徴量とを区間ごとに比較することにより前記比較元ファイルと前記比較先ファイルとの類似度を評価する類似度評価部と
    を備えることを特徴とする類似度評価装置。
  2. 前記比較元ファイルのファイル全体から前記エントロピー値を算出して比較元全体特徴量を生成し、前記比較先ファイルのファイル全体から前記エントロピー値を算出して比較先全体特徴量を生成する全体特徴量算出部と、
    前記比較元全体特徴量と前記比較先全体特徴量とに基づいて前記比較元ファイルと前記比較先ファイルとが類似するか否かを示す判定結果を求める全体類似度評価部と、
    をさらに備え、
    前記判定結果が前記比較元ファイルと前記比較先ファイルとが類似することを示すとき、前記区間分割部、前記区間特徴量算出部、前記補正部および前記類似度評価部による処理を実行することを特徴とする請求項1に記載の類似度評価装置。
  3. 前記区間分割部は、
    ローリングハッシュにより前記比較元ファイルと比較先ファイルそれぞれを複数の区間に分割することを特徴とする請求項1または2に記載の類似度評価装置。
  4. 利用者端末と類似度評価装置とを含み、バージョンが異なる実行ファイルである比較元ファイルと比較先ファイルとの類似度を評価する類似度評価システムであって、
    前記利用者端末は、
    前記比較元ファイルと前記比較先ファイルとを前記類似度評価装置へ出力する投入部と、
    前記類似度評価装置から出力された前記比較元ファイルと前記比較先ファイルとの類似度の評価の結果を表示する表示部とを備え、
    前記類似度評価装置は、
    前記比較元ファイルを複数の区間に分割した比較元分割ファイルと、前記比較先ファイルを前記複数の区間に分割した比較先分割ファイルとを生成する区間分割部と、
    前記比較元分割ファイルの区間ごとの所定のエントロピー値である比較元区間特徴量と、前記比較先分割ファイルの区間ごとの前記エントロピー値である比較先区間特徴量と、を生成する区間特徴量算出部と、
    前記比較元区間特徴量と前記比較先区間特徴量それぞれに対し、DP(Dynamic Programming)マッチングにより前記比較元区間特徴量と前記比較先区間特徴量との距離をできるだけ小さくする補正を行う補正部と、
    前記補正が行われた前記比較元区間特徴量と前記比較先区間特徴量とを区間ごとに比較することにより前記比較元ファイルと前記比較先ファイルとの類似度を評価する類似度評価部と、
    前記類似度の評価結果を前記利用者端末へ出力する出力部と
    を備えることを特徴とする類似度評価システム。
  5. 利用者端末と類似度評価装置とを含み、バージョンが異なる実行ファイルである比較元ファイルと比較先ファイルとの類似度を評価する類似度評価システムであって、
    前記利用者端末は、
    前記比較元ファイルを複数の区間に分割した比較元分割ファイルと、前記比較先ファイルを前記複数の区間に分割した比較先分割ファイルとを生成する区間分割部と、
    前記比較元分割ファイルの区間ごとの所定のエントロピー値である比較元区間特徴量と、前記比較先分割ファイルの区間ごとの前記エントロピー値である比較先区間特徴量とを生成する区間特徴量算出部と、
    前記比較元区間特徴量と前記比較先区間特徴量とを前記類似度評価装置へ出力する投入部と、
    前記類似度評価装置から出力された前記比較元ファイルと前記比較先ファイルとの類似度の評価の結果を表示する表示部とを備え、
    前記類似度評価装置は、
    前記比較元区間特徴量と前記比較先区間特徴量それぞれに対し、DP(Dynamic Programming)マッチングにより前記比較元区間特徴量と前記比較先区間特徴量との距離をできるだけ小さくする補正を行う補正部と、
    前記補正が行われた前記比較元区間特徴量と前記比較先区間特徴量とを区間ごとに比較することにより前記比較元ファイルと前記比較先ファイルとの類似度を評価する類似度評価部と、
    前記類似度の評価結果を前記利用者端末へ出力する出力部と
    を備えることを特徴とする類似度評価システム。
  6. バージョンが異なる実行ファイルである比較元ファイルと比較先ファイルとの類似度を評価する類似度評価方法であって、
    前記比較元ファイルを複数の区間に分割した比較元分割ファイルと、前記比較先ファイルを前記複数の区間に分割した比較先分割ファイルとを生成するステップと、
    前記比較元分割ファイルの区間ごとの所定のエントロピー値である比較元区間特徴量と、前記比較先分割ファイルの区間ごとの前記エントロピー値である比較先区間特徴量とを生成するステップと、
    前記比較元区間特徴量と前記比較先区間特徴量それぞれに対し、DP(Dynamic Programming)マッチングにより前記比較元区間特徴量と前記比較先区間特徴量との距離をできるだけ小さくする補正を行うステップと、
    前記補正が行われた前記比較元区間特徴量と前記比較先区間特徴量とを区間ごとに比較することにより前記比較元ファイルと前記比較先ファイルとの類似度を評価するステップと
    を含んだことを特徴とする類似度評価方法。
  7. バージョンが異なる実行ファイルである比較元ファイルと比較先ファイルとの類似度を評価するための類似度評価プログラムであって、
    前記比較元ファイルを複数の区間に分割した比較元分割ファイルと、前記比較先ファイルを前記複数の区間に分割した比較先分割ファイルとを生成するステップと、
    前記比較元分割ファイルの区間ごとの所定のエントロピー値である比較元区間特徴量と、前記比較先分割ファイルの区間ごとの前記エントロピー値である比較先区間特徴量とを生成するステップと、
    前記比較元区間特徴量と前記比較先区間特徴量それぞれに対し、DP(Dynamic Programming)マッチングにより前記比較元区間特徴量と前記比較先区間特徴量との距離をできるだけ小さくする補正を行うステップと、
    前記補正が行われた前記比較元区間特徴量と前記比較先区間特徴量とを区間ごとに比較することにより前記比較元ファイルと前記比較先ファイルとの類似度を評価するステップと
    をコンピュータに実行させることを特徴とする類似度評価プログラム。
JP2014193257A 2014-09-24 2014-09-24 類似度評価装置、類似度評価システム、類似度評価装置方法、および、類似度評価プログラム Active JP6204318B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014193257A JP6204318B2 (ja) 2014-09-24 2014-09-24 類似度評価装置、類似度評価システム、類似度評価装置方法、および、類似度評価プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014193257A JP6204318B2 (ja) 2014-09-24 2014-09-24 類似度評価装置、類似度評価システム、類似度評価装置方法、および、類似度評価プログラム

Publications (2)

Publication Number Publication Date
JP2016066135A JP2016066135A (ja) 2016-04-28
JP6204318B2 true JP6204318B2 (ja) 2017-09-27

Family

ID=55805474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014193257A Active JP6204318B2 (ja) 2014-09-24 2014-09-24 類似度評価装置、類似度評価システム、類似度評価装置方法、および、類似度評価プログラム

Country Status (1)

Country Link
JP (1) JP6204318B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6783741B2 (ja) * 2017-11-24 2020-11-11 日本電信電話株式会社 距離測定装置、通信システム、作成装置及び距離測定プログラム
CN108600792B (zh) * 2018-04-02 2020-08-04 武汉斗鱼网络科技有限公司 一种相似度度量方法、装置、设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014085854A (ja) * 2012-10-24 2014-05-12 Nippon Telegr & Teleph Corp <Ntt> 類似度評価システム、類似度評価装置、利用者端末、類似度評価方法、およびプログラム

Also Published As

Publication number Publication date
JP2016066135A (ja) 2016-04-28

Similar Documents

Publication Publication Date Title
CN109643397B (zh) 时间序列数据特征量提取装置、时间序列数据特征量提取方法和时间序列数据特征量提取程序
JP5795743B2 (ja) 適応的重み付けを用いた様々な文書間類似度計算方法に基づいた文書比較方法および文書比較システム
US20200090076A1 (en) Non-transitory computer-readable recording medium, prediction method, and learning device
EP2996046A1 (en) Data reading and writing method, device and system
CN110178123B (zh) 性能指标评估方法及装置
JP6204318B2 (ja) 類似度評価装置、類似度評価システム、類似度評価装置方法、および、類似度評価プログラム
JP2019079102A (ja) 学習装置、生成装置、分類装置、学習方法、学習プログラム、および動作プログラム
KR102554852B1 (ko) 인공신경망을 이용한 rsa 암호에 대한 부채널 분석 방법 및 장치
US11526740B2 (en) Optimization apparatus and optimization method
CN112017776A (zh) 基于动态图和医学知识图谱的疾病预测方法及相关设备
JP2014085854A (ja) 類似度評価システム、類似度評価装置、利用者端末、類似度評価方法、およびプログラム
JP6795448B2 (ja) データ処理装置、データ処理方法およびプログラム
Gupta et al. Queue Length and Server Content Distribution in an Infinite‐Buffer Batch‐Service Queue with Batch‐Size‐Dependent Service
EP4116853B1 (en) Computer-readable recording medium storing evaluation program, evaluation method, and information processing device
JP2018067126A (ja) 類似度評価装置、類似度評価システム、類似度評価方法、および、類似度評価プログラム
JP6835407B2 (ja) 画像処理装置、画像処理方法及びプログラム
EP4227864A1 (en) Evaluation method, evaluation device, and evaluation program
US20220103336A1 (en) Cycle estimation device for pulse train signal, cycle estimation method for pulse train signal, and cycle estimation program for pulse train signal
CN110502736B (zh) 一种总线数据解析方法及装置
JP2017102566A (ja) 不正ファイル検知装置、不正ファイル検知方法、および、不正ファイル検知プログラム
US20240086534A1 (en) Falsification detection device, falsification detection method, and falsification detection program
JP6815931B2 (ja) 統計量データ処理装置、統計量データ処理方法およびプログラム
EP4261719A1 (en) Falsification detection device, falsification detection method, and falsification detection program
JP6488168B2 (ja) 時系列データ処理方法、時系列データ処理プログラム、および、時系列データ処理装置
WO2023166565A1 (ja) 推定装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160912

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170627

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170831

R150 Certificate of patent or registration of utility model

Ref document number: 6204318

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150