JP6204318B2 - 類似度評価装置、類似度評価システム、類似度評価装置方法、および、類似度評価プログラム - Google Patents
類似度評価装置、類似度評価システム、類似度評価装置方法、および、類似度評価プログラム Download PDFInfo
- Publication number
- JP6204318B2 JP6204318B2 JP2014193257A JP2014193257A JP6204318B2 JP 6204318 B2 JP6204318 B2 JP 6204318B2 JP 2014193257 A JP2014193257 A JP 2014193257A JP 2014193257 A JP2014193257 A JP 2014193257A JP 6204318 B2 JP6204318 B2 JP 6204318B2
- Authority
- JP
- Japan
- Prior art keywords
- comparison
- file
- section
- feature quantity
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(構成)
図1を参照して、第1の実施形態の類似度評価システムの構成例を説明する。類似度評価システムは、1以上の利用者端末2と、類似度評価装置3を含む。利用者端末2と類似度評価装置3はネットワーク4に接続される。ネットワーク4は、接続される各装置が相互に通信可能なように構成されていればよく、例えばインターネットやLAN(Local Area Network)、WAN(Wide Area Network)等で構成することができる。なお、各装置は必ずしもネットワークを介してオンラインで通信可能である必要はない。例えば、利用者端末2の出力する情報を磁気テープやUSB(Universal Serial Bus)メモリなどの可搬型記録媒体に記憶し、その可搬型記録媒体からオフラインで類似度評価装置3へ入力するように構成してもよい。
図3を参照して類似度評価装置3の処理手順の例を説明する。まず、類似度評価装置3の入力部31は利用者端末2が送信した比較対象ファイル群の入力を受け付ける(S31)。
(構成)
図9を参照して、第2の実施形態の類似度評価システムの構成例を説明する。前記した第1の実施形態と同じ構成は、同じ符号を付して説明を省略する。この第2の実施形態の類似度評価システムは、1以上の利用者端末2aと、類似度評価装置3aを含む。第2の実施形態の類似度評価システムは、利用者端末2aが全体特徴量算出部32、区間分割部34、区間特徴量算出部35を備えることを特徴とする。
図11を参照して、利用者端末2aの処理手順の例を説明する。まず、利用者端末2aの全体特徴量算出部32は、図3のS32と同様に、比較対象ファイル群の比較元ファイルと比較先ファイルそれぞれから所定のエントロピー値を算出(S32:ファイル全体の特徴量を算出)すると、比較元ファイルと比較先ファイルが区間分割部34へ入力される。区間分割部34は、比較元ファイルと比較先ファイルそれぞれを所定の方法で複数の区間に分割する(S34)。区間分割の方法は、第1の実施形態と同様であるので説明を省略する。
なお、関連性がまったくない2つの実行ファイルであるAcroRd32.exeとagent.exeについて区間ごとに所定のエントロピー値(区間特徴量)を算出したところ、図14のグラフに示すような値であった。また、上記の式(8)に基づき、2つの実行ファイルそれぞれの各区間のエントロピー値の差の平均を算出すると0.542であった。そして、この2つの実行ファイル(AcroRd32.exeとagent.exe)の区間特徴量について上記のDPマッチングによる補正を行ったところ、図15のグラフに示すような値となった。そして、このDPマッチングによる補正後の2つの実行ファイルについて、式(8)に基づき各区間のエントロピー値の差の平均を算出すると0.415であった。つまり、関連性がまったくない2つの実行ファイルに対し、DPマッチングによる補正を行っても、両者の各区間のエントロピー値の差の平均は0.542→0.415であり、あまり変化がなかった。
この発明は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。上記実施例において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
3,3a 類似度評価装置
21 ファイル記憶部
22 投入部
23 表示部
31 入力部
32 全体特徴量算出部
33 全体類似度評価部
34 区間分割部
35 区間特徴量算出部
36 補正部
37 区間類似度評価部
38 出力部
39 特徴量記憶部
Claims (7)
- バージョンが異なる実行ファイルである比較元ファイルと比較先ファイルとの類似度を評価する類似度評価装置であって、
前記比較元ファイルを複数の区間に分割した比較元分割ファイルと、前記比較先ファイルを前記複数の区間に分割した比較先分割ファイルとを生成する区間分割部と、
前記比較元分割ファイルの区間ごとの所定のエントロピー値である比較元区間特徴量と、前記比較先分割ファイルの区間ごとの前記エントロピー値である比較先区間特徴量とを生成する区間特徴量算出部と、
前記比較元区間特徴量と前記比較先区間特徴量それぞれに対し、DP(Dynamic Programming)マッチングにより前記比較元区間特徴量と前記比較先区間特徴量との距離をできるだけ小さくする補正を行う補正部と、
前記補正が行われた前記比較元区間特徴量と前記比較先区間特徴量とを区間ごとに比較することにより前記比較元ファイルと前記比較先ファイルとの類似度を評価する類似度評価部と
を備えることを特徴とする類似度評価装置。 - 前記比較元ファイルのファイル全体から前記エントロピー値を算出して比較元全体特徴量を生成し、前記比較先ファイルのファイル全体から前記エントロピー値を算出して比較先全体特徴量を生成する全体特徴量算出部と、
前記比較元全体特徴量と前記比較先全体特徴量とに基づいて前記比較元ファイルと前記比較先ファイルとが類似するか否かを示す判定結果を求める全体類似度評価部と、
をさらに備え、
前記判定結果が前記比較元ファイルと前記比較先ファイルとが類似することを示すとき、前記区間分割部、前記区間特徴量算出部、前記補正部および前記類似度評価部による処理を実行することを特徴とする請求項1に記載の類似度評価装置。 - 前記区間分割部は、
ローリングハッシュにより前記比較元ファイルと比較先ファイルそれぞれを複数の区間に分割することを特徴とする請求項1または2に記載の類似度評価装置。 - 利用者端末と類似度評価装置とを含み、バージョンが異なる実行ファイルである比較元ファイルと比較先ファイルとの類似度を評価する類似度評価システムであって、
前記利用者端末は、
前記比較元ファイルと前記比較先ファイルとを前記類似度評価装置へ出力する投入部と、
前記類似度評価装置から出力された前記比較元ファイルと前記比較先ファイルとの類似度の評価の結果を表示する表示部とを備え、
前記類似度評価装置は、
前記比較元ファイルを複数の区間に分割した比較元分割ファイルと、前記比較先ファイルを前記複数の区間に分割した比較先分割ファイルとを生成する区間分割部と、
前記比較元分割ファイルの区間ごとの所定のエントロピー値である比較元区間特徴量と、前記比較先分割ファイルの区間ごとの前記エントロピー値である比較先区間特徴量と、を生成する区間特徴量算出部と、
前記比較元区間特徴量と前記比較先区間特徴量それぞれに対し、DP(Dynamic Programming)マッチングにより前記比較元区間特徴量と前記比較先区間特徴量との距離をできるだけ小さくする補正を行う補正部と、
前記補正が行われた前記比較元区間特徴量と前記比較先区間特徴量とを区間ごとに比較することにより前記比較元ファイルと前記比較先ファイルとの類似度を評価する類似度評価部と、
前記類似度の評価結果を前記利用者端末へ出力する出力部と
を備えることを特徴とする類似度評価システム。 - 利用者端末と類似度評価装置とを含み、バージョンが異なる実行ファイルである比較元ファイルと比較先ファイルとの類似度を評価する類似度評価システムであって、
前記利用者端末は、
前記比較元ファイルを複数の区間に分割した比較元分割ファイルと、前記比較先ファイルを前記複数の区間に分割した比較先分割ファイルとを生成する区間分割部と、
前記比較元分割ファイルの区間ごとの所定のエントロピー値である比較元区間特徴量と、前記比較先分割ファイルの区間ごとの前記エントロピー値である比較先区間特徴量とを生成する区間特徴量算出部と、
前記比較元区間特徴量と前記比較先区間特徴量とを前記類似度評価装置へ出力する投入部と、
前記類似度評価装置から出力された前記比較元ファイルと前記比較先ファイルとの類似度の評価の結果を表示する表示部とを備え、
前記類似度評価装置は、
前記比較元区間特徴量と前記比較先区間特徴量それぞれに対し、DP(Dynamic Programming)マッチングにより前記比較元区間特徴量と前記比較先区間特徴量との距離をできるだけ小さくする補正を行う補正部と、
前記補正が行われた前記比較元区間特徴量と前記比較先区間特徴量とを区間ごとに比較することにより前記比較元ファイルと前記比較先ファイルとの類似度を評価する類似度評価部と、
前記類似度の評価結果を前記利用者端末へ出力する出力部と
を備えることを特徴とする類似度評価システム。 - バージョンが異なる実行ファイルである比較元ファイルと比較先ファイルとの類似度を評価する類似度評価方法であって、
前記比較元ファイルを複数の区間に分割した比較元分割ファイルと、前記比較先ファイルを前記複数の区間に分割した比較先分割ファイルとを生成するステップと、
前記比較元分割ファイルの区間ごとの所定のエントロピー値である比較元区間特徴量と、前記比較先分割ファイルの区間ごとの前記エントロピー値である比較先区間特徴量とを生成するステップと、
前記比較元区間特徴量と前記比較先区間特徴量それぞれに対し、DP(Dynamic Programming)マッチングにより前記比較元区間特徴量と前記比較先区間特徴量との距離をできるだけ小さくする補正を行うステップと、
前記補正が行われた前記比較元区間特徴量と前記比較先区間特徴量とを区間ごとに比較することにより前記比較元ファイルと前記比較先ファイルとの類似度を評価するステップと
を含んだことを特徴とする類似度評価方法。 - バージョンが異なる実行ファイルである比較元ファイルと比較先ファイルとの類似度を評価するための類似度評価プログラムであって、
前記比較元ファイルを複数の区間に分割した比較元分割ファイルと、前記比較先ファイルを前記複数の区間に分割した比較先分割ファイルとを生成するステップと、
前記比較元分割ファイルの区間ごとの所定のエントロピー値である比較元区間特徴量と、前記比較先分割ファイルの区間ごとの前記エントロピー値である比較先区間特徴量とを生成するステップと、
前記比較元区間特徴量と前記比較先区間特徴量それぞれに対し、DP(Dynamic Programming)マッチングにより前記比較元区間特徴量と前記比較先区間特徴量との距離をできるだけ小さくする補正を行うステップと、
前記補正が行われた前記比較元区間特徴量と前記比較先区間特徴量とを区間ごとに比較することにより前記比較元ファイルと前記比較先ファイルとの類似度を評価するステップと
をコンピュータに実行させることを特徴とする類似度評価プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014193257A JP6204318B2 (ja) | 2014-09-24 | 2014-09-24 | 類似度評価装置、類似度評価システム、類似度評価装置方法、および、類似度評価プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014193257A JP6204318B2 (ja) | 2014-09-24 | 2014-09-24 | 類似度評価装置、類似度評価システム、類似度評価装置方法、および、類似度評価プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016066135A JP2016066135A (ja) | 2016-04-28 |
JP6204318B2 true JP6204318B2 (ja) | 2017-09-27 |
Family
ID=55805474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014193257A Active JP6204318B2 (ja) | 2014-09-24 | 2014-09-24 | 類似度評価装置、類似度評価システム、類似度評価装置方法、および、類似度評価プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6204318B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6783741B2 (ja) * | 2017-11-24 | 2020-11-11 | 日本電信電話株式会社 | 距離測定装置、通信システム、作成装置及び距離測定プログラム |
CN108600792B (zh) * | 2018-04-02 | 2020-08-04 | 武汉斗鱼网络科技有限公司 | 一种相似度度量方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014085854A (ja) * | 2012-10-24 | 2014-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 類似度評価システム、類似度評価装置、利用者端末、類似度評価方法、およびプログラム |
-
2014
- 2014-09-24 JP JP2014193257A patent/JP6204318B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016066135A (ja) | 2016-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109643397B (zh) | 时间序列数据特征量提取装置、时间序列数据特征量提取方法和时间序列数据特征量提取程序 | |
JP5795743B2 (ja) | 適応的重み付けを用いた様々な文書間類似度計算方法に基づいた文書比較方法および文書比較システム | |
US20200090076A1 (en) | Non-transitory computer-readable recording medium, prediction method, and learning device | |
EP2996046A1 (en) | Data reading and writing method, device and system | |
CN110178123B (zh) | 性能指标评估方法及装置 | |
JP6204318B2 (ja) | 類似度評価装置、類似度評価システム、類似度評価装置方法、および、類似度評価プログラム | |
JP2019079102A (ja) | 学習装置、生成装置、分類装置、学習方法、学習プログラム、および動作プログラム | |
KR102554852B1 (ko) | 인공신경망을 이용한 rsa 암호에 대한 부채널 분석 방법 및 장치 | |
US11526740B2 (en) | Optimization apparatus and optimization method | |
CN112017776A (zh) | 基于动态图和医学知识图谱的疾病预测方法及相关设备 | |
JP2014085854A (ja) | 類似度評価システム、類似度評価装置、利用者端末、類似度評価方法、およびプログラム | |
JP6795448B2 (ja) | データ処理装置、データ処理方法およびプログラム | |
Gupta et al. | Queue Length and Server Content Distribution in an Infinite‐Buffer Batch‐Service Queue with Batch‐Size‐Dependent Service | |
EP4116853B1 (en) | Computer-readable recording medium storing evaluation program, evaluation method, and information processing device | |
JP2018067126A (ja) | 類似度評価装置、類似度評価システム、類似度評価方法、および、類似度評価プログラム | |
JP6835407B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
EP4227864A1 (en) | Evaluation method, evaluation device, and evaluation program | |
US20220103336A1 (en) | Cycle estimation device for pulse train signal, cycle estimation method for pulse train signal, and cycle estimation program for pulse train signal | |
CN110502736B (zh) | 一种总线数据解析方法及装置 | |
JP2017102566A (ja) | 不正ファイル検知装置、不正ファイル検知方法、および、不正ファイル検知プログラム | |
US20240086534A1 (en) | Falsification detection device, falsification detection method, and falsification detection program | |
JP6815931B2 (ja) | 統計量データ処理装置、統計量データ処理方法およびプログラム | |
EP4261719A1 (en) | Falsification detection device, falsification detection method, and falsification detection program | |
JP6488168B2 (ja) | 時系列データ処理方法、時系列データ処理プログラム、および、時系列データ処理装置 | |
WO2023166565A1 (ja) | 推定装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160912 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170627 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170829 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170831 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6204318 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |