JP7287474B2 - デバイス識別装置、デバイス識別方法およびデバイス識別プログラム - Google Patents
デバイス識別装置、デバイス識別方法およびデバイス識別プログラム Download PDFInfo
- Publication number
- JP7287474B2 JP7287474B2 JP2021541771A JP2021541771A JP7287474B2 JP 7287474 B2 JP7287474 B2 JP 7287474B2 JP 2021541771 A JP2021541771 A JP 2021541771A JP 2021541771 A JP2021541771 A JP 2021541771A JP 7287474 B2 JP7287474 B2 JP 7287474B2
- Authority
- JP
- Japan
- Prior art keywords
- label
- data
- learning
- new
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
- G06F11/3688—Test management for test execution, e.g. scheduling of test suites
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
- G06F11/3692—Test management for test results analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3041—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is an input/output interface
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/55—Detecting local intrusion or implementing counter-measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/81—Threshold
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
1つ目の課題は、識別対象と蓄積データの類似度の算出に機械学習を適用する際に顕在化する課題である。非特許文献1に記載の技術では、類似度が絶対量で表されることが前提であり、例えば、蓄積データとして、Aデバイス、Bデバイス、Cデバイスの特徴量が事前に収集されていた場合には、識別対象との類似性は、それぞれ10、80、90といった数値で算出される必要がある。一方で、機械学習の一つである教師有り学習のソフトウェアを用いる分類処理では、候補ラベル(この例では、Aデバイス、Bデバイス、Cデバイス)に分類される確度(確かさの度合い)の総和が100%となる相対的な量が算出される。例えば、3つの候補に対してそれぞれ10%、40%、50%といった値になる。つまり、このような値は、その集団の中での優劣は付くものの、絶対的な量としてどの程度類似しているのかを判断することはできない。したがって、単に機械学習を適用するだけでは、新種判定閾値で新種を判定することができなくなってしまう。
図1は、本実施形態に係るデバイス識別装置1の構成を示すブロック図である。
デバイス識別装置1は、ネットワークを介して通信接続される各デバイス等の通信情報を取得し、識別対象となるデバイスについて、新種(既存のデバイスの機種(または種別)にはない新たな機種(または種別))のデバイスか否かを判定する。
デバイス識別装置1は、新種のデバイスか否かの判定を、<1>機械学習を利用した、識別対象となるデバイスの類似度の計算、<2>新種判定閾値の自動設定、を行うことにより実現する。なお、以下に説明する本実施形態においては、主に、デバイス識別装置1が、識別対象のデバイスの「機種」を判定するものとして説明する。しかしながら、デバイス識別装置1は、識別対象デバイスの「種別」も同様の手法により判定することができる。
デバイス識別装置1は、制御部10、入出力部11、記憶部12を備えるコンピュータにより実現される。
入出力部11は、情報の送受信を行うための通信インタフェース、および、タッチパネルやキーボード等の入力装置や、モニタ等の出力装置との間で情報の送受信を行うための入出力インタフェースからなる。
通信情報収集部101は、この通信情報を、各デバイスから直接取得してもよいし、各デバイスを管理するネットワーク管理装置(図示省略)等から取得するようにしてもよい。
なお、通信情報収集部101は、ネットワークに識別対象デバイスが接続された旨の情報を、例えば、ネットワーク管理装置等から取得する。また、通信情報収集部101は、識別対象デバイスの通信情報を、学習用と識別用として時間を別々にし2回に分けて取得してもよいし、学習用と識別用とを連続して取得し、分割するようにしてもよい。
特徴量生成部102は、所定時間(例えば、10分)において取得した各デバイスの機種単位の通信情報を、所定の時間間隔(所定の周期である、例えば、60秒周期)で特徴量化(例えば、平均値を算出)し、ラベルを付して特徴量データ(特徴量化された通信情報)を生成する。そして、特徴量生成部102は、ラベルを付した特徴量データを、記憶部12内の蓄積データDB120に学習用データ(第1の学習用データ)として記憶する。ここで、ラベルは、機種(または種別)を識別する情報であり、例えば、機種A,機種B,機種Cがラベル(既存ラベル)として付される。
なお、この特徴量生成部102による上記の処理は、識別対象デバイスの通信情報を処理する前に事前に行うものである。
特徴量生成部102は、所定時間(例えば、10分)の識別対象デバイスの通信情報を取得すると、所定の時間間隔(例えば、60秒周期)で特徴量化し、ダミーラベルを付して特徴量データを生成する。そして、特徴量生成部102は、ダミーラベルを付した特徴量データを、記憶部12内の蓄積データDB120に学習用データ(第2の学習用データ)として記憶する。
また、特徴量生成部102は、さらに所定時間(例えば、10分)の識別対象デバイスの通信情報を取得すると、所定の時間間隔(例えば、60秒周期)で特徴量化して特徴量データを生成する。そして、特徴量生成部102は、その特徴量データを記憶部12に識別用データとして記憶する。
そして、機械学習部103は、各デバイスのラベル(機種)が付された学習用データ(特徴量データ)を、学習器3に学習させる。また、機械学習部103は、ダミーラベルが付された識別対象デバイスの特徴量データを学習用データとして、学習器3に学習させる。
このようにすることで、図2に示すように、識別対象デバイスの特徴量データ(識別用データ)が、ラベル「機種A」、ラベル「機種B」、ラベル「機種C」、若しくは、ダミーラベルに分類される。
例えば、図3に示すように、ダミーラベルに分類された特徴量データの数が「6」であり、機種Aに分類された特徴量データの数が「1」、機種Bに分類された特徴量データの数が「0」、機種Cに分類された特徴量データの数が「5」の場合においては、各ラベルで示される機種の類似度は次のように計算される。
ラベル「機種A」の類似度・・・ 1/6×100=17%
ラベル「機種B」の類似度・・・ 0/6×100= 0%
ラベル「機種C」の類似度・・・ 5/6×100=83%
一方、デバイス識別部105は、新種判定閾値以上の類似度を示す機種がなかった場合には、ダミーラベルを付した識別対象デバイスを新種のデバイス(例えば、「機種D」)であると判定する。
この新種判定閾値は、識別対象デバイスが、学習用の蓄積データ(学習用データ)がない新種(新しい機種)であるのか、既に学習用データがある既存機種であるのかを判定するために設ける類似度に対する閾値である。以下、新種判定閾値算出部106による、新種判定閾値の算出手法について説明する。
例えば、特徴量生成部102は、デバイスごとに10分間通信キャプチャされたデータ(通信情報)を通信情報収集部101から取得し、そのデータ(通信情報)を60秒周期で特徴量化して、1つのデバイス(機種)当たり10個の特徴量データを生成する。
なお、新種判定閾値算出部106は、新たに各機種の特徴量データを生成するのではなく、蓄積データDB120に記憶されている各機種の特徴量データを新種判定閾値の算出処理に用いてもよい。
具体的には、新種判定閾値算出部106は、1つのラベル(機種)を選択し、その機種の試験用データを2つに分割する。分割の割合は任意であるが、例えば、半分ずつに分割する。新種判定閾値算出部106は、分割した試験用データの一方に、ダミーラベルを付して、学習器3に学習させる。そして、新種判定閾値算出部106は、残りの試験データを学習器3に入力し、その試験用データを各ラベル(ダミーラベルを含む)に分類する。
そして、新種判定閾値算出部106は、正しい(選択した)ラベル(機種)の類似度を、「学習用データがあるときのデバイスの類似度」として抽出する。新種判定閾値算出部106は、この処理を、すべての機種それぞれを選択して行い、学習用データがあるときの正しいラベル(機種)の類似度を抽出する。
具体的には、新種判定閾値算出部106は、選択した1つのラベルについて、そのラベル(機種)の試験用データを2つに分割する。分割の割合は任意であるが、例えば、半分ずつに分割する。新種判定閾値算出部106は、分割した試験用データの一方に、ダミーラベルを付して、学習器3に学習させる。そして、新種判定閾値算出部106は、残りの試験データを学習器3に入力し、その試験用データを各ラベル(ダミーラベルを含む)に分類する。
そして、新種判定閾値算出部106は、学習用データがないときの各ラベルの類似度のうち、最も類似するラベルの類似度を抽出する。新種判定閾値算出部106は、同様の処理を他のすべてのラベルについても行い、「学習用データがないときの最も類似するデバイスの類似度」を抽出する。
これは、実際の新種デバイスにおいても、同様の類似度の傾向があるという保証ができないことから、新種判定と既存判定の両サイドにマージンを広くとった方が、つまり、中間値とした方が、これらの要素を吸収できるからである。
このような場合でも、新種判定閾値算出部106は、式(1)および式(2)を用いた上記のような手法により新種判定閾値を設定することで、なるべく多くの機種で正しい識別を行うことができる新種判定閾値を算出することができる。
ここでは、機種Aの学習用データがあるときの正しいラベルとの類似度(p)が「90(%)」、機種Aの学習用データがないときの最も類似するデバイスの類似度(q)が「10(%)」とする。また、機種Bの学習用データがあるときの正しいラベルとの類似度(p)が「70(%)」、機種Bの学習用データがないときの最も類似するデバイスの類似度(q)が「50(%)」とする。また、機種Cの学習用データがあるときの正しいラベルとの類似度(p)が「30(%)」、機種Cの学習用データがないときの最も類似するデバイスの類似度(q)が「15(%)」とする。
機種A:(|(90-40)-(40-10)|)= 20
機種B:(|(70-40)-(40-50)|)= 40
機種C:(|(30-40)-(40-15)|) = 35
よって、F(x) = 20 + 40 + 35 = 95 となる。
同様に、図7は、新種判定閾値x=50の場合であり、F(x)=75となる。また、図8は、新種判定閾値x=30の場合であり、F(x)=115となる。
新種判定閾値算出部106は、F(x)が最小となる新種判定閾値xを、このようにして探索することにより求めることができる。
なお、上記したように、新種判定閾値算出部106は、デバイス識別部105が識別対象デバイスについて新種判定閾値に基づき新種デバイスであると判定すると、当該デバイスを既存デバイスに追加して同様の処理(新種判定閾値の算出処理)を行い、新種判定閾値を更新する。
次に、デバイス識別装置1が実行する処理の流れについて説明する。
≪デバイス識別処理≫
図9は、本実施形態に係るデバイス識別装置1が実行するデバイス識別処理の流れを示すフローチャートである。デバイス識別装置1は、機械学習を利用して、識別対象となるデバイスの特徴量と既存デバイスに対応する機種の特徴量とに基づき類似度を計算し、新種判定閾値と比較することにより、識別対象デバイスが既存の機種と同じ機種のデバイスであるのか、新種のデバイスであるのかを判定する。以下、具体的に説明する。
なお、ステップS1,S2は、識別対象デバイスの通信情報を取得する前に予め行っておく。
そして、特徴量生成部102は、識別対象デバイスの通信情報を、所定の時間間隔(例えば、60秒周期)で特徴量化し、識別対象の特徴量データ(識別用データ)を生成する(ステップS6)。そして、特徴量生成部102は、生成した特徴量データを、記憶部12に識別用データとして記憶する。
具体的には、類似度計算部104は、ダミーラベル以外のラベル(既存ラベル)それぞれに分類された特徴量データの数を、ダミーラベルに分類された特徴量データの数で割った値を百分率で表したものをデバイス(機種)の類似度として計算する。
これにより、新種判定閾値算出部106は、新種のデバイスであると判定した識別対象デバイスを、例えば、機種Dとして既存デバイスに加えて、再度、新種判定閾値の算出処理を実行し、新種判定閾値を更新する。
次に、デバイス識別装置1の新種判定閾値算出部106による、新種判定閾値の算出処理について説明する。
図10および図11は、本実施形態に係るデバイス識別装置1が実行する新種判定閾値の算出処理の流れを示すフローチャートである。
なお、この新種判定閾値算出部106による新種判定閾値の算出処理は、図9のステップS13において、デバイス識別部105から、識別対象デバイスを新種のデバイスであると判定した旨の情報を取得したことを契機として、開始される。
具体的には、まず、新種判定閾値算出部106は、ラベルが付されたすべての機種(機種A,機種B,機種C,機種D)の学習用データを、学習器3に入力し学習させる(ステップS24)。
続いて、新種判定閾値算出部106は、分割した他方の試験用データ(特徴量データ)を、学習器3に入力し、その試験用データを各ラベル(ダミーラベルを含む)に分類する(ステップS26)。
そして、新種判定閾値算出部106は、選択したラベルiの試験用データを2つに分割し、分割した一方の試験用データ(特徴量データ)に、ダミーラベルを付して、学習器3に入力して学習させる(ステップS29)。
続いて、新種判定閾値算出部106は、分割した他方の試験用データ(特徴量データ)を、学習器3に入力し、その試験用データを各ラベル(ダミーラベルを含む)に分類する(ステップS30)。
一方、すべてのラベルが選択済みの場合には(ステップS32→No)、次のステップS33に進む。
本実施形態に係るデバイス識別装置1は、例えば図12に示すような構成のコンピュータ900によって実現される。
図12は、本実施形態に係るデバイス識別装置1の機能を実現するコンピュータ900の一例を示すハードウェア構成図である。コンピュータ900は、CPU(Central Processing Unit)901、ROM(Read Only Memory)902、RAM(Random Access Memory)903、HDD(Hard Disk Drive)904、入出力I/F(Interface)905、通信I/F906およびメディアI/F907を有する。
以下、デバイス識別装置の効果について説明する。
本発明に係るデバイス識別装置1は、ネットワークに接続される既存のデバイスを示す既存デバイスについての通信情報を機種または種類単位で取得するとともに、識別対象となるデバイスを示す識別対象デバイスについての通信情報を取得する通信情報収集部101と、既存デバイスの通信情報を所定の時間間隔で特徴量化し、機種または種類を識別するラベルを付して特徴量データを生成して第1の学習データとし、識別対象デバイスの通信情報を所定の時間間隔で特徴量化し、ダミーラベルを付して特徴量データを生成して第2の学習データとするともに、当該識別対象デバイスの通信情報をさらに取得して所定の時間間隔で特徴量化して特徴量データを生成し、当該生成した特徴量データを識別用データとする特徴量生成部102と、ラベルが付された第1の学習データ、および、ダミーラベルが付された第2の学習データを学習器3に学習させ、学習済の当該学習器3に識別用データを入力して、識別対象デバイスの特徴量データを、ダミーラベルを含む各ラベルに分類する機械学習部103と、各ラベルに分類された特徴量データの数と、ダミーラベルに分類された特徴量データの数とに基づき、識別対象デバイスの機種または種類と各ラベルで示される機種または種類との類似度を計算する類似度計算部104と、各ラベルの類似度について、所定の新種判定閾値以上の類似度となるラベルがあるか否かを判定し、所定の新種判定閾値以上の類似度のラベルがある場合に、識別対象デバイスが当該ラベルで示される機種または種類の既存デバイスであると識別し、所定の新種判定閾値以上の類似度のラベルがない場合に、識別対象デバイスが、既存のラベルで示される機種または種類とは異なる新種のデバイスであると識別するデバイス識別部105と、を備えることを特徴とする。
3 学習器
10 制御部
11 入出力部
12 記憶部
101 通信情報収集部
102 特徴量生成部
103 機械学習部
104 類似度計算部
105 デバイス識別部
106 新種判定閾値算出部
120 蓄積データDB
Claims (7)
- ネットワークに接続される既存のデバイスを示す既存デバイスについての通信情報を機種または種類単位で取得するとともに、識別対象となるデバイスを示す識別対象デバイスについての通信情報を取得する通信情報収集部と、
前記既存デバイスの通信情報を所定の時間間隔で特徴量化し、前記機種または前記種類を識別するラベルを付して特徴量データを生成して第1の学習データとし、
前記識別対象デバイスの通信情報を所定の時間間隔で特徴量化し、ダミーラベルを付して特徴量データを生成して第2の学習データとするともに、当該識別対象デバイスの通信情報をさらに取得して所定の時間間隔で特徴量化して特徴量データを生成し、当該生成した特徴量データを識別用データとする特徴量生成部と、
前記ラベルが付された第1の学習データ、および、前記ダミーラベルが付された第2の学習データを学習器に学習させ、学習済の当該学習器に前記識別用データを入力して、前記識別対象デバイスの特徴量データを、ダミーラベルを含む各ラベルに分類する機械学習部と、
各ラベルに分類された特徴量データの数と、ダミーラベルに分類された特徴量データの数とに基づき、前記識別対象デバイスの機種または種類と各ラベルで示される機種または種類との類似度を計算する類似度計算部と、
各ラベルの前記類似度について、所定の新種判定閾値以上の類似度となるラベルがあるか否かを判定し、前記所定の新種判定閾値以上の類似度のラベルがある場合に、前記識別対象デバイスが当該ラベルで示される機種または種類の既存デバイスであると識別し、前記所定の新種判定閾値以上の類似度のラベルがない場合に、前記識別対象デバイスが、既存のラベルで示される機種または種類とは異なる新種のデバイスであると識別するデバイス識別部と、
を備えることを特徴とするデバイス識別装置。 - 前記所定の新種判定閾値を算出する新種判定閾値算出部をさらに備え、
前記新種判定閾値算出部は、
前記既存デバイスの通信情報を所定の時間間隔で特徴量化し前記ラベルを付して特徴量データを生成し、生成した前記ラベルが付された特徴量データそれぞれを、学習用データと試験用データに分割し、
任意のラベルを1つ選択し、選択したラベルの試験用データをさらに2つに分割し、2つに分割した一方の試験用データにダミーラベルを付し、当該ダミーラベルが付された試験用データと各ラベルにおいて前記分割した学習用データとを学習器に学習させ、学習済の当該学習器に2つに分割した他方の試験用データを入力して、前記選択したラベルの試験用データを、前記ダミーラベルを含む各ラベルに分類し、前記選択したラベルの類似度を算出して、学習用データがあるときのデバイスの類似度として抽出する処理を、各ラベルについて行い、
任意のラベルを1つ選択し、選択したラベルの試験用データをさらに2つに分割し、2つに分割した一方の試験用データにダミーラベルを付し、当該ダミーラベルが付された試験用データと各ラベルにおいて前記分割した学習用データのうち前記選択したラベルの学習データを除いた学習データとを学習器に学習させ、学習済の当該学習器に2つに分割した他方の試験用データを入力して、前記選択したラベルの試験用データを、前記ダミーラベルを含み前記選択したラベルを除いた各ラベルに分類し、当該各ラベルの類似度を算出して、算出した類似度のうち最も値が高いラベルを、学習用データがないときの最も類似するデバイスの類似度として抽出する処理を、各ラベルについて行い、
各ラベルにおいて、前記学習用データがあるときのデバイスの類似度と、前記学習用データがないときの最も類似するデバイスの類似度との中間値となるように、前記新種判定閾値を算出すること
を特徴とする請求項1に記載のデバイス識別装置。 - 前記デバイス識別部は、前記識別対象デバイスが、前記新種のデバイスであると識別した際に、その旨の情報を前記新種判定閾値算出部に出力し、
前記新種判定閾値算出部は、前記新種のデバイスの通信情報を、前記既存デバイスの通信情報に加えて前記新種判定閾値の算出処理を行い、前記新種判定閾値を更新すること
を特徴とする請求項2に記載のデバイス識別装置。 - ネットワークに接続されるデバイスを識別するデバイス識別装置のデバイス識別方法であって、
前記デバイス識別装置は、
前記ネットワークに接続される既存のデバイスを示す既存デバイスについての通信情報を機種または種類単位で取得するとともに、識別対象となるデバイスを示す識別対象デバイスについての通信情報を取得するステップと、
前記既存デバイスの通信情報を所定の時間間隔で特徴量化し、前記機種または前記種類を識別するラベルを付して特徴量データを生成して第1の学習データとし、
前記識別対象デバイスの通信情報を所定の時間間隔で特徴量化し、ダミーラベルを付して特徴量データを生成して第2の学習データとするともに、当該識別対象デバイスの通信情報をさらに取得して所定の時間間隔で特徴量化して特徴量データを生成し、当該生成した特徴量データを識別用データとするステップと、
前記ラベルが付された第1の学習データ、および、前記ダミーラベルが付された第2の学習データを学習器に学習させ、学習済の当該学習器に前記識別用データを入力して、前記識別対象デバイスの特徴量データを、ダミーラベルを含む各ラベルに分類するステップと、
各ラベルに分類された特徴量データの数と、ダミーラベルに分類された特徴量データの数とに基づき、前記識別対象デバイスの機種または種類と各ラベルで示される機種または種類との類似度を計算するステップと、
各ラベルの前記類似度について、所定の新種判定閾値以上の類似度となるラベルがあるか否かを判定し、前記所定の新種判定閾値以上の類似度のラベルがある場合に、前記識別対象デバイスが当該ラベルで示される機種または種類の既存デバイスであると識別し、前記所定の新種判定閾値以上の類似度のラベルがない場合に、前記識別対象デバイスが、既存のラベルで示される機種または種類とは異なる新種のデバイスであると識別するステップと、
を実行することを特徴とするデバイス識別方法。 - 前記デバイス識別装置は、さらに、
前記既存デバイスの通信情報を所定の時間間隔で特徴量化し前記ラベルを付して特徴量データを生成し、生成した前記ラベルが付された特徴量データそれぞれを、学習用データと試験用データに分割し、
任意のラベルを1つ選択し、選択したラベルの試験用データをさらに2つに分割し、2つに分割した一方の試験用データにダミーラベルを付し、当該ダミーラベルが付された試験用データと各ラベルにおいて前記分割した学習用データとを学習器に学習させ、学習済の当該学習器に2つに分割した他方の試験用データを入力して、前記選択したラベルの試験用データを、前記ダミーラベルを含む各ラベルに分類し、前記選択したラベルの類似度を算出して、学習用データがあるときのデバイスの類似度として抽出する処理を、各ラベルについて行い、
任意のラベルを1つ選択し、選択したラベルの試験用データをさらに2つに分割し、2つに分割した一方の試験用データにダミーラベルを付し、当該ダミーラベルが付された試験用データと各ラベルにおいて前記分割した学習用データのうち前記選択したラベルの学習データを除いた学習データとを学習器に学習させ、学習済の当該学習器に2つに分割した他方の試験用データを入力して、前記選択したラベルの試験用データを、前記ダミーラベルを含み前記選択したラベルを除いた各ラベルに分類し、当該各ラベルの類似度を算出して、算出した類似度のうち最も値が高いラベルを、学習用データがないときの最も類似するデバイスの類似度として抽出する処理を、各ラベルについて行い、
各ラベルにおいて、前記学習用データがあるときのデバイスの類似度と、前記学習用データがないときの最も類似するデバイスの類似度との中間値となるように、前記新種判定閾値を算出するステップ、
を実行することを特徴とする請求項4に記載のデバイス識別方法。 - 前記デバイス識別装置は、前記識別対象デバイスが、前記新種のデバイスであると識別した際に、前記新種のデバイスの通信情報を、前記既存デバイスの通信情報に加えて前記新種判定閾値の算出処理を行い、前記新種判定閾値を更新するステップ、
を実行することを特徴とする請求項5に記載のデバイス識別方法。 - 請求項4ないし請求項6のいずれか1項に記載のデバイス識別方法を、コンピュータに実行させるためのデバイス識別プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/033116 WO2021038639A1 (ja) | 2019-08-23 | 2019-08-23 | デバイス識別装置、デバイス識別方法およびデバイス識別プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021038639A1 JPWO2021038639A1 (ja) | 2021-03-04 |
JP7287474B2 true JP7287474B2 (ja) | 2023-06-06 |
Family
ID=74685014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021541771A Active JP7287474B2 (ja) | 2019-08-23 | 2019-08-23 | デバイス識別装置、デバイス識別方法およびデバイス識別プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11847187B2 (ja) |
JP (1) | JP7287474B2 (ja) |
WO (1) | WO2021038639A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11770302B2 (en) * | 2022-02-01 | 2023-09-26 | Microsoft Technology Licensing, Llc | Assignments of IoT device types |
CN116257760B (zh) * | 2023-05-11 | 2023-08-11 | 浪潮电子信息产业股份有限公司 | 一种数据划分方法、系统、设备及计算机可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007122362A (ja) | 2005-10-27 | 2007-05-17 | Toyota Motor Corp | ニューラルネットワークを用いた状態推定方法及びニューラルネットワークを用いた状態推定装置 |
JP2017151838A (ja) | 2016-02-26 | 2017-08-31 | トヨタ自動車株式会社 | 話題推定学習装置及び話題推定学習方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6907436B2 (en) * | 2000-10-27 | 2005-06-14 | Arizona Board Of Regents, Acting For And On Behalf Of Arizona State University | Method for classifying data using clustering and classification algorithm supervised |
WO2015155896A1 (ja) * | 2014-04-11 | 2015-10-15 | 株式会社 日立製作所 | サポートベクトルマシン学習システムおよびサポートベクトルマシン学習方法 |
US9753968B1 (en) * | 2016-03-06 | 2017-09-05 | SparkBeyond Ltd. | Systems and methods for detection of anomalous entities |
-
2019
- 2019-08-23 WO PCT/JP2019/033116 patent/WO2021038639A1/ja active Application Filing
- 2019-08-23 US US17/636,485 patent/US11847187B2/en active Active
- 2019-08-23 JP JP2021541771A patent/JP7287474B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007122362A (ja) | 2005-10-27 | 2007-05-17 | Toyota Motor Corp | ニューラルネットワークを用いた状態推定方法及びニューラルネットワークを用いた状態推定装置 |
JP2017151838A (ja) | 2016-02-26 | 2017-08-31 | トヨタ自動車株式会社 | 話題推定学習装置及び話題推定学習方法 |
Non-Patent Citations (3)
Title |
---|
NOGUCHI, Hirofumi ほか,Device Identification Based on Communication Analysis for the Internet of Things,IEEE Access[online],IEEE,2019年04月16日,[retrieved on 2019.09.19], Vol.7,pp.52903-52912,ISSN 2169-3536, Retrieved from the Internet: <URL: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&a |
畑田充弘 ほか,実行時の通信挙動を用いたマルウェアの分類と未知検体検出への応用,コンピュータセキュリティシンポジウム2016 論文集,日本,一般社団法人 情報処理学会,2016年10月04日,情報処理学会シンポジウムシリーズVol.2016,No.2, pp.647-654,ISSN 1882-0840 |
野口博史 ほか,通信の類似性分析にもとづくIoTデバイス識別手法,電子情報通信学会技術研究報告,日本,電子情報通信学会,2018年07月04日,Vol.118, No.123,pp.45-50(RCC2018-32),ISSN 0913-5685 |
Also Published As
Publication number | Publication date |
---|---|
US20220276954A1 (en) | 2022-09-01 |
WO2021038639A1 (ja) | 2021-03-04 |
JPWO2021038639A1 (ja) | 2021-03-04 |
US11847187B2 (en) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
De Winter et al. | Combining temporal aspects of dynamic networks with node2vec for a more efficient dynamic link prediction | |
JP7127120B2 (ja) | ビデオ分類の方法、情報処理の方法及びサーバー、並びにコンピュータ可読記憶媒体及びコンピュータプログラム | |
WO2020087974A1 (zh) | 生成模型的方法和装置 | |
US9462313B1 (en) | Prediction of media selection consumption using analysis of user behavior | |
US10592666B2 (en) | Detecting anomalous entities | |
WO2020087979A1 (zh) | 生成模型的方法和装置 | |
WO2019184640A1 (zh) | 一种指标确定方法及其相关设备 | |
JP7287474B2 (ja) | デバイス識別装置、デバイス識別方法およびデバイス識別プログラム | |
JP6691094B2 (ja) | 学習装置、検知システム、学習方法及び学習プログラム | |
CN109214374A (zh) | 视频分类方法、装置、服务器及计算机可读存储介质 | |
CN111783810B (zh) | 用于确定用户的属性信息的方法和装置 | |
CN113037577B (zh) | 网络流量预测方法、装置和计算机可读存储介质 | |
US11677770B2 (en) | Data retrieval for anomaly detection | |
JP7342942B2 (ja) | 方法、デバイス、及びコンピュータプログラム製品 | |
CN117041017B (zh) | 数据中心的智能运维管理方法及系统 | |
CN111159241B (zh) | 一种点击转化预估方法及装置 | |
US10969964B2 (en) | Method, device, and computer program product for parallel data transmission using machine learning to determine number of concurrencies and data slice size | |
JP2012186667A (ja) | ネットワーク障害検出装置、ネットワーク障害検出装置のネットワーク障害検出方法およびネットワーク障害検出プログラム | |
CN116049379A (zh) | 知识推荐方法、装置、电子设备和存储介质 | |
CN111083469A (zh) | 一种视频质量确定方法、装置、电子设备及可读存储介质 | |
Paramasivam et al. | Cor-ENTC: correlation with ensembled approach for network traffic classification using SDN technology for future networks | |
Khokhar et al. | On active sampling of controlled experiments for qoe modeling | |
JP7173234B2 (ja) | 情報処理に用いられる方法、装置、デバイス及び記憶媒体 | |
CN111835541B (zh) | 一种流量识别模型老化检测方法、装置、设备及系统 | |
JP2019106120A (ja) | プロセススケジューリング装置、プロセス実行装置およびプロセススケジューリング方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221025 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221223 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230508 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7287474 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |