TW202010292A - 目標設備的預測方法、裝置、電子設備及儲存媒體 - Google Patents

目標設備的預測方法、裝置、電子設備及儲存媒體 Download PDF

Info

Publication number
TW202010292A
TW202010292A TW108120240A TW108120240A TW202010292A TW 202010292 A TW202010292 A TW 202010292A TW 108120240 A TW108120240 A TW 108120240A TW 108120240 A TW108120240 A TW 108120240A TW 202010292 A TW202010292 A TW 202010292A
Authority
TW
Taiwan
Prior art keywords
preset
devices
log
remote login
training
Prior art date
Application number
TW108120240A
Other languages
English (en)
Other versions
TWI706646B (zh
Inventor
徐子騰
Original Assignee
香港商阿里巴巴集團服務有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 香港商阿里巴巴集團服務有限公司 filed Critical 香港商阿里巴巴集團服務有限公司
Publication of TW202010292A publication Critical patent/TW202010292A/zh
Application granted granted Critical
Publication of TWI706646B publication Critical patent/TWI706646B/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本案實施例公開了一種目標設備的預測方法、裝置、電子設備及儲存媒體。該方法包括:獲取網路拓撲結構下預設設備在預定時間段內產生的遠端登錄日誌;從所述遠端登錄日誌中提取預設特徵屬性;利用預先訓練好的設備預測模型對所述預設特徵屬性進行處理,並預測所述預設設備是否為所述網路拓撲結構下的目標設備;其中,所述目標設備被用於管控所述網路拓撲結構下的多個設備。透過本案的實施方式,可以從海量遠端登錄日誌中提取出相關特徵,並透過預先訓練好的設備預測模型對相關特徵進行分析處理,從海量設備中定位出對其他設備具有管控能力的目標設備。

Description

目標設備的預測方法、裝置、電子設備及儲存媒體
本案涉及電腦技術領域,具體涉及一種目標設備的預測方法、裝置、電子設備及儲存媒體。
在同一網路拓撲結構下,有些設備為應用設備,而有些設備為運維管控設備。管理人員或者開發人員可以透過一些特定的設備登錄其他應用設備以進行運維管理操作。這些特定的設備通常有具有登錄大量其他設備的能力,可以稱之為運維管控設備。運維管控設備一旦被駭客攻陷,會直接導致大量應用設備被攻陷。因此,如何梳理出這些運維管控設備,則是業內普遍存在的一大難題。
本案實施例提供一種目標設備的預測及設備預測模型的訓練方法、裝置、電子設備、電腦可讀儲存媒體。 第一態樣,本案實施例中提供了一種目標設備的預測方法,包括:獲取網路拓撲結構下預設設備在預定時間段內產生的遠端登錄日誌;從所述遠端登錄日誌中提取預設特徵屬性;利用預先訓練好的設備預測模型對所述預設特徵屬性進行處理,並預測所述預設設備是否為所述網路拓撲結構下的目標設備;其中,所述目標設備被用於管控所述網路拓撲結構下的多個設備。 進一步地,所述預設特徵屬性包括所述預設設備在所述預定時間段內遠端登錄所述網路拓撲結構下其他設備的次數和/或個數。 進一步地,針對每條所述遠端登錄日誌,所述預設特徵屬性還包括以下至少一項:所述預設設備遠端登錄其他設備時是否使用密鑰登錄;所述預設設備以何種用戶身份遠端登錄其他設備;所述預設設備是否登錄成功。 進一步地,所述方法還包括:獲取多個訓練樣本;其中,所述訓練樣本包括特徵部分和結果標註部分,所述特徵部分包括所述預設特徵屬性,所述結果標註部分用於標註所述訓練樣本為正訓練樣本還是負訓練樣本;利用多個所述訓練樣本對人工智慧模型進行訓練,得到所述設備預測模型。 進一步地,所述獲取多個訓練樣本包括:獲取所述網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌;從所述遠端登錄日誌確定所述多個設備登錄其他設備的次數和/或個數;從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本。 第二態樣,本案實施例提供了一種設備預測模型的訓練方法,包括:獲取網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌;從所述遠端登錄日誌確定所述多個設備登錄其他設備的次數和/或個數;從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本;利用所述正訓練樣本和負訓練樣本對人工智慧模型進行訓練,得到設備預測模型。 進一步地,從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本,包括:從所述第一設備對應的遠端登錄日誌提取第一預設特徵屬性,根據所述第一預設特徵屬性產生所述正訓練樣本;從所述第二設備對應的遠端登錄日誌提取所述第二預設特徵屬性,根據所述第二預設特徵屬性產生所述負訓練樣本。 進一步地,所述第一預設特徵屬性至少包括所述第一設備遠端登錄其他設備的次數和/或個數;和/或,所述第二預設特徵屬性至少包括所述第二設備遠端登錄其他設備的次數和/或個數。 進一步地,針對所述第一設備對應的每條所述遠端登錄日誌,所述第一預設特徵屬性還包括以下至少一項:所述第一設備遠端登錄其他設備時是否使用密鑰登錄;所述第一設備以何種用戶身份遠端登錄其他設備;所述第一設備是否登錄成功;和/或,針對所述第一設備對應的每條所述遠端登錄日誌,所述第二預設特徵屬性還包括以下至少一項:所述第二設備遠端登錄其他設備時是否使用密鑰登錄;所述第二設備以何種用戶身份遠端登錄其他設備;所述第二設備是否登錄成功。 第三態樣,本案實施例提供了一種目標設備的預測裝置,包括:第一獲取模組,被配置為獲取網路拓撲結構下預設設備在預定時間段內產生的遠端登錄日誌;提取模組,被配置為從所述遠端登錄日誌中提取預設特徵屬性;預測模組,被配置為利用預先訓練好的設備預測模型對所述預設特徵屬性進行處理,並預測所述預設設備是否為所述網路拓撲結構下的目標設備;其中,所述目標設備被用於管控所述網路拓撲結構下的多個設備。 進一步地,所述預設特徵屬性包括所述預設設備在所述預定時間段內遠端登錄所述網路拓撲結構下其他設備的次數和/或個數。 進一步地,針對每條所述遠端登錄日誌,所述預設特徵屬性還包括以下至少一項:所述預設設備遠端登錄其他設備時是否使用密鑰登錄;所述預設設備以何種用戶身份遠端登錄其他設備;所述預設設備是否登錄成功。 進一步地,所述裝置還包括:第二獲取模組,被配置為獲取多個訓練樣本;其中,所述訓練樣本包括特徵部分和結果標註部分,所述特徵部分包括所述預設特徵屬性,所述結果標註部分用於標註所述訓練樣本為正訓練樣本還是負訓練樣本;第一訓練模組,被配置為利用多個所述訓練樣本對人工智慧模型進行訓練,得到所述設備預測模型。 進一步地,所述第二獲取模組,包括:第一獲取子模組,被配置為獲取所述網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌;第一確定子模組,被配置為從所述遠端登錄日誌確定所述多個設備登錄其他設備的次數和/或個數;產生子模組,被配置為從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本。 所述功能可以透過硬體實現,也可以透過硬體執行相應的軟體實現。所述硬體或軟體包括一個或多個與上述功能相對應的模組。 在一個可能的設計中,目標設備的預測裝置的結構中包括記憶體和處理器,所述記憶體用於儲存一條或多條支持目標設備的預測裝置執行上述第一態樣中目標設備的預測方法的電腦指令,所述處理器被配置為用於執行所述記憶體中儲存的電腦指令。所述目標設備的預測裝置還可以包括通信介面,用於目標設備的預測裝置與其他設備或通信網路通信。 第四態樣,本案實施例提供了一種設備預測模型的訓練裝置,包括:第三獲取模組,被配置為獲取網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌;第一確定模組,被配置為從所述遠端登錄日誌確定所述多個設備登錄其他設備的次數和/或個數;產生模組,被配置為從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本;第二訓練模組,被配置為利用所述正訓練樣本和負訓練樣本對人工智慧模型進行訓練,得到設備預測模型。 進一步地,所述產生模組,包括:第一提取子模組,被配置為從所述第一設備對應的遠端登錄日誌提取第一預設特徵屬性,根據所述第一預設特徵屬性產生所述正訓練樣本;第二提取子模組,被配置為從所述第二設備對應的遠端登錄日誌提取所述第二預設特徵屬性,根據所述第二預設特徵屬性產生所述負訓練樣本。 進一步地,所述第一預設特徵屬性至少包括所述第一設備遠端登錄其他設備的次數和/或個數;和/或,所述第二預設特徵屬性至少包括所述第二設備遠端登錄其他設備的次數和/或個數。 進一步地,針對所述第一設備對應的每條所述遠端登錄日誌,所述第一預設特徵屬性還包括以下至少一項:所述第一設備遠端登錄其他設備時是否使用密鑰登錄;所述第一設備以何種用戶身份遠端登錄其他設備;所述第一設備是否登錄成功;和/或,針對所述第一設備對應的每條所述遠端登錄日誌,所述第二預設特徵屬性還包括以下至少一項:所述第二設備遠端登錄其他設備時是否使用密鑰登錄;所述第二設備以何種用戶身份遠端登錄其他設備;所述第二設備是否登錄成功。 所述功能可以透過硬體實現,也可以透過硬體執行相應的軟體實現。所述硬體或軟體包括一個或多個與上述功能相對應的模組。 在一個可能的設計中,設備預測模型的訓練裝置的結構中包括記憶體和處理器,所述記憶體用於儲存一條或多條支持設備預測模型的訓練裝置執行上述第一態樣中設備預測模型的訓練方法的電腦指令,所述處理器被配置為用於執行所述記憶體中儲存的電腦指令。所述設備預測模型的訓練裝置還可以包括通信介面,用於設備預測模型的訓練裝置與其他設備或通信網路通信。 第五態樣,本案實施例提供了一種電子設備,包括記憶體和處理器;其中,所述記憶體用於儲存一條或多條電腦指令,其中,所述一條或多條電腦指令被所述處理器執行以實現第一態樣或第二態樣所述的方法步驟。 第六態樣,本案實施例提供了一種電腦可讀儲存媒體,用於儲存目標設備的預測裝置或設備預測模型的訓練裝置所用的電腦指令,其包含用於執行上述第一態樣中目標設備的預測方法或第二態樣中設備預測模型的訓練方法所涉及的電腦指令。 本案實施例提供的技術方案可以包括以下有益效果: 本案實施例透過獲取網路拓撲結構下設備的遠端登錄日誌,並從中提取預設特徵屬性後,根據預先訓練好的設備預測模型對預設特徵屬性進行分析處理,預測出該設備是否為目標設備。透過本案的實施方式,可以從海量遠端登錄日誌中提取出相關特徵,並透過預先訓練好的設備預測模型對相關特徵進行分析處理,從海量設備中定位出對其他設備具有管控能力的目標設備,本案利用設備訓練技術極大的提升了從遠端登錄日誌定位目標設備的準確性,很好的解決了大型網路拓撲結構下具有管控能力的設備難以定位的問題。 應當理解的是,以上的一般描述和後文的細節描述僅是示例性和解釋性的,並不能限制本案。
下文中,將參考附圖詳細描述本案的示例性實施方式,以使本領域技術人員可容易地實現它們。此外,為了清楚起見,在附圖中省略了與描述示例性實施方式無關的部分。 在本案中,應理解,諸如“包括”或“具有”等的術語旨在指示本說明書中所公開的特徵、數字、步驟、行為、部件、部分或其組合的存在,並且不欲排除一個或多個其他特徵、數字、步驟、行為、部件、部分或其組合存在或被添加的可能性。 另外還需要說明的是,在不衝突的情況下,本案中的實施例及實施例中的特徵可以相互組合。下面將參考附圖並結合實施例來詳細說明本案。 在一已知的網路拓撲結構下,主站內每天的系統日誌數量大約有1000萬條。已有技術根據系統日誌,統計出每天登錄其他設備數量在100次以上的設備,並確認這批設備為具有管控其他設備能力的目標設備,也可以稱之為運維管控設備。已有技術的方案雖然實現起來較為簡單,但是召回率很低,會漏掉一大批登錄次數在100次以下的運維管控設備。因為很多運維管控設備的登錄頻率並不會很高,有的登錄次數在一個小時一次,有的甚至是一天一次,所以單純的依賴登錄頻率高低不能很好的解決問題。 圖1示出根據本案一實施方式的目標設備的預測方法的流程圖。如圖1所示,所述目標設備的預測方法包括以下步驟S101-S103: 在步驟S101中,獲取網路拓撲結構下預設設備在預定時間段內產生的遠端登錄日誌; 在步驟S102中,從所述遠端登錄日誌中提取預設特徵屬性; 在步驟S103中,利用預先訓練好的設備預測模型對所述預設特徵屬性進行處理,並預測所述預設設備是否為所述網路拓撲結構下的目標設備;其中,所述目標設備被用於管控所述網路拓撲結構下的多個設備。 在本實施例中,一個網路拓撲結構可以包括多台經過傳輸媒體互連的設備,這些設備之間可以進行網路通信,該網路拓撲結構內的多數設備可以為執行相應應用的設備,而有一小部分設備作為管控其他設備的目標設備,可以被管理人員用來遠端登錄其他設備,進而維護和管理其他設備。目標設備是能夠遠端登錄網路拓撲結構下的其他設備並對其他設備進行管控的運維管控設備,其具有遠端登錄大量其他設備的能力。預設設備可以為網路拓撲結構下的任意一台設備,可以是運維管控設備,也可以是其他應用設備。網路拓撲結構下的任意設備所產生的遠端登錄日誌都可以預先儲存在資料庫中,在進行目標設備定位時,可以從資料庫中獲取預設設備在預定時間段內產生的遠端登錄日誌。由於目標設備遠端登錄其他應用設備的頻率不一定很高,因此可以透過設置預定時間段,並基於預定時間段內產生的遠端登錄日誌來判斷預設設備是否為目標設備。預定時間段的單位可以是周、月等,可根據實際情況設置,對此不做限制。 本一實施例中,遠端登錄日誌可以為SSH登錄日誌,一條SSH登錄日誌記錄了預設設備登錄其他設備的相關信息,例如可以包括如下字段: 1. 被登錄設備主機名 2. SSH登錄時間 3. SSH登錄結果(成功或失敗) 4. SSH登錄方法(密碼或密鑰) 5. SSH登錄用戶 6. 源登錄IP 7. 源登錄埠 為預測預設設備是否為目標設備,可以從SSH登錄日誌中的上述字段中提取相關的預設特徵屬性,進而利用預先訓練好的設備預測模型對所提取出的預設特徵屬性進行處理,並預測得到預設設備是否為目標設備的結論。目標設備所具有的共性包括:在一段時間內會多次遠端登錄其他設備,而登錄其他設備的個數基本不會為1(因為一台運維管控設備通常會管理和維護多台其他設備)。此外,目標設備作為運維管控設備,遠端登錄其他設備的目的是管理和維護其他設備,具有較大權利,可能採用根用戶的方式登錄其他設備的概率較大。因此可以基於目標設備的這些共性,預先設置預設特徵屬性,並在獲得預定時間段內的SSH登錄日誌後,從SSH登錄日誌中提取預設特徵屬性,並使用預先訓練好的設備預測模型進行預測。設備預測模型也是透過預設特徵屬性進行預先訓練得到的,能夠根據預設設備的SSH登錄日誌中提取出的預設特徵屬性預測出預設設備是否為目標設備。設備預測模型可以採用人工智慧模型進行訓練。人工智慧模型包括但不限於邏輯回歸、卷積神經網路、深度神經網路、支持向量機、K-means、K-neighbors、決策樹、隨機森林、貝葉斯網路中的一種或多種的組合。 本案實施例透過獲取網路拓撲結構下設備的遠端登錄日誌,並從中提取預設特徵屬性後,根據預先訓練好的預測模型對預設特徵屬性進行分析處理,預測得出該設備是否為目標設備。透過本案的實施方式,可以從海量遠端登錄日誌中提取出相關特徵,並透過預先訓練好的設備預測模型對相關特徵進行分析處理,從海量設備中定位出對其他設備具有管控能力的目標設備,本案利用設備訓練技術極大的提升了從遠端登錄日誌定位目標設備的準確性,很好的解決了大型網路拓撲結構下用於管控的設備難以定位的問題。 在本實施例的一個可選實現方式中,所述預設特徵屬性包括所述預設設備在所述預定時間段內遠端登錄所述網路拓撲結構下其他設備的次數和/或個數。 該可選的實現方式中,預設設備登錄其他設備的次數可以基於每遠端登錄一次其他設備就加1的方式確定;而登錄其他設備的個數可以基於在預定時間段內總共登錄過的其他設備的個數,可以理解的是同一個設備可能被遠端登錄過多次,因此次數大於個數。目標設備作為運維管控設備,至少會在一段時間內遠端登錄其他設備,而且通常所登錄的其他設備不止一個。此外,目標設備作為運維管控設備,還至少會在一段時間內遠端登錄其他設備,且登錄其他設備的次數也不止一次。因此可以基於這兩個預設特徵屬性,即預設設備遠端登錄其他設備的次數和個數中的一個或兩個的組合判斷預設設備是否為目標設備。而目標設備會在一段時間內登錄幾個其他設備以及多少次其他設備,跟其所在的網路拓撲結構以及應用環境相關,因此針對不同的網路拓撲結構及應用環境,至少可以使用預設設備遠端登錄其他設備的次數和個數中的一個或兩個的組合預先訓練得到設備預測模型,進而在實際應用中,利用該設備預測模型對該網路拓撲結構及應用環境下的預設設備進行預測。透過這種方式可以得到準確率較高的設備預測模型,使得目標設備的預測更加準確。 在本實施例的一個可選實現方式中,針對每條所述遠端登錄日誌,所述預設特徵屬性還包括以下至少一項: 所述預設設備遠端登錄其他設備時是否使用密鑰登錄; 所述預設設備以何種用戶身份遠端登錄其他設備; 所述預設設備是否登錄成功。 該可選的實現方式中,除了上述預設設備遠端登錄其他設備的次數和個數之外,還可以包括其他預設特徵屬性,能夠輔助判斷預設設備是否為目標設備,以增加預測的準確性。其他預設特徵屬性包括但不限於預設設備遠端登錄其他設備的登錄方式、用戶身份、是否登錄成功等。登錄方式包括是否使用密鑰登錄,用戶身份包括系統用戶、根用戶和普通用戶。通常情況下,在運維管控其他設備的過程中,目標設備可能會在短時間內多次登錄其他設備,如果每次登錄其他設備都手動輸入用戶名和密碼,會佔用運維人員的很多時間,因此通常情況下運維人員會為其他設備產生密鑰對,即一對公鑰和私鑰,並將公鑰儲存在其他設備上,而目標設備上儲存私鑰,目標設備在登錄其他設備時,可以自動將目標設備上的私鑰和其他設備上的公鑰進行配對,進而登錄其他設備,這種方式下登錄認證的過程都是自動的,無需人工干預,因此能夠節省運維人員的時間和精力。此外,目標設備通常都會以根用戶的身份登錄其他設備,以便能夠以最大權限來管控其他設備。使用上述這些預設特徵屬性進行預測,可以排除一些用戶遠端登錄自己的設備進行工作等情形。在設備預測模型的訓練階段,還可以使用上述其他預設特徵屬性進行訓練,使得設備預測模型的預測準確率進一步提高。 在本實施例的一個可選實現方式中,如圖2所示,所述方法進一步還包括以下步驟S201-S202: 在步驟S201中,獲取多個訓練樣本;其中,所述訓練樣本包括特徵部分和結果標註部分,所述特徵部分包括所述預設特徵屬性,所述結果標註部分用於標註所述訓練樣本為正訓練樣本還是負訓練樣本; 在步驟S202中,利用多個所述訓練樣本對人工智慧模型進行訓練,得到所述設備預測模型。 該可選的實現方式中,設備預測模型的訓練階段,可以先選出合適的人工智慧模型。人工智慧模型包括但不限於邏輯回歸、卷積神經網路、深度神經網路、支持向量機、K-means、K-neighbors、決策樹、隨機森林、貝葉斯網路中的一種或多種的組合。可以根據實際情況選擇相應的人工智慧模型的類型及結構,並根據預設特徵屬性的個數等建立人工智慧模型。之後,可以收集訓練樣本。訓練樣本可以包括特徵部分和結果標註部分,特徵部分包括訓練用的預設特徵屬性,可以是從目標設備(已知是目標設備的情況)在過去一段時間內的遠端登錄日誌提取出來的,也可以是從非目標設備(已知是非目標設備的情況)在過去一段時間內的遠端登錄日誌提取出來的,而結果標註部分用於標註訓練樣本為正訓練樣本還是負訓練樣本,正訓練樣本對應的是目標設備,而負訓練樣本對應的是非目標設備。在收集了足夠多的訓練樣本後,可以利用訓練樣本對建立好的人工智慧模型進行訓練,直到訓練次數達到一定值,或者人工智慧模型的參數收斂,停止訓練,訓練得到的是能夠預測是否為目標設備的設備預測模型。 在本實施例的一個可選實現方式中,如圖3所示,所述步驟201,即獲取多個訓練樣本的步驟,進一步包括以下步驟S301-S303: 在步驟S301中,獲取所述網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌; 在步驟S302中,從所述遠端登錄日誌確定所述多個設備登錄其他設備的次數和/或個數; 在步驟S303中,從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本。 該可選的實現方式中,歷史時間段可以是過去的某一段時間,具體根據實際情況設置。在一實施例中,歷史時間段和預定時間段的時間長度差不多,也即歷史時間段和預定時間段的時間長度之差可以小於一預設臨限值,這是因為在應用設備預測模型進行預測時,預設特徵屬性中包括預設設備在預定時間段內所登錄其他設備的次數和個數。如果在訓練設備預測模型時,所採用的歷史時間段和預定時間段的時間長度相差不大的話,能使設備預測模型的預測準確率更高。在收集訓練樣本時,該實現方式中透過預設網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌,統計每個設備登錄其他設備的次數和/或個數(包括次數、個數或兩者的組合),並基於該次數和/或個數來確定該設備是否為目標設備,進而從遠端登錄日誌提取出預設特徵屬性產生正訓練樣本和負訓練樣本的。這是因為經過統計分析可以發現,在一個設備登錄其他設備的次數和/或個數大於一個較大臨限值的情況下,基本上可以確定該設備為目標設備,而該次數和/或個數小於一個較小臨限值的情況下,基本上可以確定該設備為非目標設備。因此,透過這種方式可以在並不確定目標設備的情況下,就能夠收集到足夠多的正訓練樣本和負訓練樣本。 下面透過一具體的示例詳細說明設備預測模型的訓練過程。 1、預設特徵屬性提取: 首先針對當前網路拓撲結構下的多個設備,統計一個月內的SSH登錄日誌資料,並對一個月內的SSH登錄日誌資料進行如下兩個方面的統計: 某個IP一個月內登錄其他設備的次數; 某個IP一個月內登錄其他不同設備的個數; 將統計的上述次數和個數作為該IP對應設備的兩個預設特徵屬性值(第一個預設特徵屬性和第二個預設特徵屬性); 除了以上兩個特徵屬性之外,還對每條SSH登錄日誌資料進行了特徵提取,具體方法如下: 登錄結果特徵屬性(第三個預設特徵屬性)的提取:如果登錄成功則將登錄結果特徵屬性置為1,登錄失敗則將登錄結果特徵屬性置為0。 登錄方式特徵屬性(第四個預設特徵屬性)的提取:如果是用公鑰(public key)登錄,則將登錄方式特徵屬性置為1,其他方法則將登錄方式特徵屬性置為0。 用戶身份特徵屬性的提取:用戶分為三類,第一類是root用戶,第二類是系統用戶(admin, log, agent),第三類是其他用戶;如果登錄的用戶身份是root用戶,則將用戶身份特徵屬性中的根用戶身份特徵屬性(第五個預設特徵屬性)置為1,如果登錄的用戶身份是系統用戶,則將用戶身份特徵屬性中的系統用戶身份特徵屬性(第六個預設特徵屬性)置為1,否則根用戶身份特徵屬性和系統用戶身份特徵屬性均置為0。 2、正負訓練樣本產生: 運維管控設備的梳理本質上是一個二分類問題。從SSH日誌中可以確定一台設備是運維管控設備,或者不是運維管控設備。所以正負訓練樣本的產生也是一樣,可以透過已有的經驗,確定一批設備是運維管控設備,也可以確定一批設備為非運維管控設備。下面闡述一下本示例中的正負訓練樣本產生邏輯: 1)正訓練樣本產生邏輯: 運維管控設備通常會登錄大量不同設備,既滿足登錄次數的要求,也需要滿足不同設備個數的要求。所以正訓練樣本的產生滿足兩個要求: 一個月內登錄其他設備次數大於3000次; 一個月內被該設備登錄的其他設備大於3個。 因此,從一個月內網路拓撲結構下多個設備產生的SSH登錄日誌中,可以按照上述邏輯產生正訓練樣本共1012591條。 2)負訓練樣本產生邏輯: 負訓練樣本產生邏輯較簡單,以下兩個條件任滿足其一即可: 一個月內登錄其他設備次數小於10次。 一個月內被該設備登錄的其他設備個數只有一個。 因此,從一個月內網路拓撲結構下多個設備產生的SSH登錄日誌中,可以按照上述邏輯產生負訓練樣本共958061條。 3、人工智慧模型的建立與訓練: 本示例中選擇邏輯回歸模型進行訓練。邏輯回歸算法由於需要指定特徵列和結果列。本示例中指定了上述六個預設特徵屬性為特徵列。將正負訓練樣本的結果(即目標設備還是非目標設備)標記為結果列。設定邏輯回歸模型參數如下: 最大迭代次數:100 收斂誤差:0.000001 目標基準值:1 利用上述收集的正訓練樣本和負訓練樣本對邏輯回歸模型進行訓練,在最大迭代次數達到100或者參數收斂誤差在0.000001時,停止訓練,得到訓練好的設備預測模型。 另一方面,本案還公開了設備預測模型的訓練方法。圖4示出了根據本案另一實施方式的設備預測模型的訓練方法的流程圖。如圖4所示,所述設備預測模型的訓練方法包括以下步驟S401-S404: 在步驟S401中,獲取網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌; 在步驟S402中,從所述遠端登錄日誌確定所述多個設備登錄其他設備的次數和/或個數; 在步驟S403中,從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本; 在步驟S404中,利用所述正訓練樣本和負訓練樣本對人工智慧模型進行訓練,得到設備預測模型。 本實施例中,目標設備是可以被用來登錄網路拓撲結構下其他設備,進而對其他設備進行管理和維護的設備。網路拓撲結構中的大多數都是非目標設備,也即用於執行應用的應用設備,而有一小部分是目標設備。隨著網路拓撲結構運行時間的增加,越來越難以定位目標設備。因此,為了獲得能夠預測網路拓撲結構下的某台設備是否為目標設備,可以透過訓練樣本訓練人工智慧模型,得到設備預測模型。 本實施例透過從網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌,統計得出一台設備登錄其他設備的次數,以及該設備登錄其他不同設備的個數,進而根據該次數和/或個數是否滿足預設條件來判斷是第一設備還是第二設備,如果是第一設備則可以根據該第一設備對應的遠端登錄日誌產生正訓練樣本,如果是第二設備則可以根據該第二設備對應的遠端登錄日誌產生負訓練樣本。也就是說,如果上述次數和/或個數滿足預設條件,則可以認為該設備為目標設備,而如果不滿足預設條件,則為非目標設備。而預設條件可以根據的網路拓撲結構下目標設備和非目標設備的實際情況進行設置。這是因為經過統計分析,在一個設備登錄其他設備的次數和/或個數大於一個較大臨限值的情況下,基本上可以確定該設備為目標設備,而該次數和/或個數小於一個較小臨限值的情況下,基本上可以確定該設備為非目標設備,而較大臨限值和較小臨限值則可以根據實際情況進行設置。透過這種方式在目標設備不已知的情況下,依然能夠產生正訓練樣本和負訓練樣本,並且所產生的正負訓練樣本的數量也能足夠多。 在產生了訓練樣本後,可以選擇合適的人工智慧模型進行訓練。人工智慧模型包括但不限於邏輯回歸、卷積神經網路、深度神經網路、支持向量機、K-means、K-neighbors、決策樹、隨機森林、貝葉斯網路中的一種或多種的組合。可以根據實際情況選擇相應的人工智慧模型的類型,並根據預設特徵屬性的個數等建立人工智慧模型。之後,可以利用訓練樣本對建立好的人工智慧模型進行訓練,直到訓練次數達到一定值,或者人工智慧模型的參數收斂,停止訓練,訓練得到的是能夠預測是否為目標設備的設備預測模型。訓練樣本的收集、人工智慧模型的選取與建立的順序,可以根據實際情況而定,可以先收集訓練樣本,也可以先選取並建立人工智慧模型。 本實施例的相關細節還可參見上述目標設備的預測方法的描述,在此不再贅述。 在本實施例的一個可選實現方式中,如圖5所示,所述步驟S403,即從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本的步驟,進一步包括以下步驟; 在步驟S501中,從所述第一設備對應的遠端登錄日誌提取第一預設特徵屬性,根據所述第一預設特徵屬性產生所述正訓練樣本; 在步驟S502中,從所述第二設備對應的遠端登錄日誌提取所述第二預設特徵屬性,根據所述第二預設特徵屬性產生所述負訓練樣本。 該可選的實現方式中,在確定了第一設備(也即目標設備)和第二設備(非目標設備)後,還可以從第一設備和第二設備對應的遠端登錄日誌再提取第一預設特徵屬性和第二預設特徵屬性,進而產生正訓練樣本和負訓練樣本。無論是正訓練樣本還是負訓練樣本,都包括兩部分:特徵部分和結果標註部分;特徵部分包括能夠表徵該設備是否為目標設備的特徵,也即前面提到的第一預設特徵屬性和第二預設特徵屬性,而結果標註部分用於標註該特徵部分對應的是目標設備的特徵還是非目標設備的特徵。在第一預設特徵屬性和第二預設特徵屬性至少要包括第一設備和第二設備在歷史時間段內登錄其他設備的次數和登錄其他不同設備的個數,除了這兩個預設特徵屬性之外,還可以包括其他特徵屬性。 在本實施例的一個可選實現方式中,所述第一預設特徵屬性至少包括所述第一設備遠端登錄其他設備的次數和/或個數;和/或,所述第二預設特徵屬性至少包括所述第二設備遠端登錄其他設備的次數和/或個數。 在本實施例的一個可選實現方式中,針對所述第一設備對應的每條所述遠端登錄日誌,所述第一預設特徵屬性還包括以下至少一項: 所述第一設備遠端登錄其他設備時是否使用密鑰登錄; 所述第一設備以何種用戶身份遠端登錄其他設備; 所述第一設備是否登錄成功; 和/或,針對所述第一設備對應的每條所述遠端登錄日誌,所述第二預設特徵屬性還包括以下至少一項: 所述第二設備遠端登錄其他設備時是否使用密鑰登錄; 所述第二設備以何種用戶身份遠端登錄其他設備; 所述第二設備是否登錄成功。 該可選的實現方式中,第一設備對應的第一預設特徵屬性除了所述第一設備遠端登錄其他設備的次數和/或個數之外,還包括第一設備登錄其他設備時的登錄方式、登錄結果以及登錄所使用的用戶身份。登錄方式可以包括是否使用密鑰登錄,用戶身份可以包括系統用戶、根用戶和普通用戶。通常情況下,目標設備會採用密鑰登錄其他設備,目標設備通常都會以根用戶的身份登錄其他設備,以便能夠以最大權利來管控其他設備。使用其他預設特徵屬性進行訓練,可以使得設備預測模型的預測準確率進一步提高。 該設備預測模型的訓練方法的一些相關細節還可以參考上述對目標設備的預測方法中的描述,在此不再贅述。 下述為本案裝置實施例,可以用於執行本案方法實施例。 圖6示出根據本案一實施方式的目標設備的預測裝置的結構方塊圖,該裝置可以透過軟體、硬體或者兩者的結合實現成為電子設備的部分或者全部。如圖6所示,所述目標設備的預測裝置包括第一獲取模組601、提取模組602和預測模組603: 第一獲取模組601,被配置為獲取網路拓撲結構下預設設備在預定時間段內產生的遠端登錄日誌; 提取模組602,被配置為從所述遠端登錄日誌中提取預設特徵屬性; 預測模組603,被配置為利用預先訓練好的設備預測模型對所述預設特徵屬性進行處理,並預測所述預設設備是否為所述網路拓撲結構下的目標設備;其中,所述目標設備被用於管控所述網路拓撲結構下的多個設備。 在本實施例中,一個網路拓撲結構可以包括多台經過傳輸媒體互連的設備,共同處於同一個生產域內,這些設備之間可以進行網路通信,該網路拓撲結構內的多數設備可以為執行相應應用的設備,而有一小部分設備作為管控其他設備的目標設備,可以被管理人員用來遠端登錄其他設備,進而維護和管理其他設備。目標設備是能夠遠端登錄網路拓撲結構下的其他設備並對其他設備進行管控的運維管控設備,其具有遠端登錄大量其他設備的能力。預設設備可以為網路拓撲結構下的任意一台設備,可以是運維管控設備,也可以是其他應用設備。網路拓撲結構下的任意設備所產生的遠端登錄日誌都可以預先儲存在資料庫中,在進行目標設備定位時,可以從資料庫中獲取預設設備在預定時間段內產生的遠端登錄日誌。由於目標設備遠端登錄其他應用設備的頻率不一定很高,因此可以透過設置預定時間段,並基於預定時間段內產生的遠端登錄日誌來判斷預設設備是否為目標設備。預定時間段的單位可以是周、月等,可根據實際情況設置,對此不做限制。 本實施例中,遠端登錄日誌可以為SSH登錄日誌,一條SSH登錄日誌記錄了預設設備登錄其他設備的相關信息,例如可以包括如下字段: 1. 被登錄設備主機名 2. SSH登錄時間 3. SSH登錄結果(成功或失敗) 4. SSH登錄方法(密碼或公鑰) 5. SSH登錄用戶 6. 源登錄IP 7. 源登錄埠 為預測預設設備是否為目標設備,可以從SSH登錄日誌中的上述字段中提取相關的預設特徵屬性,進而利用預先訓練好的設備預測模型對所提取出的預設特徵屬性進行處理,並預測得到預設設備是否為目標設備的結論。目標設備所具有的共性包括:在一段時間內會多次遠端登錄其他設備,而登錄其他設備的個數基本不會為1(因為一台運維管控設備通常會管理和維護多台其他設備)。此外,目標設備作為運維管控設備,遠端登錄其他設備的目的是管理和維護其他設備,具有較大權利,可能採用根用戶的方式登錄其他設備的概率較大。因此可以基於目標設備的這些共性,預先設置預設特徵屬性,並在獲得預定時間段內的SSH登錄日誌後,從SSH登錄日誌中提取預設特徵屬性,並使用預先訓練好的設備預測模型進行預測。設備預測模型也是透過預設特徵屬性進行預先訓練得到的,能夠根據預設設備的SSH登錄日誌中提取出的預設特徵屬性預測出預設設備是否為目標設備。設備預測模型可以採用人工智慧模型進行訓練。人工智慧模型包括但不限於邏輯回歸、卷積神經網路、深度神經網路、支持向量機、K-means、K-neighbors、決策樹、隨機森林、貝葉斯網路中的一種或多種的組合。 本案實施例中,第一獲取模組601透過獲取網路拓撲結構下設備的遠端登錄日誌,提取模組602從中提取預設特徵屬性後,預測模組603根據預先訓練好的預測模型對預設特徵屬性進行分析處理,預測得出該設備是否為目標設備。透過本案的實施方式,可以從海量遠端登錄日誌中提取出相關特徵,並透過預先訓練好的設備預測模型對相關特徵進行分析處理,從海量設備中定位出對其他設備具有管控能力的目標設備,本案利用設備訓練技術極大的提升了從遠端登錄日誌定位目標設備的準確性,很好的解決了大型網路拓撲結構下用於管控的設備難以定位的問題。 在本實施例的一個可選實現方式中,所述預設特徵屬性包括所述預設設備在所述預定時間段內遠端登錄所述網路拓撲結構下其他設備的次數和/或個數。 該可選的實現方式中,預設設備登錄其他設備的次數可以基於每遠端登錄一次其他設備就加1的方式確定;而登錄其他設備的個數可以基於在預定時間段內總共登錄過的其他設備的個數,可以理解的是同一個設備可能被遠端登錄過多次,因此次數大於個數。目標設備作為運維管控設備,至少會在一段時間內遠端登錄其他設備,而且通常所登錄的其他設備不止一個。此外,目標設備作為運維管控設備,還至少會在一段時間內遠端登錄其他設備,且登錄其他設備的次數也不止一次。因此可以基於這兩個預設特徵屬性,即預設設備遠端登錄其他設備的次數和個數中的一個或兩個的組合判斷預設設備是否為目標設備。而目標設備會在一段時間內登錄幾個其他設備以及多少次其他設備,跟其所在的網路拓撲結構以及應用環境相關,因此針對不同的網路拓撲結構及應用環境,至少可以使用預設設備遠端登錄其他設備的次數和個數中的一個或兩個的組合預先訓練得到設備預測模型,進而在實際應用中,利用該設備預測模型對該網路拓撲結構及應用環境下的預設設備進行預測。透過這種方式可以得到準確率較高的設備預測模型,使得目標設備的預測更加準確。 在本實施例的一個可選實現方式中,針對每條所述遠端登錄日誌,所所述預設特徵屬性還包括以下至少一項: 所述預設設備遠端登錄其他設備時是否使用密鑰登錄; 所述預設設備以何種用戶身份遠端登錄其他設備; 所述預設設備是否登錄成功。 該可選的實現方式中,除了上述預設設備遠端登錄其他設備的次數和個數之外,還可以包括其他預設特徵屬性,能夠輔助判斷預設設備是否為目標設備,以增加預測的準確性。其他預設特徵屬性包括但不限於預設設備遠端登錄其他設備的登錄方式、用戶身份、是否登錄成功等。登錄方式包括是否使用密鑰登錄,用戶身份包括系統用戶、根用戶和普通用戶。通常情況下,在運維管控其他設備的過程中,目標設備可能會在短時間內多次登錄其他設備,如果每次登錄其他設備都手動輸入用戶名和密碼,會佔用運維人員的很多時間,因此通常情況下運維人員會為其他設備產生密鑰對,即一對公鑰和私鑰,並將公鑰儲存在其他設備上,而目標設備上儲存私鑰,目標設備在登錄其他設備時,可以自動將目標設備上的私鑰和其他設備上的公鑰進行配對,進而登錄其他設備,這種方式下登錄認證的過程都是自動的,無需人工干預,因此能夠節省運維人員的時間和精力。此外,目標設備通常都會以根用戶的身份登錄其他設備,以便能夠以最大權限來管控其他設備。使用上述這些預設特徵屬性進行預測,可以排除一些用戶遠端登錄自己的設備進行工作等情形。在設備預測模型的訓練階段,還可以使用上述其他預設特徵屬性進行訓練,使得設備預測模型的預測準確率進一步提高。 在本實施例的一個可選實現方式中,所述裝置還包括: 第二獲取模組,被配置為獲取多個訓練樣本;其中,所述訓練樣本包括特徵部分和結果標註部分,所述特徵部分包括所述預設特徵屬性,所述結果標註部分用於標註所述訓練樣本為正訓練樣本還是負訓練樣本; 第一訓練模組,被配置為利用多個所述訓練樣本對人工智慧模型進行訓練,得到所述設備預測模型。 該可選的實現方式中,設備預測模型的訓練階段,可以先選出合適的人工智慧模型。人工智慧模型包括但不限於邏輯回歸、卷積神經網路、深度神經網路、支持向量機、K-means、K-neighbors、決策樹、隨機森林、貝葉斯網路中的一種或多種的組合。可以根據實際情況選擇相應的人工智慧模型的類型及結構,並根據預設特徵屬性的個數等建立人工智慧模型。之後,第二獲取模組可以收集訓練樣本。訓練樣本可以包括特徵部分和結果標註部分,特徵部分包括訓練用的預設特徵屬性,可以是從目標設備(已知是目標設備的情況)在過去一段時間內的遠端登錄日誌提取出來的,也可以是從非目標設備(已知是非目標設備的情況)在過去一段時間內的遠端登錄日誌提取出來的,而結果標註部分用於標註訓練樣本為正訓練樣本還是負訓練樣本,正訓練樣本對應的是目標設備,而負訓練樣本對應的是非目標設備。在收集了足夠多的訓練樣本後,訓練模組可以利用訓練樣本對建立好的人工智慧模型進行訓練,直到訓練次數達到一定值,或者人工智慧模型的參數收斂,停止訓練,訓練得到的是能夠預測是否為目標設備的設備預測模型。 在本實施例的一個可選實現方式中,所述第二獲取模組,包括: 第一獲取子模組,被配置為獲取所述網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌; 第一確定子模組,被配置為從所述遠端登錄日誌確定所述多個設備登錄其他設備的次數和/或個數; 產生子模組,被配置為從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本。 該可選的實現方式中,歷史時間段可以是過去的某一段時間,具體根據實際情況設置。在一實施例中,歷史時間段和預定時間段的時間長度差不多,也即歷史時間段和預定時間段的時間長度之差可以小於一預設臨限值,這是因為在應用設備預測模型進行預測時,預設特徵屬性中包括預設設備在預定時間段內所登錄其他設備的次數和個數。如果在訓練設備預測模型時,所採用的歷史時間段和預定時間段的時間長度相差不大的話,能使設備預測模型的預測準確率更高。在收集訓練樣本時,該實現方式中第一獲取子模組收集預設網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌,第一確定子模組統計每個設備登錄其他設備的次數和/或個數(包括次數、個數或兩者的組合),產生子模組基於該次數和/或個數來確定該設備是否為目標設備,進而從遠端登錄日誌提取出預設特徵屬性產生正訓練樣本和負訓練樣本的。這是因為經過統計分析可以發現,在一個設備登錄其他設備的次數和/或個數大於一個較大臨限值的情況下,基本上可以確定該設備為目標設備,而該次數和/或個數小於一個較小臨限值的情況下,基本上可以確定該設備為非目標設備。因此,透過這種方式可以在並不確定目標設備的情況下,就能夠收集到足夠多的正訓練樣本和負訓練樣本。 另一方面,本案還公開了設備預測模型的訓練裝置。圖7示出根據本案一實施方式的設備預測模型的訓練裝置的結構方塊圖,該裝置可以透過軟體、硬體或者兩者的結合實現成為電子設備的部分或者全部。如圖6所示,所述設備預測模型的訓練包括第三獲取模組701、第一確定模組702、產生模組703和訓練模組704: 第三獲取模組701,被配置為獲取網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌; 第一確定模組702,被配置為從所述遠端登錄日誌確定所述多個設備登錄其他設備的次數和/或個數; 產生模組703,被配置為從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本; 第二訓練模組704,被配置為利用所述正訓練樣本和負訓練樣本對人工智慧模型進行訓練,得到設備預測模型。 本實施例中,目標設備是可以被用來登錄網路拓撲結構下其他設備,進而對其他設備進行管理和維護的設備。網路拓撲結構中的大多數都是非目標設備,也即用於執行應用的應用設備,而有一小部分是目標設備。隨著網路拓撲結構運行時間的增加,越來越難以定位目標設備。因此,為了獲得能夠預測網路拓撲結構下的某台設備是否為目標設備,可以透過訓練樣本訓練人工智慧模型,得到設備預測模型。 本實施例中,第三獲取模組701透過從網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌,第一確定模組702統計得出一台設備登錄其他設備的次數,以及該設備登錄其他不同設備的個數,產生模組703進而根據該次數和/或個數是否滿足預設條件來判斷是第一設備還是第二設備,如果是第一設備則產生模組703可以根據該第一設備對應的遠端登錄日誌產生正訓練樣本,如果是第二設備則產生模組703可以根據該第二設備對應的遠端登錄日誌產生負訓練樣本。也就是說,如果上述次數和/或個數滿足預設條件,則可以認為該設備為目標設備,而如果不滿足預設條件,則為非目標設備。而預設條件可以根據的網路拓撲結構下目標設備和非目標設備的實際情況進行設置。這是因為經過統計分析可以發現,在一個設備登錄其他設備的次數和/或個數大於一個較大臨限值的情況下,基本上可以確定該設備為目標設備,而該次數和/或個數小於一個較小臨限值的情況下,基本上可以確定該設備為非目標設備,而較大臨限值和較小臨限值則可以根據實際情況進行設置。透過這種方式在目標設備不已知的情況下,依然能夠產生正訓練樣本和負訓練樣本,並且所產生的正負訓練樣本的數量也能足夠多。 在產生了訓練樣本後,第二訓練模組704可以選擇合適的人工智慧模型進行訓練。人工智慧模型包括但不限於邏輯回歸、卷積神經網路、深度神經網路、支持向量機、K-means、K-neighbors、決策樹、隨機森林、貝葉斯網路中的一種或多種的組合。可以根據實際情況選擇相應的人工智慧模型的類型,並根據預設特徵屬性的個數等建立人工智慧模型。之後,可以利用訓練樣本對建立好的人工智慧模型進行訓練,直到訓練次數達到一定值,或者人工智慧模型的參數收斂,停止訓練,訓練得到的是能夠預測是否為目標設備的設備預測模型。訓練樣本的收集、人工智慧模型的選取與建立的順序,可以根據實際情況而定,可以先收集訓練樣本,也可以先選取並建立人工智慧模型。 本實施例的相關細節還可參見上述目標設備的預測裝置的描述,在此不再贅述。 在本實施例的一個可選實現方式中,所述產生模組703,包括: 第一提取子模組,被配置為從所述第一設備對應的遠端登錄日誌提取第一預設特徵屬性,根據所述第一預設特徵屬性產生所述正訓練樣本; 第二提取子模組,被配置為從所述第二設備對應的遠端登錄日誌提取所述第二預設特徵屬性,根據所述第二預設特徵屬性產生所述負訓練樣本。 該可選的實現方式中,在確定了第一設備(也即目標設備)和第二設備(非目標設備)後,第一提取子模組和第二提取子模組還可以從第一設備和第二設備對應的遠端登錄日誌提取第一預設特徵屬性和第二預設特徵屬性,進而產生正訓練樣本和負訓練樣本。無論是正訓練樣本還是負訓練樣本,都包括兩部分:特徵部分和結果標註部分;特徵部分包括能夠表徵該設備是否為目標設備的特徵,也即前面提到的第一預設特徵屬性和第二預設特徵屬性,而結果標註部分用於標註該特徵部分對應的是目標設備的特徵還是非目標設備的特徵。在第一預設特徵屬性和第二預設特徵屬性至少要包括第一設備和第二設備在歷史時間段內登錄其他設備的次數和登錄其他不同設備的個數,除了這兩個預設特徵屬性之外,還可以包括其他特徵屬性。 在本實施例的一個可選實現方式中,所述第一預設特徵屬性至少包括所述第一設備遠端登錄其他設備的次數和/或個數;和/或,所述第二預設特徵屬性至少包括所述第二設備遠端登錄其他設備的次數和/或個數。 在本實施例的一個可選實現方式中,針對所述第一設備對應的每條所述遠端登錄日誌,所述第一預設特徵屬性還包括以下至少一項: 所述第一設備遠端登錄其他設備時是否使用密鑰登錄; 所述第一設備以何種用戶身份遠端登錄其他設備; 所述第一設備是否登錄成功; 和/或,針對所述第一設備對應的每條所述遠端登錄日誌,所述第二預設特徵屬性還包括以下至少一項: 所述第二設備遠端登錄其他設備時是否使用密鑰登錄; 所述第二設備以何種用戶身份遠端登錄其他設備; 所述第二設備是否登錄成功。 該可選的實現方式中,第一設備對應的第一預設特徵屬性除了所述第一設備遠端登錄其他設備的次數和/或個數之外,還包括第一設備登錄其他設備時的登錄方式、登錄結果以及登錄所使用的用戶身份。登錄方式可以包括是否使用密鑰登錄,用戶身份可以包括系統用戶、根用戶和普通用戶。通常情況下,目標設備會採用密鑰登錄其他設備,且目標設備通常都會以根用戶的身份登錄其他設備,以便能夠以最大權利來管控其他設備。使用其他預設特徵屬性進行訓練,可以使得設備預測模型的預測準確率進一步提高。 該設備預測模型的訓練裝置的一些相關細節還可以參考上述對目標設備的預測裝置中的描述,在此不再贅述。 圖8是適於用來實現根據本案實施方式的目標設備的預測方法的電子設備的結構示意圖。 如圖8所示,電子設備800包括中央處理單元(CPU) 801,其可以根據儲存在唯讀記憶體(ROM)802中的程式或者從儲存部分808加載到隨機存取記憶體(RAM)803中的程式而執行上述圖1所示的實施方式中的各種處理。在RAM803中,還儲存有電子設備800操作所需的各種程式和資料。CPU801、ROM802以及RAM803透過匯流排804彼此相連。輸入/輸出(I/O)介面805也連接至匯流排804。 以下部件連接至I/O介面805:包括鍵盤、滑鼠等的輸入部分806;包括諸如陰極射線管(CRT)、液晶顯示器(LCD)等以及揚聲器等的輸出部分807;包括硬碟等的儲存部分808;以及包括諸如LAN卡、數據機等的網路介面卡的通信部分809。通信部分809經由諸如網際網路的網路執行通信處理。驅動器810也根據需要連接至I/O介面805。可移除媒體811,諸如磁碟、光碟、磁光碟、半導體記憶體等等,根據需要安裝在驅動器810上,以便於從其上讀出的電腦程式根據需要被安裝入儲存部分808。 特別地,根據本案的實施方式,上文參考圖1描述的方法可以被實現為電腦軟體程式。例如,本案的實施方式包括一種電腦程式產品,其包括有形地包含在及其可讀媒體上的電腦程式,所述電腦程式包含用於執行圖1的方法的程式碼。在這樣的實施方式中,該電腦程式可以透過通信部分809從網路上被下載和安裝,和/或從可拆卸媒體811被安裝。 圖8示出的上述電子設備同樣適用於實現根據本案另一實施方式的設備預測模型的訓練方法。 附圖中的流程圖和方塊圖,圖示了按照本案各種實施方式的系統、方法和電腦程式產品的可能實現的體系架構、功能和操作。在這點上,路程圖或方塊圖中的每個方塊可以代表一個模組、程式段或碼的一部分,所述模組、程式段或碼的一部分包含一個或多個用於實現規定的邏輯功能的可執行指令。也應當注意,在有些作為替換的實現中,方塊中所標註的功能也可以以不同於附圖中所標註的順序發生。例如,兩個接連地表示的方塊實際上可以基本並行地執行,它們有時也可以按相反的順序執行,這依所涉及的功能而定。也要注意的是,方塊圖和/或流程圖中的每個方塊、以及方塊圖和/或流程圖中的方塊的組合,可以用執行規定的功能或操作的專用的基於硬體的系統來實現,或者可以用專用硬體與電腦指令的組合來實現。 描述於本案實施方式中所涉及到的單元或模組可以透過軟體的方式實現,也可以透過硬體的方式來實現。所描述的單元或模組也可以設置在處理器中,這些單元或模組的名稱在某種情況下並不構成對該單元或模組本身的限定。 作為另一態樣,本案還提供了一種電腦可讀儲存媒體,該電腦可讀儲存媒體可以是上述實施方式中所述裝置中所包含的電腦可讀儲存媒體;也可以是單獨存在,未裝配入設備中的電腦可讀儲存媒體。電腦可讀儲存媒體儲存有一個或者一個以上程式,所述程式被一個或者一個以上的處理器用來執行描述於本案的方法。 以上描述僅為本案的較佳實施例以及對所運用技術原理的說明。本領域技術人員應當理解,本案中所涉及的發明範圍,並不限於上述技術特徵的特定組合而成的技術方案,同時也應涵蓋在不脫離所述發明構思的情況下,由上述技術特徵或其等同特徵進行任意組合而形成的其它技術方案。例如上述特徵與本案中公開的(但不限於)具有類似功能的技術特徵進行互相替換而形成的技術方案。
S101‧‧‧步驟 S102‧‧‧步驟 S103‧‧‧步驟 S201‧‧‧步驟 S202‧‧‧步驟 S301‧‧‧步驟 S302‧‧‧步驟 S303‧‧‧步驟 S401‧‧‧步驟 S402‧‧‧步驟 S403‧‧‧步驟 S404‧‧‧步驟 S501‧‧‧步驟 S502‧‧‧步驟 601‧‧‧第一獲取模組 602‧‧‧提取模組 603‧‧‧預測模組 701‧‧‧第三獲取模組 702‧‧‧第一確定模組 703‧‧‧產生模組 704‧‧‧第二訓練模組 800‧‧‧電子設備 801‧‧‧中央處理單元 802‧‧‧唯讀記憶體 803‧‧‧隨機存取記憶體 804‧‧‧匯流排 805‧‧‧I/O介面 806‧‧‧輸入部分 807‧‧‧輸出部分 808‧‧‧儲存部分 809‧‧‧通信部分 810‧‧‧驅動器 811‧‧‧可移除媒體
結合附圖,透過以下非限制性實施方式的詳細描述,本案的其它特徵、目的和優點將變得更加明顯。在附圖中: 圖1示出根據本案一實施方式的目標設備的預測方法的流程圖; 圖2示出根據本案一實施方式的目標設備的預測方法中設備預測模型訓練部分的流程圖; 圖3示出根據圖2所示實施方式的步驟S201的流程圖; 圖4示出根據本案一實施方式的設備預測模型的訓練方法的流程圖; 圖5示出根據圖4所示實施方式的步驟S403的流程圖; 圖6示出根據本案一實施方式的目標設備的預測裝置的結構方塊圖; 圖7示出根據本案一實施方式的設備預測模型的訓練裝置的結構方塊圖; 圖8是適於用來實現根據本案一實施方式的目標設備的預測方法的電子設備的結構示意圖。

Claims (20)

  1. 一種目標設備的預測方法,其特徵在於,包括: 獲取網路拓撲結構下預設設備在預定時間段內產生的遠端登錄日誌; 從所述遠端登錄日誌中提取預設特徵屬性; 利用預先訓練好的設備預測模型對所述預設特徵屬性進行處理,並預測所述預設設備是否為所述網路拓撲結構下的目標設備;其中,所述目標設備被用於管控所述網路拓撲結構下的多個設備。
  2. 根據申請專利範圍第1項所述的目標設備的預測方法,其中,所述預設特徵屬性包括所述預設設備在所述預定時間段內遠端登錄所述網路拓撲結構下其他設備的次數和/或個數。
  3. 根據申請專利範圍第2項所述的目標設備的預測方法,其中,針對每條所述遠端登錄日誌,所述預設特徵屬性還包括以下至少一項: 所述預設設備遠端登錄其他設備時是否使用密鑰登錄; 所述預設設備以何種用戶身份遠端登錄其他設備; 所述預設設備是否登錄成功。
  4. 根據申請專利範圍第1項所述的目標設備的預測方法,其中,所述方法還包括: 獲取多個訓練樣本;其中,所述訓練樣本包括特徵部分和結果標註部分,所述特徵部分包括所述預設特徵屬性,所述結果標註部分用於標註所述訓練樣本為正訓練樣本還是負訓練樣本; 利用多個所述訓練樣本對人工智慧模型進行訓練,得到所述設備預測模型。
  5. 根據申請專利範圍第4項所述的目標設備的預測方法,其中,所述獲取多個訓練樣本包括: 獲取所述網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌; 從所述遠端登錄日誌確定所述多個設備登錄其他設備的次數和/或個數; 從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本。
  6. 一種設備預測模型的訓練方法,其特徵在於,包括: 獲取網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌; 從所述遠端登錄日誌確定所述多個設備登錄其他設備的次數和/或個數; 從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本; 利用所述正訓練樣本和負訓練樣本對人工智慧模型進行訓練,得到設備預測模型。
  7. 根據申請專利範圍第6項所述的設備預測模型的訓練方法,其中,從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本,包括: 從所述第一設備對應的遠端登錄日誌提取第一預設特徵屬性,根據所述第一預設特徵屬性產生所述正訓練樣本; 從所述第二設備對應的遠端登錄日誌提取所述第二預設特徵屬性,根據所述第二預設特徵屬性產生所述負訓練樣本。
  8. 根據申請專利範圍第7項所述的設備預測模型的訓練方法,其中,所述第一預設特徵屬性至少包括所述第一設備遠端登錄其他設備的次數和/或個數;和/或,所述第二預設特徵屬性至少包括所述第二設備遠端登錄其他設備的次數和/或個數。
  9. 根據申請專利範圍第8項所述的設備預測模型的訓練方法,其中,針對所述第一設備對應的每條所述遠端登錄日誌,所述第一預設特徵屬性還包括以下至少一項: 所述第一設備遠端登錄其他設備時是否使用密鑰登錄; 所述第一設備以何種用戶身份遠端登錄其他設備; 所述第一設備是否登錄成功; 和/或,針對所述第一設備對應的每條所述遠端登錄日誌,所述第二預設特徵屬性還包括以下至少一項: 所述第二設備遠端登錄其他設備時是否使用密鑰登錄; 所述第二設備以何種用戶身份遠端登錄其他設備; 所述第二設備是否登錄成功。
  10. 一種目標設備的預測裝置,其特徵在於,包括: 第一獲取模組,被配置為獲取網路拓撲結構下預設設備在預定時間段內產生的遠端登錄日誌; 提取模組,被配置為從所述遠端登錄日誌中提取預設特徵屬性; 預測模組,被配置為利用預先訓練好的設備預測模型對所述預設特徵屬性進行處理,並預測所述預設設備是否為所述網路拓撲結構下的目標設備;其中,所述目標設備被用於管控所述網路拓撲結構下的多個設備。
  11. 根據申請專利範圍第10項所述的目標設備的預測裝置,其中,所述預設特徵屬性包括所述預設設備在所述預定時間段內遠端登錄所述網路拓撲結構下其他設備的次數和/或個數。
  12. 根據申請專利範圍第11項所述的目標設備的預測裝置,其中,針對每條所述遠端登錄日誌,所述預設特徵屬性還包括以下至少一項: 所述預設設備遠端登錄其他設備時是否使用密鑰登錄; 所述預設設備以何種用戶身份遠端登錄其他設備; 所述預設設備是否登錄成功。
  13. 根據申請專利範圍第10項所述的目標設備的預測裝置,其中,所述裝置還包括: 第二獲取模組,被配置為獲取多個訓練樣本;其中,所述訓練樣本包括特徵部分和結果標註部分,所述特徵部分包括所述預設特徵屬性,所述結果標註部分用於標註所述訓練樣本為正訓練樣本還是負訓練樣本; 第一訓練模組,被配置為利用多個所述訓練樣本對人工智慧模型進行訓練,得到所述設備預測模型。
  14. 根據申請專利範圍第13項所述的目標設備的預測裝置,其中,所述第二獲取模組,包括: 第一獲取子模組,被配置為獲取所述網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌; 第一確定子模組,被配置為從所述遠端登錄日誌確定所述多個設備登錄其他設備的次數和/或個數; 產生子模組,被配置為從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本。
  15. 一種設備預測模型的訓練裝置,其特徵在於,包括: 第三獲取模組,被配置為獲取網路拓撲結構下多個設備在歷史時間段內產生的遠端登錄日誌; 第一確定模組,被配置為從所述遠端登錄日誌確定所述多個設備登錄其他設備的次數和/或個數; 產生模組,被配置為從所述次數和/或個數滿足預設條件的第一設備對應的遠端登錄日誌,產生正訓練樣本,從所述次數和/或個數不滿足所述預設條件的第二設備對應的遠端登錄日誌產生負訓練樣本; 第二訓練模組,被配置為利用所述正訓練樣本和負訓練樣本對人工智慧模型進行訓練,得到設備預測模型。
  16. 根據申請專利範圍第15項所述的設備預測模型的訓練裝置,其中,所述產生模組,包括: 第一提取子模組,被配置為從所述第一設備對應的遠端登錄日誌提取第一預設特徵屬性,根據所述第一預設特徵屬性產生所述正訓練樣本; 第二提取子模組,被配置為從所述第二設備對應的遠端登錄日誌提取所述第二預設特徵屬性,根據所述第二預設特徵屬性產生所述負訓練樣本。
  17. 根據申請專利範圍第16項所述的設備預測模型的訓練裝置,其中,所述第一預設特徵屬性至少包括所述第一設備遠端登錄其他設備的次數和/或個數;和/或,所述第二預設特徵屬性至少包括所述第二設備遠端登錄其他設備的次數和/或個數。
  18. 根據申請專利範圍第17項所述的設備預測模型的訓練裝置,其中,針對所述第一設備對應的每條所述遠端登錄日誌,所述第一預設特徵屬性還包括以下至少一項: 所述第一設備遠端登錄其他設備時是否使用密鑰登錄; 所述第一設備以何種用戶身份遠端登錄其他設備; 所述第一設備是否登錄成功; 和/或,針對所述第一設備對應的每條所述遠端登錄日誌,所述第二預設特徵屬性還包括以下至少一項: 所述第二設備遠端登錄其他設備時是否使用密鑰登錄; 所述第二設備以何種用戶身份遠端登錄其他設備; 所述第二設備是否登錄成功。
  19. 一種電子設備,其特徵在於,包括記憶體和處理器;其中, 所述記憶體用於儲存一條或多條電腦指令,其中,所述一條或多條電腦指令被所述處理器執行以實現申請專利範圍第1-9項中任一項所述的方法步驟。
  20. 一種電腦可讀儲存媒體,其上儲存有電腦指令,其特徵在於,該電腦指令被處理器執行時實現申請專利範圍第1-9項中任一項所述的方法步驟。
TW108120240A 2018-08-14 2019-06-12 目標設備的預測方法、裝置、電子設備及儲存媒體 TWI706646B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810924481.3A CN109218077A (zh) 2018-08-14 2018-08-14 目标设备的预测方法、装置、电子设备及存储介质
CN201810924481.3 2018-08-14

Publications (2)

Publication Number Publication Date
TW202010292A true TW202010292A (zh) 2020-03-01
TWI706646B TWI706646B (zh) 2020-10-01

Family

ID=64988653

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108120240A TWI706646B (zh) 2018-08-14 2019-06-12 目標設備的預測方法、裝置、電子設備及儲存媒體

Country Status (3)

Country Link
CN (1) CN109218077A (zh)
TW (1) TWI706646B (zh)
WO (1) WO2020034756A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109218077A (zh) * 2018-08-14 2019-01-15 阿里巴巴集团控股有限公司 目标设备的预测方法、装置、电子设备及存储介质
CN110753039B (zh) * 2019-09-29 2022-04-22 苏州浪潮智能科技有限公司 一种远程登录安全防护的方法及装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201110614A (en) * 2009-09-04 2011-03-16 Chunghwa Telecom Co Ltd Broadband network information service topology analysis method
CN101694652B (zh) * 2009-09-30 2012-11-28 西安交通大学 一种基于极速神经网络的网络资源个性化推荐方法
CN102263790A (zh) * 2011-07-18 2011-11-30 华北电力大学 一种基于集成学习的入侵检测方法
CN103077347B (zh) * 2012-12-21 2015-11-04 中国电力科学研究院 一种基于改进核心向量机数据融合的复合式入侵检测方法
US9553772B2 (en) * 2013-02-05 2017-01-24 Cisco Technology, Inc. Dynamically determining node locations to apply learning machine based network performance improvement
TW201703474A (zh) * 2015-07-14 2017-01-16 Chunghwa Telecom Co Ltd 用於內容傳遞網路之智慧重導向系統及其方法
CN105119750B (zh) * 2015-09-08 2019-04-19 南京联成科技发展股份有限公司 一种基于大数据的分布式信息安全运维管理平台系统
CN105450442B (zh) * 2015-11-06 2019-02-15 广东电网有限责任公司电力科学研究院 一种网络拓扑排查方法及其系统
CN105227383B (zh) * 2015-11-06 2018-07-03 广东电网有限责任公司电力科学研究院 一种网络拓扑排查的装置
US10949765B2 (en) * 2016-09-15 2021-03-16 Accenture Global Solutions Limited Automated inference of evidence from log information
CN206332681U (zh) * 2016-11-24 2017-07-14 国网新疆电力公司信息通信公司 便携式pda网络告警采集器
TW201822521A (zh) * 2016-12-02 2018-06-16 台灣大哥大股份有限公司 電信網路因應行動裝置應用程式之優化系統與方法
CN106778259B (zh) * 2016-12-28 2020-01-10 北京明朝万达科技股份有限公司 一种基于大数据机器学习的异常行为发现方法及系统
CN107800683A (zh) * 2017-09-08 2018-03-13 微梦创科网络科技(中国)有限公司 一种挖掘恶意ip的方法及装置
CN107819631B (zh) * 2017-11-23 2021-03-02 东软集团股份有限公司 一种设备异常检测方法、装置及设备
CN108306760A (zh) * 2017-12-28 2018-07-20 中国银联股份有限公司 用于在分布式系统中使管理能力自恢复的方法和装置
CN109218077A (zh) * 2018-08-14 2019-01-15 阿里巴巴集团控股有限公司 目标设备的预测方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
WO2020034756A1 (zh) 2020-02-20
CN109218077A (zh) 2019-01-15
TWI706646B (zh) 2020-10-01

Similar Documents

Publication Publication Date Title
CN106992994B (zh) 一种云服务的自动化监控方法和系统
US11888883B2 (en) Threat disposition analysis and modeling using supervised machine learning
US10592666B2 (en) Detecting anomalous entities
WO2018103595A1 (zh) 一种授权策略推荐方法及装置、服务器、存储介质
Lou et al. Mining dependency in distributed systems through unstructured logs analysis
WO2015180291A1 (zh) 监控服务器集群的方法和系统
TWI706646B (zh) 目標設備的預測方法、裝置、電子設備及儲存媒體
Zonouz et al. Cyber-physical security metric inference in smart grid critical infrastructures based on system administrators' responsive behavior
US20210035025A1 (en) Systems and methods for optimizing machine learning models by summarizing list characteristics based on multi-dimensional feature vectors
Krasov et al. Behavioral analysis of resource allocation systems in cloud infrastructure
Unuvar et al. Selecting optimum cloud availability zones by learning user satisfaction levels
CN109634802A (zh) 进程监控方法及终端设备
Zhang et al. Unsupervised IoT fingerprinting method via variational auto-encoder and K-means
Miranda et al. On the flow of software security advisories
Voutyras et al. Achieving autonomicity in IoT systems via situational-aware, cognitive and social things
CN115883392B (zh) 算力网络的数据感知方法、装置、电子设备及存储介质
Lee et al. Detecting anomaly teletraffic using stochastic self-similarity based on Hadoop
Shih et al. Implementation and visualization of a netflow log data lake system for cyberattack detection using distributed deep learning
US11765189B2 (en) Building and maintaining cyber security threat detection models
CN115480843A (zh) 业务处理方法、装置、电子设备及非易失性存储介质
KR20200063343A (ko) Trvn 인프라구조의 운용 관리 장치 및 방법
US11012463B2 (en) Predicting condition of a host for cybersecurity applications
CN109412861B (zh) 一种终端网络建立安全关联展示方法
CN115168828A (zh) 账号的安全登录方法、装置和电子设备
US11308403B1 (en) Automatic identification of critical network assets of a private computer network