JP2021520019A

JP2021520019A - ドメイン名の識別

Info

Publication number: JP2021520019A
Application number: JP2021510515A
Authority: JP
Inventors: 成傑顧
Original assignee: New H3C Security Technologies Co Ltd
Current assignee: New H3C Security Technologies Co Ltd
Priority date: 2018-05-21
Filing date: 2019-05-15
Publication date: 2021-08-12
Anticipated expiration: 2039-05-15
Also published as: EP3799398A1; CN109889616A; WO2019223587A1; WO2019223587A9; US20210097399A1; CN109889616B; JP7069410B2; EP3799398A4

Abstract

ドメイン名の識別方法及びネットワーク装置を提供する。前記方法は、端末から送信されたドメイン名解析リクェストを受信し、ドメイン名解析リクェストに識別対象のドメイン名を含み、ドメイン名に少なくとも１つの文字を含むことと、ドメイン名に対応するシーケンス行列を特定し、シーケンス行列が少なくとも１つの文字ベクトルを含み、少なくとも１つの文字ベクトルの夫々と少なくとも１つの文字の夫々とが一対一対応することと、少なくとも１つの文字ベクトルの夫々を入出力ゲートに順次入力し、入力送信ゲートが複数の活性化関数間の論理演算規則を含むことと、複数の活性化関数間の論理演算規則により、少なくとも１つの文字ベクトルの夫々への論理演算処理を行って、シーケンス行列に対応する特徴ベクトルを得ることと、得られたシーケンス行列に対応する特徴ベクトルをドメイン名分類モデルに入力し、ドメイン名が正当なドメイン名であるか否かを特定することと、を含む。【選択図】図１

Description

関連出願の相互参照

本開示は、２０１８年５月２１日に中国特許庁に提出した、出願番号が２０１８１０４８９７０９．０であり、発明の名称が「ドメイン名を識別する方法及び装置」である中国特許出願に基づき優先権を主張する。ここで、その内容の全ては、援用により本開示に組み込まれる。

現在、端末は、ネットワークにアクセスする際に、ドメイン名システム（ＤｏｍａｉｎＮａｍｅＳｙｓｔｅｍ、ＤＮＳと略称する）サーバにより、宛先端末のインターネットプロトコル（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ、ＩＰと略称する）アドレスを取得することができる。そして、端末は、宛先端末のＩＰアドレスにより、宛先端末との通信リンクを確立し、さらに、宛先端末と相互にデータ交換を行う。実際のネットワーク構築では、端末がウィルスプログラムに感染される場合があるため、感染された端末が、違法者によって設置された悪意のある端末とデータ転送を行うことにより、ネットワークに大きなセキュリティリスクをもたらすおそれがある。

感染された端末と悪意のある端末との間のデータ転送を防止するために、ＤＮＳサーバは、端末から送信されたドメイン名解析リクェストを受信すると、ドメイン名解析リクェストに含まれたドメイン名を文字抽出する。文字と記憶された文字特徴ライブラリとを照合することにより、ドメイン名の正当性の判定を実現する。

図１は、本開示の実施例に係るドメイン名を識別する方法のフローチャートである。図２は、本開示の実施例に係るシーケンス行列を特定する方法のフローチャートである。図３は、本開示の実施例に係る特徴ベクトルを計算する方法のフローチャートである。図４は、本開示の実施例に係る入出力ゲートの論理構造図である。図５は、本開示の実施例に係るフィードバックゲートの論理構造図である。図６は、本開示の実施例に係るドメイン名特徴分析モデルおよびドメイン名分類モデルのトレーニング方法のフローチャートである。図７は、本開示の実施例に係るドメイン名を識別する装置の構造模式図である。図８は、本開示の実施例に係るネットワーク装置の構造模式図である。

以下、本開示の上記目的、特徴及び利点がより分かりやすいように、本開示の図面及び具体的な実施形態と組み合わせて、本開示をより詳しく説明する。本開示の実施例は、ドメイン名を識別する方法を提供し、当該方法は、ドメイン名解析機能を有するネットワーク装置に適用されることができる。例えば、ＤＮＳサーバに適用される。

ある端末（送信元装置とも呼ぶ）があるサーバ（宛先装置とも呼ぶ）にパケットを送信する必要がある場合、送信元装置は、まず、宛先装置のドメイン名を取得する。例えば、ユーザは、あるウェブサイトにアクセスしたい場合、まずそのウェブサイトのドメイン名を入力する。送信元装置は、ネットワーク装置に、宛先装置のドメイン名を含むドメイン名解析リクェストを送信する。ネットワーク装置は、予め記憶されたドメイン名とＩＰアドレスとの対応関係によって、当該ドメイン名に対応するＩＰアドレスを特定する。そして、ネットワーク装置は、当該ＩＰアドレスを送信元装置に送信する結果、送信元装置が当該ＩＰアドレスにより宛先装置にパケットを送信できる。

本開示の実施例において、ネットワーク装置は、ドメイン名特徴分析モデル及びドメイン名分類モデルを既に構築している。そのうち、ドメイン名特徴分析モデルに、入出力ゲートを含む。ネットワーク装置は、端末から送信されたドメイン名解析リクェストを受信すると、ドメイン名特徴分析モデルとドメイン名分類モデルとにより、当該ドメイン名解析リクェストに含まれるドメイン名が正当なドメイン名であるか否かを識別する。

ドメイン名が不正なドメイン名である場合、ネットワーク装置は、送信元装置が悪意のある端末にデータパケットを送信することを回避するように、当該端末に応答メッセージを送信しない。ドメイン名が正当なドメイン名である場合、ネットワーク装置は、当該ドメイン名に対応するＩＰアドレスを含む応答メッセージを、当該端末に送信する結果、当該端末が当該ＩＰアドレスに対応する端末にアクセスする。

本公開の実施例に係るドメイン名の識別方法により、ドメイン名の識別精度を向上させることができ、ユーザデータの安全性を向上させることができる。図１に示すように、この方法における処理手順は以下のステップを備える。

ステップ１０１では、ネットワーク装置は、端末から送信されたドメイン名解析リクェストを受信する。

ここで、ドメイン名解析リクェストに、識別対象のドメイン名を含み、このドメイン名に少なくとも１つの文字を含む。

本開示の実施例では、送信元装置（すなわち、端末）は、宛先装置にパケットを送信する必要がある場合、まず当該ネットワーク装置に、ドメイン名解析リクェストを送信する。ドメイン名解析リクェストに、宛先装置のドメイン名（すなわち、識別対象のドメイン名）を含んでいる。ネットワーク装置は、当該ドメイン名解析リクェストを受信すると、当該ドメイン名解析リクェストを解析し、識別対象のドメイン名を取得する。

ここで、宛先装置は、ドメイン名を有するネットワーク装置であり、ホスト、サーバ、または仮想マシンなどであってもいい。

ステップ１０２では、ネットワーク装置は、ドメイン名に対応するシーケンス行列を特定する。

本開示の実施例において、ネットワーク装置は、識別対象のドメイン名を取得すると、当該ドメイン名に対応するシーケンス行列を計算する。シーケンス行列は、少なくとも１つの文字ベクトルを含む。ここで、少なくとも１つの文字ベクトルの夫々と、少なくとも１つの文字の夫々とは、一対一対応する。シーケンス行列の計算方法については、後で詳しく説明する。

ステップ１０３では、ネットワーク装置は、少なくとも１つの文字ベクトルの夫々を入出力ゲートに順次入力する。

本開示の実施例において、ドメイン名特徴分析モデルに、入出力ゲートを含む。ここで、入出力ゲートは、複数の活性化関数間の論理演算規則を含む。活性化関数はｔａｎｈ活性化関数を採用することができる。ネットワーク装置は、シーケンス行列を特定した後、シーケンス行列に含まれる各文字ベクトルを、入出力ゲートに順次入力する。ｔａｎｈ活性化関数の数式は、以下の通りである。

ここで、ｅは自然対数の底である。

ネットワーク装置は、前記シーケンス行列における各文字ベクトルを入出力ゲートに順次入力し、当該シーケンス行列に対応する特徴ベクトルを計算する。

ステップ１０４では、ネットワーク装置は、複数の活性化関数間の論理演算規則により、少なくとも１つの文字ベクトルの夫々への論理演算処理を行って、シーケンス行列に対応する特徴ベクトルを得る。

本開示の実施例において、入出力ゲートに入力された文字ベクトルの夫々について、ネットワーク装置は、上記複数の活性化関数間の論理演算規則により、入出力ゲートに現在入力された文字ベクトルに対し、それぞれ論理演算処理を行って、シーケンス行列に対応する特徴ベクトルを得る。ここで、論理演算処理には、算術演算と論理演算を含む。入出力ゲートによる文字ベクトルへの論理演算処理の具体的な処理手順については、後で詳しく説明する。

ステップ１０５では、ネットワーク装置は、シーケンス行列に対応する特徴ベクトルをドメイン名分類モデルに入力し、ドメイン名が正当なドメイン名であるか否かを特定する。

本開示の実施例において、ドメイン名分類モデルは、ニューロンの数が１である全結合層（Full Connection layer）であってよい。ネットワーク装置は、シーケンス行列に対応する特徴ベクトルを、ドメイン名分類モデルに入力し、ドメイン名分類モデルは、当該特徴ベクトルに対応する分類結果を出力し、当該分類結果は、当該ドメイン名が不正なドメイン名である確率を示すためのものである。ネットワーク装置は、この分類結果に基づいて、当該ドメイン名が正当なドメイン名であるか否かを特定する。

例えば、正当なドメイン名に対応する分類結果は０であり、不正なドメイン名に対応する分類結果は１であり、予め設定されたしきい値は０．６である。当該ドメイン名に対応する分類結果が０．８＞０．６である場合、ネットワーク装置は、当該ドメイン名が不正なドメイン名であると特定したが、当該ドメイン名に対応する分類結果が０．２＜０．６の場合、ネットワーク装置は、当該ドメイン名が正当なドメイン名であると特定した。

本開示の実施例において、ネットワーク装置は、端末から送信されたドメイン名解析リクェストを受信する。当該ドメイン名解析リクェストに、識別対象のドメイン名を含み、ドメイン名に少なくとも１つの文字を含む。ネットワーク装置は、ドメイン名に対応するシーケンス行列を特定する。ここで、シーケンス行列は、少なくとも１つの文字ベクトルを含み、少なくとも１つの文字ベクトルの夫々と少なくとも１つの文字の夫々とは、一対一対応する。

ネットワーク装置は、少なくとも１つの文字ベクトルの夫々を、入出力ゲートに順次入力する。入出力ゲートは、複数の活性化関数間の論理演算規則を含む。ネットワーク装置は、複数の活性化関数間の論理演算規則により、少なくとも１つの文字ベクトルの夫々への論理演算処理を行って、シーケンス行列に対応する特徴ベクトルを得る。ネットワーク装置は、シーケンス行列に対応する特徴ベクトルをドメイン名分類モデルに入力し、ドメイン名が正当なドメイン名であるか否かを特定する。

本発明によれば、当業者が文字特徴ライブラリを設定する必要がなく、ドメイン名の識別精度を向上させることができる。

一例において、ネットワーク装置は、ドメイン名が正当なドメイン名であると特定した場合、ドメイン名に対応するＩＰアドレスを含む応答メッセージを、端末に送信する。

本公開の実施例において、ネットワーク装置は、ドメイン名が正当なドメイン名である場合、予め記憶されたドメイン名とＩＰアドレスとの対応関係によって、当該ドメイン名に対応するＩＰアドレスを特定する。さらに、ネットワーク装置は、特定されたＩＰアドレスを当該端末に送信する結果、当該端末が当該ＩＰアドレスによりパケットを宛先装置に送信する。ネットワーク装置は、ドメイン名が不正なドメイン名である場合、端末に応答メッセージを送信しない。あるいは、ネットワーク装置は、当該端末によってリクェストされたドメイン名が不正なドメイン名であることを示すためのプロンプト情報を当該端末に送信する。

本開示の実施例に係るドメイン名を識別する方法では、ネットワーク装置は、端末から送信されたドメイン名解析リクェストを受信し、当該ドメイン名解析リクェストには識別対象のドメイン名を含み、ドメイン名には少なくとも１つの文字を含む。ネットワーク装置は、ドメイン名に対応するシーケンス行列を特定する。ここで、シーケンス行列は、少なくとも１つの文字ベクトルを含み、少なくとも１つの文字ベクトルの夫々と少なくとも１つの文字の夫々とは、一対一対応する。

そして、ネットワーク装置は、少なくとも１つの文字ベクトルの夫々を、入出力ゲートに順次入力する。入出力ゲートは、複数の活性化関数間の論理演算規則を含む。ネットワーク装置は、複数の活性化関数間の論理演算規則により、少なくとも１つの文字ベクトルのそれぞれへの論理演算処理を行って、シーケンス行列に対応する特徴ベクトルを得る。

ネットワーク装置は、シーケンス行列に対応する特徴ベクトルを、ドメイン名分類モデルに入力し、ドメイン名が正当なドメイン名であるか否かを特定する。

本開示の実施例によれば、当業者が文字特徴ライブラリを設定する必要がなく、ドメイン名の識別精度を向上させることができる。

本開示の実施例は、ドメイン名に対応するシーケンス行列を特定する方法をさらに提供する。図２に示すように、当該方法における具体的な処理手順は、以下のステップを含む。

ステップ２０１では、ネットワーク装置は、ドメイン名から有効な文字を取得し、当該有効な文字は、ドメイン名うち記憶されたプレフィックス文字及び記憶されたサフィックス文字以外の文字で構成される。

本開示の実施例において、ネットワーク装置は、ドメイン名において一般使用されるプレフィックス文字及びサフィックス文字を記憶する。ここで、プレフィックス文字は、例えばｗｗｗ．や、「ｆｔｐ．」や、「ｓｍｔｐ．」などのネットワーク名である。サフィックス文字は、例えば、「．ｃｏｍ」や、「．ｎｅｔ」や、「．ｅｄｕ」や、「．ｇｏｖ」などのトップレベルドメイン名である。ネットワーク装置は、ドメイン名に含まれるプレフィックス文字及びサフィックス文字を識別し、その後にプレフィックス文字及びサフィックス文字以外の文字を抽出する。抽出されたた文字は有効な文字である。例えば、ドメイン名がｗｗｗ．ｇｏｏｇｌｅ．ｃｏｍである場合、ｗｗｗ．及び．ｃｏｍ以外の文字列を抽出して、ｇｏｏｇｌｅを取得する。

ステップ２０２では、ネットワーク装置は、記憶された文字とインデックス値とのマッピング規則によって、有効な文字の夫々に対応するインデックス値を特定し、有効な文字に対応する第１のインデックスシーケンスを得る。

本開示の実施例では、ネットワーク装置に、ドメイン名に現れる可能性のある文字を記憶し、各文字にインデックス値を割り当てることによって、文字とインデックス値との間のマッピング規則を生成する。

一可能な実施形態では、ネットワーク装置に、ドメイン名に現れる可能性のある文字を記憶しており、そして、１から順番に各文字に番号を付ける。各文字に対応する番号は、各文字に対応するインデックス値である。例えば、現れる文字がａ、ｂ、ｃ、ｄである。ネットワーク装置は、ａに対応する番号が１であり、ｂに対応する番号が２であり、ｃに対応する番号が３であり、ｄに対応する番号が４であることを特定する。このとき、ａのインデックス値は１であり、ｂのインデックス値は２であり、ｃのインデックス値は３であり、ｄのインデックス値は４である。表１を参照すると、本開示の実施例に提供される文字とインデックス値とのマッピング規則の例が示されている。

ネットワーク装置は、有効な文字を取得した後、記憶された文字とインデックス値とのマッピング規則により、有効な文字の夫々に対応するインデックス値を特定し、有効な文字に対応する第１のインデックスシーケンスを得る。例えば、ドメイン名はｗｗｗ．ｇｏｏｇｌｅ．ｃｏｍであり、有効な文字はｇｏｏｇｌｅである場合、表１に示された文字とインデックス値とのマッピング規則に基づいて、第１のインデックスシーケンスは１、２、２、１、５、６である。

ステップ２０３では、第１のインデックスシーケンスが標準長さに達していない場合、ネットワーク装置は、第１のインデックスシーケンスを第２のインデックスシーケンスとして補充する。
ここで、第２のインデックスシーケンスは、標準長さを有する。

本公開の実施例では、ネットワーク装置は、有効な文字に対応する第１のインデックスシーケンスを得た後、第１のインデックスシーケンスが標準長さに達したか否かを判定する。ここで、標準長さは、当業者で経験に応じて設定でき、第１のインデックスシーケンスの長さの上限よりも大きい。例えば、標準長さは６０文字とすることができる。

第１のインデックスシーケンスが標準の長さに達していない場合、ネットワーク装置は、第１のインデックスシーケンスを第２のインデックスシーケンスとして補充し、ここで、第２のインデックスシーケンスは標準長さを有する。各有効な文字を標準長さのインデックスシーケンスで表すと、プログラミング処理がより容易になることが理解できる。

一可能な実施例において、ネットワーク装置は、予め設定された文字により第１のインデックスシーケンスを補充する。例えば、予め設定された文字は０である。ネットワーク装置は、第１のインデックスシーケンスの最初の文字の前に、予め設定されたの文字を補充してもよく、第１のインデックスシーケンスの最後の文字の後に、予め設定されたの文字を補充してもいい。

例えば、第１のインデックスシーケンスが１、２、２、１、５、６であり、標準長さが６０文字であるとすると、第２のインデックスシーケンスは１、２、２、１、５、６、０、０…、０であり、すなわち、文字６の後に５４個の０を補充した。

ステップ２０４では、ネットワーク装置は、第２のインデックスシーケンスの各インデックス値に対応する文字ベクトルを計算する。

本公開の実施例では、ネットワーク装置に埋め込み層（Ｅｍｂｅｄｄｉｎｇｌａｙｅｒ）ニューラルネットワークを記憶している。埋め込み層ニューラルネットワークは、任意の文字を文字ベクトルに変換するために用いられる。ネットワーク装置は、第２のインデックスシーケンスを埋め込み層ニューラルネットワークに入力することで、第２のインデックスシーケンス中の各インデックス値に対応する文字ベクトルを計算することができる。ここで、算出された文字ベクトルは、１２８次元のベクトルであってよい。

埋め込み層ニューラルネットワークによる各文字に対応する文字ベクトルを計算する処理手順は、従来の技術であるため、本実施例ではその説明を省略する。埋め込み層ニューラルネットワークにより文字ベクトルを計算することで、文字間の類似性及び文脈間の関連性を効果的に学習することができる。

ステップ２０５では、ネットワーク装置は、第２のインデックスシーケンスの各インデックス値に対応する文字ベクトルにより、シーケンス行列を特定する。

本開示の実施例において、ネットワーク装置は、第２のインデックスシーケンスの各インデックス値に対応する文字ベクトルを計算し、その後、第２のインデックスシーケンスの各インデックス値に対応する文字ベクトルにより、シーケンス行列を特定する。

例えば、第２のインデックスシーケンスは、１、２、２、１、５、６、０、０…、０であるとする。ここで、第２のインデックスシーケンスの長さは６０文字であり、すなわち、文字６の後に５４個の０を補充している。ネットワーク装置は、第２のインデックスシーケンスを埋め込み層ニューラルネットワークに入力し、文字ベクトルａ_１、ａ_２、ａ_３…、ａ_６０を出力する。ここで、ａ_ｉは１２８次元のベクトルであり、すなわち、６０個の１２８次元の文字ベクトルが得られた。ネットワーク装置は、６０個の１２８次元の文字ベクトルを用いて、６０×１２８のシーケンス行列を特定する。

本公開の実施例において、ネットワーク装置は、ドメイン名識別問題を自然言語処理問題に変換し、各文字に対応するインデックス値を設定し、その後、インデックス値を文字ベクトル化により表すことで、プログラミングがより容易になる。

本開示の実施例において、シーケンス行列を特定する別の実現方式をさらに提供する。この実現方式では、ネットワーク装置は、有効な文字を抽出する処理を行わない。

具体的には、ネットワーク装置は、識別対象のドメイン名を取得した後、ドメイン名に含まれる各文字に対応するインデックス値を特定し、当該ドメイン名に対応するインデックスシーケンス（区別の便宜上、第３のインデックスシーケンスと呼ぶ）を得る。ネットワーク装置は、第３のインデックスシーケンスが標準長さに達したか否かを判断する。第３のインデックスシーケンスが標準長さに達していない場合、ネットワーク装置は、第３のインデックスシーケンスを、標準長さを有する第４のインデックスシーケンスとして補充する。そして、ネットワーク装置は、第４のインデックスシーケンスの各インデックス値に対応する文字ベクトルを算出する。さらに、ネットワーク装置は、第４のインデックスシーケンスの各インデックス値に対応する文字ベクトルを利用して、シーケンス行列を特定する。

本開示の実施例に提供された、ドメイン名に対応するシーケンス行列を特定する方法は、ネットワーク装置がまず識別機能を有する文字（有効な文字とも呼ばれる）をドメイン名から抽出し、次に、有効な文字によって、ドメイン名に対応するシーケンス行列を特定する方法であり、ドメイン名に含まれる全ての文字に対し計算する必要がなく、シーケンス行列を特定する効率を向上させる。

本開示の実施例は、特徴ベクトルを計算する方法をさらに提供し、図３に示すように、方法の具体的な処理手順は、以下のステップを含む。

ステップ３０１では、ネットワーク装置は、入出力ゲートに現在入力された第１の文字ベクトルと、入出力ゲートに前回入力された第２の文字ベクトルの出力値と、入出力ゲートに前回入力された第２の文字ベクトルのフィードバック値と、を取得する。

本公開の実施例では、ネットワーク装置は、シーケンス行列に含まれる各文字ベクトルを、入出力ゲートに順次入力する。説明の便宜上、入出力ゲートに現在入力された文字ベクトルを、第１の文字ベクトルと呼び、入出力ゲートに前回入力された文字ベクトルを、第２の文字ベクトルと呼ぶ。

ネットワーク装置は、第１の文字ベクトルと、第２の文字ベクトルの出力値と、第２の文字ベクトルのフィードバック値と、を取得する。ここで、最初に入出力ゲートに入力された文字ベクトルについて、入出力ゲートに前回入力された文字ベクトルの出力値と、入出力ゲートに前回入力された文字ベクトルのフィードバック値とは、いずれも０である。フィードバック値の計算方法については、後で詳しく説明する。

例えば、ネットワーク装置は、まず、文字ベクトルａ_１を入出力ゲートに入力し、ａ_１の出力値を出力し、かつ、文字ベクトルａ_１をフィードバックゲートに入力し、ａ_１のフィードバック値を出力する。そして、ネットワーク装置は、文字ベクトルａ_２を入出力ゲートに入力し、ａ_２の出力値を出力する。ネットワーク装置は、ａ_２と、ａ_１の出力値と、ａ_１のフィードバック値とを取得することで、以降の演算を行う。

ステップ３０２では、ネットワーク装置は、第１の文字ベクトルと、第２の文字ベクトルの出力値と、第２の文字ベクトルのフィードバック値とに対して第１の論理演算を行って、第１の文字ベクトルの出力値を得る。

本開示の実施例において、図４に示すように、本開示の実施例に係る入出力ゲートの論理構造図である。ネットワーク装置は、図４に示された入出力ゲートに基づいて、第１の文字ベクトルと、第２の文字ベクトルの出力値と、第２の文字ベクトルのフィードバック値とに対し、第１の論理演算を行って、第１の文字ベクトルの出力値を得る。具体的な計算処理手順は、以下のステップを含む。

第一ステップでは、ネットワーク装置は、第１の重み行列に基づいて、第１の文字ベクトルと第２の文字ベクトルのフィードバック値に対して第１の重み付け計算を行って、第１の重み付け結果を得る。

第二ステップでは、ネットワーク装置は、第２の重み行列に基づいて、第１の文字ベクトルと第２の文字ベクトルのフィードバック値に対して第２の重み付け計算を行って、第２の重み付け結果を得る。

ここで、第１の重み行列と第２の重み行列とは、同じであってもよく、異なっていてもよい。

第三ステップでは、ネットワーク装置は、第１の重み付け結果と第１のオフセットパラメータとを第１の活性化関数に入力し、第１の演算結果を得る。対応する計算式は、以下の通りである。

ここで、第１の活性化関数はｔａｎｈ活性化関数であり、ｈ_ｔ−１は入出力ゲートに前回入力された文字ベクトルのフィードバック値であり、ｘ_ｔは入出力ゲートに現在入力された文字ベクトルであり、ｗ_ｉは第１の重み行列であり、ｂ_ｉは第１のオフセットパラメータであり、ｉ_ｔは第１の演算結果である。

第四ステップでは、ネットワーク装置は、第２の重み付け結果と第２のオフセットパラメータとを第２の活性化関数に入力し、第２の演算結果を得る。対応する計算式は、以下の通りである。

ここで、第２の活性化関数はｔａｎｈ活性化関数であり、ｗ_ｃは第２の重み行列であり、ｂ_ｃは第２のオフセットパラメータであり、

は第２の演算結果であり、ｈ_ｔ−１及びｘ_ｔは数式２におけるｈ_ｔ−１及びｘ_ｔと同一である。

前記ｉ_ｔ及び

は、いずれも、第２の文字ベクトルのフィードバック値と第１の文字ベクトルとによって特定されたものであり、ｉ_ｔは、第２の文字ベクトルのフィードバック値と第１の文字ベクトルとによって特定される今回の計算による最終入力データを示し、

は第２の文字ベクトルのフィードバック値と第１の文字ベクトルとによって特定される今回の計算によるフィードバック値のうち保留すべきデータを示す。

一例では、第１のオフセットパラメータと第２のオフセットパラメータは、同じであってもよく、異なっていてもよい。

第五ステップでは、ネットワーク装置は、第１の演算結果と第２の演算結果とを乗算し、乗算結果と第２の文字ベクトルの出力値とを加算し、第１の文字ベクトルに対応する出力値を得る。対応する計算式は、以下の通りである。

ここで、Ｃ_ｔは第１の文字ベクトルに対応する出力値であり、Ｃ_ｔ−１は第２の文字ベクトルの出力値であり、ｉ_ｔは第１の演算結果であり、

は第２の演算結果である。

一例において、ネットワーク装置は、後続の論理演算処理を行うために、第１の文字ベクトルの出力値を記憶する。

ステップ３０３では、ネットワーク装置は、少なくとも１つの文字ベクトルの出力値によって、シーケンス行列に対応する特徴ベクトルを特定する。

本開示の実施例において、上記した処理に基づいて、ネットワーク装置は、いずれの文字ベクトルについても、その文字ベクトルを入出力ゲートに入力した後に、その文字ベクトルの出力値を得る。このようにして、ネットワーク装置は、シーケンス行列に含まれる各文字ベクトルの出力値を得ることができる。ネットワーク装置は、各文字ベクトルの出力値によって、シーケンス行列に対応する特徴ベクトルを特定する。

例えば、シーケンス行列は、ａ_１、ａ_２、ａ_３を含み、ここで、ａ_１の出力値がｘであり、ａ_２の出力値がｙであり、ａ_３の出力値がｚである場合、シーケンス行列に対応する特徴ベクトルは、（ｘ，ｙ，ｚ）である。

本公開の実施例において、既存のリカレントニューラルネットワークにおける入出力ゲートの論理演算を簡素化し、ネットワーク装置の処理量を低減し、ドメイン名の識別精度を向上させる。

さらに、本開示の実施例において、ドメイン名特徴分析モデルは、フィードバックゲートをさらに含む。ネットワーク装置は、入出力ゲートに現在入力された文字ベクトルの出力値を得た後、入出力ゲートに現在入力された文字ベクトルのフィードバック値をさらに計算する。

具体的な処理手順は以下のようである。ネットワーク装置は、第１の文字ベクトルの出力値と、第１の文字ベクトルと、第２の文字ベクトルのフィードバック値に対して、第２の論理演算を行って、第１の文字ベクトルのフィードバック値を得る。

ここで、当該フィードバック値は、ネットワーク装置が入出力ゲートに次回に入力された文字ベクトルの出力値を計算するためのものである。

本開示の実施例において、ネットワーク装置は、いずれの文字ベクトルに対し、その文字ベクトルをドメイン名特徴分析モデルの入出力ゲートに入力する。同時に、ネットワーク装置は、当該文字ベクトルをドメイン名特徴分析モデルのフィードバックゲートにも入力する。すなわち、入出力ゲートに現在入力された文字ベクトルと、フィードバックゲートに現在入力された文字ベクトルとは同一の文字ベクトルである。同様に、入出力ゲートに前回入力された文字ベクトルと、フィードバックゲートに前回入力された文字ベクトルとは、同一の文字ベクトルである。

フィードバックゲートに最初に入力された文字ベクトルについて、フィードバックゲートに前回入力された文字ベクトルのフィードバック値は０であることが理解できる。

図５に示すように、本開示の実施例に係るフィードバックゲートの論理構造図を示す。ネットワーク装置は、図５に示されるフィードバックゲートに基づいて、第１の文字ベクトルの出力値と、第１の文字ベクトルと、第２の文字ベクトルのフィードバック値に対して第２の論理演算を行って、フィードバックゲートに現在入力された文字ベクトルのフィードバック値を得る。具体的な計算処理手順は以下のステップを含む。

第一ステップでは、ネットワーク装置は、第３の重み行列に基づいて、第１の文字ベクトルと第２の文字ベクトルのフィードバック値に対して第３の重み付け計算を行い、第３の重み付け結果を得る。

第二ステップでは、ネットワーク装置は、第３の重み結果と第３のオフセットパラメータとを第３の活性化関数に入力し、第３の演算結果を得る。対応する計算式は、以下の通りである。

ここで、第３の活性化関数はｔａｎｈ活性化関数であり、ｈ_ｔ−１は第１の文字ベクトルのフィードバック値であり、ｘ_ｔは第１の文字ベクトルであり、ｗ_ｏは第３の重み行列であり、ｂ_ｏは第３のオフセットパラメータであり、Ｏ_ｔは第３の演算結果である。Ｏ_ｔは、第２の文字ベクトルと第１の文字ベクトルのフィードバック値から選択された、次の計算にフィードバックする必要があるデータと、今回の出力（即ちＣ_ｔ）に記憶する必要があるデータと、を表す。

第三ステップでは、ネットワーク装置は、第１の文字ベクトルの出力値を第４の活性化関数に入力し、第４の演算結果を得る。

第四ステップでは、ネットワーク装置は、第３の演算結果と第４の演算結果とを乗算して、第１の文字ベクトルのフィードバック値を得る。対応する計算式は、以下の通りである。

ここで、第４の活性化関数はｔａｎｈ活性化関数であり、Ｃ_ｔは第１の文字ベクトルの出力値であり、Ｏ_ｔは第３の演算結果であり、ｈ_ｔは第１の文字ベクトルのフィードバック値である。

一例において、ネットワーク装置は、後続の論理演算処理を行うために第１の文字ベクトルのフィードバック値を記憶する。

上記数式２において、ｗ_ｉ・［ｈ_ｔ−１，ｘ_ｔ］は、２つの数式の略式であり、ｗ_ｉ・［ｈ_ｔ−１，ｘ_ｔ］＝ｗ_１×ｈ_ｔ−１＋ｗ_２×ｘ_ｔである。本開示の実施例において、ネットワーク装置は、埋め込み層により各文字を１２８次元の文字ベクトルに変換し、これに対応して、ｈ_ｔ−１およびｘ_ｔは１２８次元のベクトルであり、ｂ_ｉは１２８次元のベクトルであり、ｗ_ｉは１２８×１２８の行列であり、ｗ_１×ｈ_ｔ−１は１２８×１のベクトルであり、ｗ_２×ｘ_ｔも１２８×１のベクトルであり、最後にｂ_ｉを加算して１２８次元のベクトルを出力する。

同様に、前記数式３において、ｗ_ｃは１２８×１２８の行列であり、ｂ_ｃは１２８次元のベクトルであり、前記数式５において、ｗ_ｏは１２８×１２８の行列であり、ｂ_ｏは１２８次元のベクトルである。前記数式４において、Ｃ_ｔは、１２８×１２８の行列である。

本開示の実施例では、既存のリカレントニューラルネットワークにおけるフィードバックゲートの論理演算を簡素化し、ネットワーク装置の処理量を低減し、ドメイン名の識別精度を向上させる。

一例において、本開示の実施例は、ドメイン名特徴分析モデルおよびドメイン名分類モデルのトレーニング方法を提供する。ここで、当該方法はネットワーク装置によって実行されてもよい。ここで、当該ネットワーク装置は、データ処理機能を有するネットワーク装置であってもよい。図６に示すように、具体的には以下のステップを含む。
ステップ６０１では、ネットワーク装置は、記憶されたトレーニングサンプルセットを取得する。
ここで、トレーニングサンプルセットに、複数のポジティブサンプルと複数のネガティブサンプルを含む。各ポジティブサンプルは、正当なドメイン名に対応するシーケンス行列であり、各ネガティブサンプルは、不正なドメイン名に対応するシーケンス行列である。

本開示の実施例において、当業者は、ネットワーク装置に複数の正当なドメイン名を事前に入力する。ネットワーク装置は、正当なドメイン名のぞれぞれに対応するシーケンス行列を特定して、ポジティブサンプルを得る。ネットワーク装置は、不正なドメイン名を取得してもよい。不正なドメイン名は、ネットワークからクロールすることでネットワーク装置により取得されるものであってもよく、あるいは、ドメイン名生成アルゴリズム（Ｄｏｍａｉｎｎａｍｅｇｅｎｅｒａｔｉｏｎａｌｇｏｒｉｔｈｍ、ＤＧＡと略称する）技術を利用して、ネットワーク装置によって生成されるものてあってもよい。ネットワーク装置は、不正なドメイン名に対応するシーケンス行列を特定し、ネガティブサンプルを得る。

このようにして、ネットワーク装置は、トレーニングサンプルセットを得ることができる。ここで、シーケンス行列を特定する具体的な処理手順は、ステップ１０２に関する説明を参照することができるため、ここではその説明を省略する。

ステップ６０２では、ネットワーク装置は、各シーケンス行列に含まれる各文字ベクトルを第１の初期トレーニングモデルに順次入力し、各文字ベクトルに対応する出力値を得る。

ここで、第１の初期トレーニングモデルは、入出力ゲート及びフィードバックゲートを含むリカレントニューラルネットワークである。

ステップ６０３では、ネットワーク装置は、各シーケンス行列の各文字ベクトルの出力値によって、各シーケンス行列に対応する特徴ベクトルを特定する。

本開示の実施例において、ステップ６０２及びステップ６０３の具体的な処理手順は、ステップ３０１〜ステップ３０３に関する説明を参照することができるため、ここでその説明を省略する。

ステップ６０４では、ネットワーク装置は、各シーケンス行列に対応する特徴ベクトルを第２の初期トレーニングモデルに入力し、各シーケンス行列に対応するドメイン名識別結果を取得する。

ここで、第２の初期トレーニングモデルは、全結合層である。

本ステップの処理手順は、ステップ１０５に関する説明を参照することができるため、ここではその説明は省略する。

ステップ６０５では、ネットワーク装置は、逆伝播アルゴリズムにより、各シーケンス行列に対応するドメイン名識別結果を利用して、第１の初期トレーニングモデルに含まれる第１の重み行列と、第２の重み行列と、第３の重み行列と、第１のオフセットパラメータと、第２のオフセットパラメータと、第３のオフセットパラメータとを調整して、ドメイン名特徴分析モデルを得る。

ここで、逆伝播アルゴリズムは、通時的逆伝播（ＢａｃｋＰｒｏｐａｇａｔｉｏｎＴｒｏｕｇｈＴｉｍｅ、ＢＰＴＴと略称する）アルゴリズムであってよい。

本開示の実施例において、ネットワーク装置は、各シーケンス行列（すなわち、サンプル）に対応するドメイン名識別結果と、当該シーケンス行列（すなわち、サンプル）に対応するドメイン名の実際の分類結果（例えば、正当なドメイン名または不正なドメイン名）と、ＢＰＴＴアルゴリズムとに基づいて、入出力ゲートに含まれる第１の重み行列、第２の重み行列、第１のオフセットパラメータ及び第２のオフセットパラメータと、フィードバックゲートにおける第３の重み行列及び第３のオフセットパラメータとを調整し、ドメイン名特徴分析モデルを得る。

ここで、ＢＰＴＴアルゴリズムによるリカレントニューラルネットワークへの調整処理手順は、従来技術に属するため、本開示の実施例ではその説明を省略する。

ステップ６０６では、ネットワーク装置は、逆伝播アルゴリズムにより、各シーケンス行列に対応するドメイン名識別結果を利用して、第２の初期トレーニングモデルを調整し、ドメイン名分類モデルを得る。

本開示の実施例では、全結合層は、１２８次元のベクトルである重みベクトルを含む。ネットワーク装置は、各シーケンス行列（即ち、サンプル）に対応するドメイン名識別結果と、当該シーケンス行列（即ち、サンプル）に対応するドメイン名の実際の分類結果（例えば、正当なドメイン名または不正なドメイン名）と、逆伝播アルゴリズムとによって、全結合層に含まれる重みベクトルの値を調整して、ドメイン名特徴分析モデルを得る。

ここで、逆伝播アルゴリズムによって全結合層を調整する処理手順は、従来の技術に属するため、本開示の実施例ではその説明を省略する。

本開示の実施例において、方法の実施例について、簡単に説明するために、一連の動作の組み合わせとして説明されているが、当業者は、本開示の実施例が説明された動作の順番によって制限されないと理解するはずである。なぜなら、本開示の実施例によれば、いくつかのステップは他の順番で、または同時に実行され得るからである。次に、当業者は、本明細書に記載された実施例が全て、好ましい実施例であり、係る動作が本開示の実施例に必ずしも必要ではないと理解するはずである。図７を参照すると、本開示の実施例に係るドメイン名を識別する装置を示した。当該装置はネットワーク装置に適用され、ネットワーク装置はドメイン名特徴分析モデル及びドメイン名分類モデルを既に構築しており、ドメイン名特徴分析モデルは入出力ゲートを含み、当該装置は、受信モジュール７１０と、第１の特定モジュール７２０と、第１の入力モジュール７３０と、処理モジュール７４０と、第２の特定モジュール７５０とを備える。各モジュールの説明は以下の通りである。

受信モジュール７１０は、端末から送信されたドメイン名解析リクェストを受信するためのものであり、ドメイン名解析リクェストに識別対象のドメイン名を含み、ドメイン名に少なくとも１つの文字を含む。
第１の特定モジュール７２０は、ドメイン名に対応するシーケンス行列を特定するためのものであり、シーケンス行列は少なくとも１つの文字ベクトルを含み、少なくとも１つの文字ベクトルの夫々と少なくとも１つの文字の夫々とは一対一対応する。
第１の入力モジュール７３０は、前記少なくとも１つの文字ベクトルの夫々を前記入出力ゲートに順次入力するためのものであり、前記入出力ゲートは前記の複数の活性化関数間の論理演算規則を含む。
処理モジュール７４０は、前記複数の活性化関数間の論理演算規則により、前記少なくとも１つの文字ベクトルのそれぞれへの論理演算処理を行って、前記シーケンス行列に対応する特徴ベクトルを得るためのものである。
第２の特定モジュール７５０は、シーケンス行列に対応する特徴ベクトルをドメイン名分類モデルに入力し、ドメイン名が正当なドメイン名であるか否かを特定するためのものである。

本公開の一実施例において、第１の特定モジュール７２０は、第１の取得サブモジュールと、第１の特定サブモジュールと、補充サブモジュールと、第１の算出サブモジュールと、第２の特定サブモジュールとを含む。

第１の取得サブモジュールは、ドメイン名から有効な文字を取得するためのものであり、有効な文字はドメイン名のうち記憶されたプレフィックス文字およびサフィックス文字以外の文字で構成される。
第１の特定サブモジュールは、記憶された文字とインデックス値とのマッピング規則により、有効な文字の夫々に対応するインデックス値を特定し、有効な文字に対応する第１のインデックスシーケンスを得るためのものである。
補充サブモジュールは、第１のインデックスシーケンスが標準長さに達していないとき、第１のインデックスシーケンスを、標準長さを有する第２のインデックスシーケンスとして補充するためのものである。
第１の計算サブモジュールは、第２のインデックスシーケンスの各インデックス値に対応する文字ベクトルを計算するためのものである。
第２の特定サブモジュールは、第２のインデクスシーケンスの各インデクス値に対応する文字ベクトルにより、シーケンス行列を特定するためのものである。

本公開の一実施例において、処理モジュール７４０は、第２の取得サブモジュールと、演算サブモジュールと、第３の特定サブモジュールとを含む。

第２の取得サブモジュールは、前記入出力ゲートに現在入力された第１の文字ベクトルと、前記入出力ゲートに前回入力された第２の文字ベクトルの出力値と、前記入出力ゲートに前回入力された第２の文字ベクトルのフィードバック値とを取得するためのものである。
演算サブモジュールは、前記第１の文字ベクトルと、前記第２の文字ベクトルの出力値と、前記第２の文字ベクトルのフィードバック値とに対して第１の論理演算を行って、前記第１の文字ベクトルの出力値を得るためのものである。
第３の特定サブモジュールは、得られた少なくとも１つの文字ベクトルの出力値により、前記シーケンス行列に対応する特徴ベクトルを特定するためのものである。

本公開の一実施例において、演算サブモジュール７４２は、第１の計算ユニットと、第２の計算ユニットと、第１の入力ユニットと、第２の入力ユニットと、第３の計算ユニットとを含む。
第１の計算ユニットは、第１の重み行列に基づいて、前記第１の文字ベクトルと前記第２の文字ベクトルのフィードバック値に対して第１の重み付け計算を行って、第１の重み付け結果を得るためのものである。
第２の計算ユニットは、第２の重み行列に基づいて、前記第１の文字ベクトルと前記第２の文字ベクトルのフィードバック値に対して第２の重み付け計算を行って、第２の重み付け結果を得るためのものである。
第１の入力ユニットは、第１の重み付け結果と第１のオフセットパラメータを第１の活性化関数に入力し、第１の演算結果を得るためのものである。
第２の入力ユニットは、第２の重み付け結果と第２のオフセットパラメータを第２の活性化関数に入力し、第２の演算結果を得るためものである。
第３の計算ユニットは、前記第１の演算結果と前記第２の演算結果とを乗算し、乗算結果と前記第２の文字ベクトルの出力値とを加算し、前記第１の文字ベクトルに対応する出力値を得るためものである。

本開示の一実施例において、ドメイン名特徴分析モデルは、フィードバックゲートをさらに含み、当該装置は、演算モジュールをさらに含む。

演算モジュールは、前記第１の文字ベクトルの出力値と、前記第１の文字ベクトルと、前記第２の文字ベクトルのフィードバック値に対して第２の論理演算を行って、前記第１の文字ベクトルのフィードバック値を得るためのものである。

本開示の一実施例において、演算モジュールは、第２の計算サブモジュールと、第１の入力サブモジュールと、第２の入力サブモジュールと、乗算サブモジュールとをさらに含む。

第２の計算サブモジュールは、第３の重み行列に基づいて、前記第１の文字ベクトルと前記第２の文字ベクトルのフィードバック値に対して第３の重み付け計算を行って、第３の重み付け結果を得るためのものである。
第１の入力サブモジュールは、第３の重み付け結果と第３のオフセットパラメータを第３の活性化関数に入力し、第３の演算結果を得るためのものである。
第２の入力サブモジュールは、前記第１の文字ベクトルの出力値を第４の活性化関数に入力し、第４の演算結果を得るためのものである。
乗算サブモジュールは、前記第３の演算結果と前記第４の演算結果とを乗算して、第１の文字ベクトルのフィードバック値を得るためのものである。

本開示の一実施例において、当該装置は、取得モジュールと、第２の入力モジュールと、第３の特定モジュールと、第３の入力モジュールと、第１の調整モジュールと、第２の調整モジュールとをさらに含む。

取得モジュールは、記憶されたトレーニングサンプルセットを取得するためのものであり、トレーニングサンプルセットは、複数のポジティブサンプルと複数のネガティブサンプルを含み、各ポジティブサンプルは正当なドメイン名に対応するシーケンス行列であり、各ネガティブサンプルは不正なドメイン名に対応するシーケンス行列である。
第２の入力モジュールは、各シーケンス行列に含まれる各文字ベクトルを第１の初期トレーニングモデルに順次入力し、各文字ベクトルに対応する出力値を得るためのものである。
第３の特定モジュールは、各シーケンス行列の各文字ベクトルの出力値によって、各シーケンス行列に対応する特徴ベクトルを特定するためのものである。
第３の入力モジュールは、各シーケンス行列に対応する特徴ベクトルを第２の初期トレーニングモデルに入力し、各シーケンス行列に対応するドメイン名識別結果を得るためのものである。
第１の調整モジュールは、逆伝播アルゴリズムにより、各シーケンス行列に対応するドメイン名識別結果を利用し、前記第１の初期トレーニングモデルに含まれる前記第１の重み行列と、前記第２の重み行列と、前記第３の重み行列と、前記第１のオフセットパラメータと、前記第２のオフセットパラメータと、前記第３のオフセットパラメータとを調整して、前記ドメイン名特徴分析モデルを得るためのものである。
第２の調整モジュールは、逆伝播アルゴリズムにより、各シーケンスに対応するドメイン名識別結果を利用し、前記第２の初期トレーニングモデルを調整して、前記ドメイン名分類モデルを得るためのものである。

本開示の実施例に係るドメイン名を識別する装置は、ネットワーク装置に適用され、ネットワーク装置は、ドメイン名特徴分析モデルとドメイン名分類モデルとを既に構築しており、ドメイン名特徴分析モデルに入出力ゲートを含む。ネットワーク装置は、端末から送信されたドメイン名解析リクェストを受信し、当該ドメイン名解析リクェストは、識別対象のドメイン名を含み、ドメイン名は、少なくとも１つの文字を含む。ネットワーク装置は、ドメイン名に対応するシーケンス行列を特定し、ここで、シーケンス行列は、少なくとも１つの文字ベクトルを含み、少なくとも１つの文字ベクトルの夫々と、少なくとも１つの文字の夫々とは一対一対応する。

ネットワーク装置は、シーケンス行列に対応する特徴ベクトルをドメイン名分類モデルに入力し、ドメイン名が正当なドメイン名であるか否かを特定する。

上記ドメイン名の識別方法の実施例に対応して、本開示の実施例は、ネットワーク装置をさらに提供する。図８を参照すると、本開示の実施例に係るネットワーク装置の構造ブロック図を示した。

当該ネットワーク装置は、プロセッサ８０１と、送受信機８０２と、機械実行可能なコマンドを記憶した機械可読記憶媒体８０３とを含む。

当該ネットワーク装置は、ドメイン名特徴分析モデルと、ドメイン名分類モデルとを既に構築しており、当該ドメイン名特徴分析モデルは入出力ゲートを含む。ドメイン名特徴分析モデルおよびドメイン名分類モデルは、ソフトウェア機能モジュールにより実現される。これで分かるように、上記ソフトウェア機能モジュールは、メモリ（ｆｌａｓｈ）にロードされてもよく、プロセッサ８０１によって呼び出されるように実現される。あるいは、前記ソフトウェア機能モジュールはプロセッサの内部に設けられてもよく、プロセッサ８０１によってアクセスされるように実現される。

ここで、送受信機８０２は、端末から送信されたドメイン名解析リクェストを受信し、前記ドメイン名解析リクェストを前記プロセッサ８０１に伝送するためのものであり、前記ドメイン名解析リクェストに識別対象のドメイン名を含み、前記ドメイン名に少なくとも１つの文字を含む。
機械実行可能なコマンドを読み取って実行することで、前記プロセッサ８０１に、
前記ドメイン名に対応するシーケンス行列を特定し、前記シーケンス行列が少なくとも１つの文字ベクトルを含み、前記少なくとも１つの文字ベクトルの夫々と前記少なくとも１つの文字の夫々とは一対一対応することと、
前記少なくとも１つの文字ベクトルの夫々を、前記入出力ゲートに順次入力し、前記入出力ゲートが複数の活性化関数間の論理演算規則を含むことと、
前記複数の活性化関数間の論理演算規則により、前記少なくとも１つの文字ベクトルの夫々への論理演算処理を行って、前記シーケンス行列に対応する特徴ベクトルを得ることと、
前記シーケンス行列に対応する特徴ベクトルを前記ドメイン名分類モデルに入力し、前記ドメイン名が正当なドメイン名であるか否かを特定することと、
を実行させる。

本開示の一実施例において、前記機械実行可能なコマンドは、具体的に、前記プロセッサ８０１に、
前記ドメイン名から有効な文字を取得し、前記有効な文字が前記ドメイン名のうち記憶されたプレフィックス文字及びサフィックス文字以外の文字で構成されることと、
記憶された文字とインデックス値とのマッピング規則により、前記有効な文字の夫々に対応するインデックス値を特定し、前記有効な文字に対応する第１のインデックスシーケンスを得ることと、
前記第１のインデックスシーケンスが標準長さに達していないとき、前記第１のインデックスシーケンスを標準長さを有する第２のインデックスシーケンスとして補充することと、
前記第２のインデックスシーケンスの各インデックス値に対応する文字ベクトルを計算することと、
前記第２のインデックスシーケンスの各インデックス値に対応する文字ベクトルにより、前記シーケンス行列を特定することと、
を実行させる。

本開示の一実施例において、前記機械実行可能なコマンドは、具体的に、前記プロセッサ８０１に、
前記入出力ゲートに現在入力された第１の文字ベクトルと、前記入出力ゲートに前回入力された第２の文字ベクトルの出力値と、前記入出力ゲートに前回入力された前記第２の文字ベクトルのフィードバック値とを取得することと、
前記第１の文字ベクトルと、前記第２の文字ベクトルの出力値と、前記第２の文字ベクトルのフィードバック値とに対して第１の論理演算を行って、前記第１の文ベクトルの出力値を得ることと、
得られた少なくとも１つの文字ベクトルの出力値により、前記スシーケンス行列に対応する特徴ベクトルを特定することと、
を実行させる。

本開示の一実施例において、前記機械実行可能なコマンドは、具体的に、前記プロセッサ８０１に、
第１の重み行列に基づいて、前記第１の文字ベクトルと前記第２の文字ベクトルのフィードバック値に対して第１の重み付け計算を行って、第１の重み付け結果を得ることと
第２の重み行列に基づいて、前記第１の文字ベクトルと前記第２の文字ベクトルのフィードバック値に対して第２の重み付け計算を行って、第２の重み付け結果を得ることと、
前記第１の重み付け結果と第１のオフセットパラメータを第１の活性化関数に入力し、第１の演算結果を得ることと、
前記第２の重み付け結果と第２のオフセットパラメータを第２の活性化関数に入力し、第２の演算結果を得ることと、
前記第１の演算結果と前記第２の演算結果とを乗算し、乗算結果と前記第２の文字ベクトルの出力値とを加算し、前記第１の文字ベクトルに対応する出力値を得ることと、
を実行させる。

本開示の一実施例において、前記ドメイン名特徴分析モデルは、フィードバックゲートをさらに含み、前記機械実行可能なコマンドは、さらに、前記プロセッサ８０１に、前記第１の文字ベクトルの出力値と、前記第１の文字ベクトルと、前記第２の文字ベクトルのフィードバック値に対して第２の論理演算を行って、前記第１の文字ベクトルのフィードバック値を得ることを実行させ、
ここで、前記フィードバック値は、前記入出力ゲートに次回に入力される文字ベクトルの出力値を計算するためのものである。

本開示の一実施例において、前記機械実行可能なコマンドは、具体的に、前記プロセッサ８０１に、
第３の重み行列に基づいて、前記第１の文字ベクトルと前記第２の文字ベクトルのフィードバック値に対して第３の重み付け計算を行って、第３の重み付け結果を得ることと、
前記第３の重み付け結果と第３のオフセットパラメータを第３の活性化関数に入力し、第３の演算結果を得ることと、
前記第１の文字ベクトルの出力値を第４の活性化関数に入力し、第４の演算結果を得ることと、
前記第３の演算結果と前記第４の演算結果とを乗算して、前記第１の文字ベクトルのフィードバック値を得ることと、
を実行させる。

本開示の一実施例において、前記機械実行可能なコマンドは、さらに、前記プロセッサ８０１に、
記憶されたトレーニングサンプルセットを取得し、前記トレーニングサンプルのセットに複数のポジティブサンプルと複数のネガティブサンプルとを含み、各ポジティブサンプルが、正当なドメイン名に対応するシーケンス行列であり、各ネガティブサンプルが、不正なドメイン名に対応するシーケンス行列であることと、
各シーケンス行列に含まれる各文字ベクトルを、第１の初期トレーニングモデルに順次入力し、前記各文字ベクトルに対応する出力値を得ることと、
各シーケンス行列の各文字ベクトルの出力値によって、各シーケンス行列に対応する特徴ベクトルを特定することと、
各シーケンス行列に対応する特徴ベクトルを第２の初期トレーニングモデルに入力し、各シーケンス行列に対応するドメイン名識別結果を得ることと、
逆伝播アルゴリズムにより、各シーケンス行列に対応するドメイン名識別結果を利用し、前記第１の初期トレーニングモデルに含まれる前記第１の重み行列と、前記第２の重み行列と、前記第３の重み行列と、前記第１のオフセットパラメータと、前記第２のオフセットパラメータと、前記第３のオフセットパラメータとを調整して、前記ドメイン名特徴分析モデルを得ることと、
逆伝播アルゴリズムにより、各シーケンス行列に対応するドメイン名識別結果を利用し、前記第２の初期トレーニングモデルを調整して、前記ドメイン名分類モデルを得ることと、
を実行させる。

本開示の一実施例において、前記マシン実行可能コマンドは、さらに、前記プロセッサ８０１に、
前記ドメイン名が正当なドメイン名であると特定した場合、前記ドメイン名に対応するネットワークプロトコルＩＰアドレスを含む応答メッセージを前記端末に送信すること、を実行させる。

図８に示すように、ネットワーク装置は、さらに、通信バス８０４を有する。通信バス８０４を介して、プロセッサ８０１と、機械可読記憶媒体８０３との間で通信のやり取りを行う。通信バス８０４は、周辺機器相互接続標準（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ、ＰＣＩと略称する）バス又は拡張業界標準アーキテクチャ（ＥｘｔｅｎｄｅｄＩｎｄｕｓｔｒｙＳｔａｎｄａｒｄＡｒｃｈｉｔｅｃｔｕｒｅ、ＥＩＳＡと略称する）バス等である。当該通信バス８０４は、アドレスバス、データバス、制御バス等に分類される。

機械可読記憶媒体８０３は、ランダムアクセスメモリ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ、ＲＡＭと略称する）を含んでもよく、不揮発性メモリ（Ｎｏｎ−ＶｏｌａｔｉｌｅＭｅｍｏｒｙ、ＮＶＭと略称する）を含んでもよく、例えば、少なくとも１つの磁気ディスクメモリを含む。また、機械可読記憶媒体８０３は、上記プロセッサから離れて配置された少なくとも１つの記憶装置であってもいい。

プロセッサ８０１は、中央処理装置（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、ＣＰＵと略称する）、ネットワークプロセッサ（ＮｅｔｗｏｒｋＰｒｏｃｅｓｓｏｒ、ＮＰと略称する）などを含む汎用プロセッサであってもよく、デジタル信号プロセッサ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ、ＤＳＰと略称する）や、特定用途向け集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ、ＡＳＩＣと略称する）、フィールドプログラマブルゲートアレイ（Ｆｉｅｌｄ−ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ、ＦＰＧＡと略称する）、または他のプログラム可能な論理装置、ディスクリートゲート、トランジスタロジック装置、ディスクリートゲートハードウェア構成部品であってもいい。

本開示の実施例に係るネットワーク装置において、ドメイン名特徴分析モデルと、ドメイン名分類モデルとを既に構築しており、ドメイン名特徴分析モデルは入出力ゲートを含む。ネットワーク装置は、端末から送信されたドメイン名解析リクェストを受信し、当該ドメイン名解析リクェストに、識別対象のドメイン名を含み、ドメイン名に少なくとも１つの文字を含む。ネットワーク装置は、ドメイン名に対応するシーケンス行列を特定し、ここで、シーケンス行列は、少なくとも１つの文字ベクトルを含み、少なくとも１つの文字ベクトルの夫々と少なくとも１つの文字の夫々とは一対一対応する。

そして、ネットワーク装置は、少なくとも１つの文字ベクトルの夫々を、入出力ゲートに順次入力する。入出力ゲートは、複数の活性化関数間の論理演算規則を含む。ネットワーク装置は、複数の活性化関数間の論理演算規則により、少なくとも１つの文字ベクトルの夫々への論理演算処理を行って、シーケンス行列に対応する特徴ベクトルを得る。

最後に、ネットワーク装置は、シーケンス行列に対応する特徴ベクトルをドメイン名分類モデルに入力し、ドメイン名が正当なドメイン名であるか否かを特定する。

本開示の実施例において、「第１」や「第２」等のような関係用語は一つの実体又は操作を他の実体又は操作と区別するために使用されるものであり、必ずしもこれらの実体又は操作の間にいかなるこのような実際的な関係又は順序が存在することを、要求又は暗示するわけではない。そして、用語「備える」、「含む」又はいかなる他の変形は、非排他的包含を含むことを目的とし、これにより一連の要素を含む処理、方法、物又は装置がそれらの要素を備えるだけでなく、明確に記載されていない他の要素、あるいは、このような処理、方法、物又は装置に固有される要素も備えることを意図している。これ以上の限定がない場合、「……を備える」の文で限定される要素は、前記要素を備える処理、方法、物又は装置が、更に他の同じ要素を備えることを排除するものではない。

本明細書における各実施例はいずれも関連するように説明されるが、各実施例の同じ又は似た部分は互いに参照すればよく、各実施例における重点的に説明された部分はいずれも他の実施例との相違点である。特に、システムの実施例については、方法の実施例とほぼ同じであるため、比較的簡単に説明したが、関連する箇所は方法の実施例の説明の一部を参照すればよい。

以上の説明は単に本開示の好適な実施例であって、本開示の保護範囲を限定するためのものではない。本開示の主旨及び原則を逸脱しない範囲でなされるいかなる補正、等価置換、改良等は、いずれも本開示の保護範囲内に含まれる。

Claims

入出力ゲートを含むドメイン名特徴分析モデルと、ドメイン名分類モデルとを既に構築しているネットワーク装置に適用されるドメイン名の識別方法であって、
端末から送信されたドメイン名解析リクェストを受信し、前記ドメイン名解析リクェストに、識別対象のドメイン名を含み、前記ドメイン名に少なくとも１つの文字を含むステップと、
前記ドメイン名に対応するシーケンス行列を特定し、前記シーケンス行列が少なくとも１つの文字ベクトルを含み、前記少なくとも１つの文字ベクトルの夫々と前記少なくとも１つの文字の夫々とが一対一対応するステップと、
前記少なくとも１つの文字ベクトルの夫々を入出力ゲートに順次入力し、前記入出力ゲートが複数の活性化関数間の論理演算規則を含むステップと、
前記複数の活性化関数間の論理演算規則により、前記少なくとも１つの文字ベクトルの夫々への論理演算処理を行って、前記シーケンス行列に対応する特徴ベクトルを得るステップと、
前記シーケンス行列に対応する特徴ベクトルを前記ドメイン名分類モデルに入力し、前記ドメイン名が正当なドメイン名であるか否かを特定するステップと、
を含む、ドメイン名の識別方法。
前記ドメイン名に対応するシーケンス行列を特定することは、
前記ドメイン名から有効な文字を取得し、前記有効な文字が前記ドメイン名のうち記憶されたプレフィックス文字及び記憶されたサフィックス文字以外の文字で構成されるステップと、
記憶された文字とインデックス値とのマッピング規則により、前記有効な文字の夫々に対応するインデックス値を特定し、前記有効な文字に対応する第１のインデックスシーケンスを得るステップと、
前記第１のインデックスシーケンスが標準長さに達していない場合、前記第１のインデックスシーケンスを、標準長さを有する第２のインデックスシーケンスとして補充するステップと、
前記第２のインデックスシーケンスの各インデックス値に対応する文字ベクトルを計算するステップと、
前記第２のインデックスシーケンスの各インデックス値に対応する文字ベクトルにより、前記シーケンス行列を特定するステップと、
を含む、請求項１に記載のドメイン名の識別方法。
前記複数の活性化関数間の論理演算規則により、前記少なくとも１つの文字ベクトルのそれぞれへの論理演算処理を行って、前記シーケンス行列に対応する特徴ベクトルを得ることは、
前記入出力ゲートに現在入力された第１の文字ベクトルと、前記入出力ゲートに前回入力された第２の文字ベクトルの出力値と、前記入出力ゲートに前回入力された第２の文字ベクトルのフィードバック値とを取得するステップと、
前記第１の文字ベクトルと、前記第２の文字ベクトルの出力値と、前記第２の文字ベクトルのフィードバック値とに対して第１の論理演算を行って、前記第１の文字ベクトルの出力値を得るステップと、
得られた少なくとも１つの文字ベクトルの出力値により、前記シーケンス行列に対応する特徴ベクトルを特定するステップと、
を含む、請求項１に記載のドメイン名の識別方法。
前記第１の文字ベクトルと、前記第２の文字ベクトルの出力値と、前記第２の文字ベクトルのフィードバック値とに対して第１の論理演算を行って、前記第１の文字ベクトルの出力値を得ることは、
第１の重み行列に基づいて、前記第１の文字ベクトルと前記第２の文字ベクトルのフィードバック値に対して第１の重み付け計算を行って、第１の重み付け結果を得るステップと、
第２の重み行列に基づいて、前記第１の文字ベクトルと前記第２の文字ベクトルのフィードバック値に対して第２の重み付け計算を行って、第２の重み付け結果を得るステップと、
前記第１の重み付け結果と第１のオフセットパラメータとを第１の活性化関数に入力し、第１の演算結果を得るステップと
前記第２の重み付け結果と第２のオフセットパラメータとを第２の活性化関数に入力し、第２の演算結果を得るステップと、
前記第１の演算結果と前記第２の演算結果とを乗算し、乗算結果と前記第２の文字ベクトルの出力値とを加算し、前記第１の文字ベクトルに対応する出力値を得るステップと、
を含む、請求項３に記載のドメイン名の識別方法。
前記ドメイン名特徴分析モデルは、フィードバックゲートをさらに含み、
前記第１の文字ベクトルの出力値を得た後に、
前記第１の文字ベクトルの出力値と、前記第１の文字ベクトルと、前記第２の文字ベクトルのフィードバック値に対して第２の論理演算を行って、前記第１の文字ベクトルのフィードバック値を得るステップをさらに含み、
前記フィードバック値は、前記入出力ゲートに次回に入力される文字ベクトルの出力値を計算するためのものである、
請求項４に記載のドメイン名の識別方法。
前記第１の文字ベクトルの出力値と、前記第１の文字ベクトルと、前記第２の文字ベクトルのフィードバック値に対して第２の論理演算を行って、前記第１の文字ベクトルのフィードバック値を得ることは、
第３の重み行列に基づいて、前記第１の文字ベクトルと前記第２の文字ベクトルのフィードバック値に対して第３の重み付け計算を行って、第３の重み付け結果を得るステップと、
前記第３の重み付け結果と第３のオフセットパラメータとを第３の活性化関数に入力し、第３の演算結果を得るステップと、
前記第１の文字ベクトルの出力値を第４の活性化関数に入力し、第４の演算結果を得るステップと、
前記第３の演算結果と前記第４の演算結果とを乗算して、前記第１の文字ベクトルのフィードバック値を得るステップと、
を含む、請求項５に記載のドメイン名の識別方法。
記憶されたトレーニングサンプルセットを取得し、前記トレーニングサンプルセットに複数のポジティブサンプルと複数のネガティブサンプルを含み、各ポジティブサンプルが正当なドメイン名に対応するシーケンス行列であり、各ネガティブサンプルが不正なドメイン名に対応するシーケンス行列であるステップと、
各シーケンス行列に含まれる各文字ベクトルを第１の初期トレーニングモデルに順次入力し、前記各文字ベクトルに対応する出力値を得るステップと、
各シーケンス行列の各文字ベクトルの出力値によって、各シーケンス行列に対応する特徴ベクトルを特定するステップと、
各シーケンス行列に対応する特徴ベクトルを第２の初期トレーニングモデルに入力し、各シーケンス行列に対応するドメイン名識別結果を得るステップと、
逆伝播アルゴリズムにより、各シーケンス行列に対応するドメイン名識別結果を利用し、前記第１の初期トレーニングモデルに含まれる前記第１の重み行列と、前記第２の重み行列と、前記第３の重み行列と、前記第１のオフセットパラメータと、前記第２のオフセットパラメータと、前記第３のオフセットパラメータとを調整して、前記ドメイン名特徴分析モデルを得るステップと、
逆伝播アルゴリズムにより、各シーケンス行列に対応するドメイン名識別結果を利用し、前記第２の初期トレーニングモデルを調整して、前記ドメイン名分類モデルを得るステップと、
をさらに含む、請求項６に記載のドメイン名の識別方法。
入出力ゲートを含むドメイン名特徴分析モデルと、ドメイン名分類モデルとを既に構築しているネットワーク装置であって、
プロセッサと、送受信機と、機械実行可能なコマンドを記憶した機械可読記憶媒体と、を含み、
前記送受信機は、端末から送信されたドメイン名解析リクェストを受信し、前記ドメイン名解析リクェストを前記プロセッサに伝送するためのものであり、前記ドメイン名解析リクェストに識別対象のドメイン名を含み、前記ドメイン名に少なくとも１つの文字を含み、
機械実行可能なコマンドを読み取って実行することで、前記プロセッサに、
前記ドメイン名に対応するシーケンス行列を特定し、前記シーケンス行列が少なくとも１つの文字ベクトルを含み、前記少なくとも１つの文字ベクトルの夫々と前記少なくとも１つの文字の夫々とは一対一対応することと、
前記少なくとも１つの文字ベクトルの夫々を入出力ゲートに順次入力し、前記入出力ゲートが複数の活性化関数間の論理演算規則を含むことと、
前記複数の活性化関数間の論理演算規則により、前記少なくとも１つの文字ベクトルのそれぞれへの論理演算処理を行って、前記シーケンス行列に対応する特徴ベクトルを得ることと、
前記シーケンス行列に対応する特徴ベクトルを前記ドメイン名分類モデルに入力し、前記ドメイン名が正当なドメイン名であるか否かを特定することと、
を実行させる、ネットワーク装置。
前記機械実行可能なコマンドは、具体的に、前記プロセッサに、
前記ドメイン名から有効な文字を取得し、前記有効な文字が前記ドメイン名のうち記憶されたプレフィックス文字及び記憶されたサフィックス文字以外の文字で構成されることと、
記憶された文字とインデックス値とのマッピング規則により、前記有効な文字の夫々に対応するインデックス値を特定し、前記有効な文字に対応する第１のインデックスシーケンスを取得することと、
前記第１のインデックスシーケンスが標準長さに達していない場合、前記第１のインデックスシーケンスを、標準長さを有する第２のインデックスシーケンスとして補充することと、
前記第２のインデックスシーケンスの各インデックス値に対応する文字ベクトルを計算することと、
前記第２のインデックスシーケンスの各インデックス値に対応する文字ベクトルにより、前記シーケンス行列を特定することと、
を実行させる、請求項８に記載のネットワーク装置。
前記機械実行可能なコマンドは、具体的に、前記プロセッサに、
前記入出力ゲートに現在入力された第１の文字ベクトルと、前記入出力ゲートに前回入力された第２の文字ベクトルの出力値と、前記入出力ゲートに前回入力された前記第２の文字ベクトルのフィードバック値とを取得することと、
前記第１の文字ベクトルと、前記第２の文字ベクトルの出力値と、前記第２の文字ベクトルのフィードバック値とに対して第１の論理演算を行って、前記第１の文字ベクトルの出力値を得ることと、
得られた少なくとも１つの文字ベクトルの出力値により、前記スシーケンス行列に対応する特徴ベクトルを特定することと、
を実行させる、請求項８に記載のネットワーク装置。
前記機械実行可能なコマンドは、具体的に、前記プロセッサに、
第１の重み行列に基づいて、前記第１の文字ベクトルと前記第２の文字ベクトルのフィードバック値に対して第１の重み付け計算を行って、第１の重み付け結果を得ることと、
第２の重み行列に基づいて、前記第１の文字ベクトルと前記第２の文字ベクトルのフィードバック値に対して第２の重み付け計算を行って、第２の重み付け結果を得ることと、
前記第１の重み付け結果と第１のオフセットパラメータとを第１の活性化関数に入力し、第１の演算結果を得ることと、
前記第２の重み付け結果と第２のオフセットパラメータとを第２の活性化関数に入力し、第２の演算結果を得ることと、
前記第１の演算結果と前記第２の演算結果とを乗算し、乗算結果と前記第２の文字ベクトルの出力値とを加算し、前記第１の文字ベクトルに対応する出力値を得ることと、
を実行させる、請求項１０に記載のネットワーク装置。
前記ドメイン名特徴分析モデルはフィードバックゲートをさらに含み、
前記機械実行可能なコマンドは、さらに、前記プロセッサに、
前記第１の文字ベクトルの出力値と、前記第１の文字ベクトルと、前記第２の文字ベクトルのフィードバック値に対して第２の論理演算を行って、前記第１の文字ベクトルのフィードバック値を得ることを実行させ、
前記フィードバック値は、前記入出力ゲートに次回に入力される文字ベクトルの出力値を計算するためのものである、
請求項１１に記載のネットワーク装置。
前記機械実行可能なコマンドは、具体的に、前記プロセッサに、
第３の重み行列に基づいて、前記第１の文字ベクトルと、前記第２の文字ベクトルのフィードバック値に対して第３の重み付け計算を行って、第３の重み付け結果を得ることと、
前記第３の重み付け結果と第３のオフセットパラメータを第３の活性化関数に入力し、第３の演算結果を得ることと、
前記第１の文字ベクトルの出力値を第４の活性化関数に入力し、第４の演算結果を得ることと、
前記第３の演算結果と前記第４の演算結果とを乗算して、前記第１の文字ベクトルのフィードバック値を得ることと、
を実行させる、請求項１２に記載のネットワーク装置。
前記機械実行可能なコマンドは、さらに、前記プロセッサに、
記憶されたトレーニングサンプルセットを取得し、前記トレーニングサンプルセットに複数のポジティブサンプルと複数のネガティブサンプルを含み、各ポジティブサンプルが正当なドメイン名に対応するシーケンス行列であり、各ネガティブサンプルが不正なドメイン名に対応するシーケンス行列であることと、
各シーケンス行列に含まれる各文字ベクトルを第１の初期トレーニングモデルに順次入力し、前記各文字ベクトルに対応する出力値を得ることと、
各シーケンス行列の各文字ベクトルの出力値によって、各シーケンス行列に対応する特徴ベクトルを特定することと、
各シーケンス行列に対応する特徴ベクトルを第２の初期トレーニングモデルに入力し、各シーケンス行列に対応するドメイン名識別結果を得ることと、
逆伝播アルゴリズムにより、各シーケンス行列に対応するドメイン名識別結果を利用し、前記第１の初期トレーニングモデルに含まれる前記第１の重み行列と、前記第２の重み行列と、前記第３の重み行列と、前記第１のオフセットパラメータと、前記第２のオフセットパラメータと、前記第３のオフセットパラメータとを調整して、前記ドメイン名特徴分析モデルを得ることと、
逆伝播アルゴリズムにより、各シーケンス行列に対応するドメイン名識別結果を利用し、前記第２の初期トレーニングモデルを調整して、前記ドメイン名分類モデルを得ることと、
を実行させる、請求項１３に記載のネットワーク装置。