CN111405081A - 基于决策树的dns调整方法、装置、计算机设备和存储介质 - Google Patents

基于决策树的dns调整方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111405081A
CN111405081A CN202010176845.1A CN202010176845A CN111405081A CN 111405081 A CN111405081 A CN 111405081A CN 202010176845 A CN202010176845 A CN 202010176845A CN 111405081 A CN111405081 A CN 111405081A
Authority
CN
China
Prior art keywords
decision tree
attribute
splitting
sample data
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010176845.1A
Other languages
English (en)
Other versions
CN111405081B (zh
Inventor
崔宇童
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202010176845.1A priority Critical patent/CN111405081B/zh
Publication of CN111405081A publication Critical patent/CN111405081A/zh
Application granted granted Critical
Publication of CN111405081B publication Critical patent/CN111405081B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/45Network directories; Name-to-address mapping
    • H04L61/4505Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols
    • H04L61/4511Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols using domain name system [DNS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种基于决策树的DNS调整方法、装置、计算机设备和存储介质,所述方法包括:获取实时网络数据;输入所述实时网络数据至加权决策树模型中,输出目标分类结果,所述加权决策树模型为多个样本数据根据影响网络质量的属性基于决策树算法生成,所述加权决策树模型中的每个属性按照影响网络质量程度对应不同的权值,并通过所述目标分类结果进行DNS调整。将实时网络数据输入至加权决策树,基于加权决策树按照影响网络质量的属性进行决策输出目标分类结果,按照所述目标分类结果进行DNS解析调整,为用户提供多个实时网络数据中网络质量最优的IP地址。

Description

基于决策树的DNS调整方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种基于决策树的DNS调整方法、装置、计算机设备和存储介质。
背景技术
域名通过DNS解析为IP地址,通常我们要根据就近访问原则,人工在不同地区为域名绑定访问质量最优的IP地址。由于服务地址可能有多个IP地址可选择,而各地区到这些IP地址的连通质量受实时网络状况影响,DNS的最优解往往会发生动态变化,因此很难通过人工运维的方式保证DNS解析结果达到实时最优,无法实时为用户提供网络质量最优的IP地址。
发明内容
为了解决上述技术问题,本申请提供了一种基于决策树的DNS调整方法、装置、计算机设备和存储介质。
第一方面,本实施例提供了一种基于决策树的DNS调整方法,所述方法包括:
获取实时网络数据;
输入所述实时网络数据至加权决策树模型中,输出目标分类结果,所述加权决策树模型为多个样本数据根据影响网络质量的属性基于决策树算法生成,所述加权决策树模型中的每个属性按照影响网络质量程度对应不同的权值,并通过所述目标分类结果进行DNS调整。
可选地,所述生成加权决策树模型,包括:
获取当前分裂节点的所有样本数据;
基于决策树算法将当前分裂节点的所有样本数据进行类别统计,得到当前分裂节点的类别信息熵;
若当前分裂节点的类别信息熵不为零时,对当前分裂节点的每个所述样本数据中多个影响网络质量的属性分别进行加权处理,得到每个属性对应的权值,所述权值包括距离权值和参照权值;
根据所述每个属性对应的距离权值和参照权值生成对应的信息熵;
将每个属性对应的所述信息熵与类别信息熵进行差值计算,生成对应的信息增益;
根据当前分裂节点所有属性的信息增益确定当前分裂点的分裂属性,将当前分裂点的所有样本数据按照当前分裂点的分裂属性进行分类,得到下一分裂节点;
在下一分裂节点重新根据下一分裂节点的样本数据确定分裂属性,若下一分裂节点得到的类别信息熵为零时,停止属性分类,生成所述加权决策树模型。
可选地,所述对当前分裂节点的每个所述样本数据中多个影响网络质量的属性分别进行加权处理,包括:
计算每个所述样本数据与预设目标数据之间的标准欧式距离;
根据所述标准欧式距离生成每个属性对应的距离权值;
根据网络质量影响程度设置每个属性的参照权值,根据所有属性的参照权值之和生成总权值。
可选地,所述方法还包括:
当连续预设次数输出的目标分类结果与当前连接的网络数据不同时,进行DNS调整。
可选地,所述生成样本数据,包括:
获取多个历史网络数据;
将所有历史网络数据按照衡量因素构造为对应的向量数据,所述衡量因素包括多个影响网络质量的属性;
将所述向量数据进行归一化计算,得到对应的样本数据。
第二方面,本实施例提供了一种基于决策树的DNS调整装置,所述装置包括:
数据获取模块,用于获取实时网络数据;
决策模块,用于输入所述实时网络数据至加权决策树模型中,输出目标分类结果,所述加权决策树模型为多个样本数据根据影响网络质量的属性基于决策树算法生成,所述加权决策树模型中的每个属性按照影响网络质量程度对应不同的权值,并通过所述目标分类结果进行DNS调整。
可选地,所述决策模块模型生成模块,所述模型生成模块包括:
样本获取单元,用于获取当前分裂节点的所有样本数据;
统计单元,用于基于决策树算法将当前分裂节点的所有样本数据进行类别统计,得到当前分裂节点的类别信息熵;
加权单元,用于若当前分裂节点的类别信息熵不为零时,对当前分裂节点的每个所述样本数据中多个影响网络质量的属性分别进行加权处理,得到每个属性对应的权值,所述权值包括距离权值和参照权值;
信息熵生成单元,用于根据所述每个属性对应的距离权值和参照权值生成对应的信息熵;
增益生成单元,用于将每个属性对应的所述信息熵与类别信息熵进行差值计算,生成对应的信息增益;
分类单元,用于根据当前分裂节点所有属性的信息增益确定当前分裂点的分裂属性,将当前分裂点的所有样本数据按照当前分裂点的分裂属性进行分类,得到下一分裂节点;
决策生成单元,在下一分裂节点重新根据下一分裂节点的样本数据确定分裂属性,若下一分裂节点得到的类别信息熵为零时,停止属性分类,生成加权决策树模型。
可选地,所述加权单元包括:
距离计算单元,用于计算每个所述样本数据与预设目标数据之间的标准欧式距离;
距离权值生成单元,用于根据所述标准欧式距离生成每个属性对应的距离权值;
参照权值设置单元,用于根据网络质量影响程度设置每个属性的参照权值,根据所有属性的参照权值之和生成总权值。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取实时网络数据;
输入所述实时网络数据至加权决策树模型中,输出目标分类结果,所述加权决策树模型为多个样本数据根据影响网络质量的属性基于决策树算法生成,所述加权决策树模型中的每个属性按照影响网络质量程度对应不同的权值,并通过所述目标分类结果进行DNS调整。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取实时网络数据;
输入所述实时网络数据至加权决策树模型中,输出目标分类结果,所述加权决策树模型为多个样本数据根据影响网络质量的属性基于决策树算法生成,所述加权决策树模型中的每个属性按照影响网络质量程度对应不同的权值,并通过所述目标分类结果进行DNS调整。
上述基于决策树的DNS调整方法、装置、计算机设备和存储介质,所述方法包括:获取实时网络数据;输入所述实时网络数据至加权决策树模型中,输出目标分类结果,所述加权决策树模型为多个样本数据根据影响网络质量的属性基于决策树算法生成,所述加权决策树模型中的每个属性按照影响网络质量程度对应不同的权值,并通过所述目标分类结果进行DNS调整。将实时网络数据输入至加权决策树,基于加权决策树按照影响网络质量的属性进行决策输出目标分类结果,按照所述目标分类结果进行DNS解析调整,为用户提供实时网络数据中网络质量最优的IP地址。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中基于决策树的DNS调整方法的应用环境图;
图2为一个实施例中一种基于决策树的DNS调整方法的流程示意图;
图3为一个实施例中一种生成加权决策树模型方法的流程示意图;
图4为一个实施例中一种基于决策树的DNS调整装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为一个实施例中基于决策树的DNS调整方法的应用环境图。参照图1,该基于决策树的DNS调整方法应用于基于决策树的DNS调整系统。该基于决策树的DNS调整系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,提供了一种基于决策树的DNS调整方法。本实施例主要以该方法应用于上述图1中的终端110(或服务器120)来举例说明。图2为一个实施例中一种基于决策树的DNS调整方法的流程示意图,参照图2,该基于决策树的DNS调整方法具体包括如下步骤:
步骤S210,获取实时网络数据。
步骤S220,输入所述实时网络数据至加权决策树模型中,输出目标分类结果,所述加权决策树模型为多个样本数据根据影响网络质量的属性基于决策树算法生成,所述加权决策树模型中的每个属性按照影响网络质量程度对应不同的权值,并通过所述目标分类结果进行DNS调整。
具体地,获取实时网络数据,所述实时网络数据包括多个影响网络质量的属性参数,将多个实时网络数据输入至加权决策树模型中进行决策,所述加权决策树模型是按照影响网络质量的属性基于决策树算法构建而成的,将延迟、丢包率等影响网络质量的属性按照影响网络质量的重要性进行加权处理,提高决策质量,获得多个实时网络数据各自网络质量的分类结果,即为目标分类结果,并以此为依据选择多个实时网络数据中受网络质量最好的网络数据,对其进行DNS解析,为用户提供多个实时网络数据中网络质量最好的IP地址。
在一个实施例中,图3为一个实施例中一种生成加权决策树模型方法的流程示意图,参照图3,生成加权决策树模型的方法具体包括如下步骤:
步骤S310,获取当前分裂节点的所有样本数据。
在本实施例中,当前分裂节点的样本数据为将上一分裂节点的样本数据按照分裂属性进行分类后的分类结果。
步骤S320,基于决策树算法将当前分裂节点的所有样本数据进行类别统计,得到当前分裂节点的类别信息熵。
在本实施例中,基于决策树算法对当前分裂节点的所有样本数据进行类别统计,得到当前分裂节点的类别信息熵Info(D),即判断样本数据的类别为纯还是不纯,当样本数据的类别为纯时,即类别信息熵为0,则无法对当前分裂节点的所有样本数据进行分类,即为决策树的叶子节点;当样本数据的类别为不纯时,则可继续对当前分裂节点的所有样本数据按照属性特征进行分类,类别信息熵越大,决策结果的不确定性就越大。
步骤S330,若当前分裂节点的类别信息熵不为零时,对当前分裂节点的每个所述样本数据中多个影响网络质量的属性分别进行加权处理,得到每个属性对应的权值,所述权值包括距离权值和参照权值。
在本实施例中,若当前分裂节点的类别信息熵不为零时,证明当前分裂节点的样本数据还可继续进行分类,将延迟、丢包率等影响网络质量的属性按照影响网络质量的重要性进行加权处理,以此提高决策质量,属性A对应的权值包括距离权值λA和参照权值DA,所述距离权值为根据实际数据与预设目标数据之间的差值计算得出的权值,所述参照权值为按照属性影响网络质量的程度设置的权值。
步骤S340,根据所述每个属性对应的距离权值和参照权值生成对应的信息熵。
在本实施例中,计算每个属性对应的信息熵的公式如下:
Figure BDA0002411114360000081
其中,n为当前分裂节点的所有样本数据的数量,i为样本数据的编号,Dsum为所有属性的参照权值总和。
步骤S350,将每个属性对应的所述信息熵与类别信息熵进行差值计算,生成对应的信息增益。
在本实施例中,每个属性对应的信息增益为:
Gain(A)*=Info(D)-InfoAt(D)*
步骤S360,根据当前分裂节点所有属性的信息增益确定当前分裂点的分裂属性,将当前分裂点的所有样本数据按照当前分裂点的分裂属性进行分类,得到下一分裂节点。
在本实施例中,选择信息增益最大的属性作为当前分裂节点的分裂属性,并按照分裂属性的属性特征进行分类,得到下一分裂节点。例如按照丢包率的信息增益大于延迟的信息增益,则选择丢包率作为当前分裂节点的分裂属性,将样本数据按照丢包率的属性特征进行分类,例如将样本数据按照丢包率是否大于30%进行分类。
步骤S370,在下一分裂节点重新根据下一分裂节点的样本数据确定分裂属性,若下一分裂节点得到的类别信息熵为零时,停止属性分类,生成所述加权决策树模型。
在本实施例中,即在下一分裂节点重新进行步骤S310至步骤S370的过程,但若在下一分裂节点计算得到的类别信息熵为0时,则无法对下一分裂节点的所有样本数据进行分类,表示下一分裂节点为决策树的叶子节点。在每一个分裂节点按照上述步骤S310至步骤S370进行决策,生成加权决策树。
在一个实施例中,计算每个所述样本数据与预设目标数据之间的标准欧式距离。
所述预设目标数据为理想状态下网络质量最佳的向量数据,例如预设目标数据为t=(0ms,0%),其中0ms代表网络延迟,0%代表丢包率,根据预设目标数据计算每个属性对应的标准欧式距离dA为:
Figure BDA0002411114360000091
其中,s为标准差,n为当前分裂节点的所有样本数据的数量,i为每个样本数据的编号。
根据所述标准欧式距离生成每个属性对应的距离权值为:
Figure BDA0002411114360000092
根据网络质量影响程度设置每个属性的参照权值,根据所有属性的参照权值之和生成总权值。
例如根据网络质量影响程度设置延迟的参照权值为D1=1,丢包率的参照权值为D2=4,则总权值为Dsum=5,使决策树根据影响网络质量的属性权值进行决策,输出目标分类结果,提供网络质量最优的解析结果。
在一个实施例中,当连续预设次数输出的目标分类结果与当前连接的网络数据不同时,进行DNS调整。
具体地,例如预设次数为三次,仅当连续三次输出的分类结果显示需要更改绑定地址时,再进行DNS调整,避免网络的瞬时影响就进行DNS调整,避免增加网络连接的不确定性。
在一个实施例中,获取多个历史网络数据;将所有历史网络数据按照衡量因素构造为对应的向量数据,所述衡量因素包括多个影响网络质量的属性;将所述向量数据进行归一化计算,得到对应的样本数据。
具体地,所述衡量因素包括如网络延迟、丢包率等影响网络质量的属性,将所有历史网络数据按照衡量因素进行预处理,将所有历史网络数据构造形如X=(20ms,0%)的向量数据,其中20ms代表网络延迟,0%代表丢包率,再将构造好的向量数据按照衡量因素进行归一化处理,得到形如X′=(X-Xmin)/(Xmax-Xmin)的样本数据,将所有样本数据限定在指定范围内,便于后续将样本数据根据衡量因素构建加权决策树模型。
图2为一个实施例中一种基于决策树的DNS调整方法的流程示意图,图3为一个实施例中一种生成加权决策树模型方法的流程示意图,应该理解的是,虽然图2和图3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,图4为一个实施例中一种基于决策树的DNS调整装置的结构框图,参照图4,本实施例提供了一种基于决策树的DNS调整装置,所述装置包括:
数据获取模块410,用于获取实时网络数据;
决策模块420,用于输入所述实时网络数据至加权决策树模型中,输出目标分类结果,所述加权决策树模型为多个样本数据根据影响网络质量的属性基于决策树算法生成,所述加权决策树模型中的每个属性按照影响网络质量程度对应不同的权值,并通过所述目标分类结果进行DNS调整。
在一个实施例中,所述决策模块420模型生成模块,所述模型生成模块包括:
样本获取单元,用于获取当前分裂节点的所有样本数据;
统计单元,用于基于决策树算法将当前分裂节点的所有样本数据进行类别统计,得到当前分裂节点的类别信息熵;
加权单元,用于若当前分裂节点的类别信息熵不为零时,对当前分裂节点的每个所述样本数据中多个影响网络质量的属性分别进行加权处理,得到每个属性对应的权值,所述权值包括距离权值和参照权值;
信息熵生成单元,用于根据所述每个属性对应的距离权值和参照权值生成对应的信息熵;
增益生成单元,用于将每个属性对应的所述信息熵与类别信息熵进行差值计算,生成对应的信息增益;
分类单元,用于根据当前分裂节点所有属性的信息增益确定当前分裂点的分裂属性,将当前分裂点的所有样本数据按照当前分裂点的分裂属性进行分类,得到下一分裂节点;
决策生成单元,在下一分裂节点重新根据下一分裂节点的样本数据确定分裂属性,若下一分裂节点得到的类别信息熵为零时,停止属性分类,生成加权决策树模型。
在一个实施例中,所述加权单元包括:
距离计算单元,用于计算每个所述样本数据与预设目标数据之间的标准欧式距离;
距离权值生成单元,用于根据所述标准欧式距离生成每个属性对应的距离权值;
参照权值设置单元,用于根据网络质量影响程度设置每个属性的参照权值,根据所有属性的参照权值之和生成总权值。
在一个实施例中,所述装置还包括:
预设调整模块,用于当连续预设次数输出的目标分类结果与当前连接的网络数据不同时,进行DNS调整。
在一个实施例中,所述装置还包括预处理模块,所述预处理模块包括:
样本获取单元,用于获取多个历史网络数据;
向量构造单元,用于将所有历史网络数据按照衡量因素构造为对应的向量数据,所述衡量因素包括多个影响网络质量的属性;
归一化单元,用于将所述向量数据进行归一化计算,得到对应的样本数据。
图5示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110(或服务器120)。如图5所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现基于决策树的DNS调整方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行基于决策树的DNS调整方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的基于决策树的DNS调整装置可以实现为一种计算机程序的形式,计算机程序可在如图5所示的计算机设备上运行。计算机设备的存储器中可存储组成该基于决策树的DNS调整装置的各个程序模块,比如,图4所示的数据获取模块410和决策模块420。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的基于决策树的DNS调整方法中的步骤。
例如,图5所示的计算机设备可以通过如图4所示的基于决策树的DNS调整装置中的数据获取模块410执行获取实时网络数据。计算机设备可通过决策模块420执行输入所述实时网络数据至加权决策树模型中,输出目标分类结果,所述加权决策树模型为多个样本数据根据影响网络质量的属性基于决策树算法生成,所述加权决策树模型中的每个属性按照影响网络质量程度对应不同的权值,并通过所述目标分类结果进行DNS调整。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
获取实时网络数据;
输入所述实时网络数据至加权决策树模型中,输出目标分类结果,所述加权决策树模型为多个样本数据根据影响网络质量的属性基于决策树算法生成,所述加权决策树模型中的每个属性按照影响网络质量程度对应不同的权值,并通过所述目标分类结果进行DNS调整。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取当前分裂节点的所有样本数据;基于决策树算法将当前分裂节点的所有样本数据进行类别统计,得到当前分裂节点的类别信息熵;若当前分裂节点的类别信息熵不为零时,对当前分裂节点的每个所述样本数据中多个影响网络质量的属性分别进行加权处理,得到每个属性对应的权值,所述权值包括距离权值和参照权值;根据所述每个属性对应的距离权值和参照权值生成对应的信息熵;将每个属性对应的所述信息熵与类别信息熵进行差值计算,生成对应的信息增益;根据当前分裂节点所有属性的信息增益确定当前分裂点的分裂属性,将当前分裂点的所有样本数据按照当前分裂点的分裂属性进行分类,得到下一分裂节点;在下一分裂节点重新根据下一分裂节点的样本数据确定分裂属性,若下一分裂节点得到的类别信息熵为零时,停止属性分类,生成所述加权决策树模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:计算每个所述样本数据与预设目标数据之间的标准欧式距离;根据所述标准欧式距离生成每个属性对应的距离权值;根据网络质量影响程度设置每个属性的参照权值,根据所有属性的参照权值之和生成总权值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当连续预设次数输出的分类结果与当前连接的网络数据不同时,进行DNS调整。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取多个历史网络数据;将所有历史网络数据按照衡量因素构造为对应的向量数据,所述衡量因素包括多个影响网络质量的属性;将所述向量数据进行归一化计算,得到对应的样本数据。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取实时网络数据;
输入所述实时网络数据至加权决策树模型中,输出目标分类结果,所述加权决策树模型为多个样本数据根据影响网络质量的属性基于决策树算法生成,所述加权决策树模型中的每个属性按照影响网络质量程度对应不同的权值,并通过所述目标分类结果进行DNS调整。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取当前分裂节点的所有样本数据;基于决策树算法将当前分裂节点的所有样本数据进行类别统计,得到当前分裂节点的类别信息熵;若当前分裂节点的类别信息熵不为零时,对当前分裂节点的每个所述样本数据中多个影响网络质量的属性分别进行加权处理,得到每个属性对应的权值,所述权值包括距离权值和参照权值;根据所述每个属性对应的距离权值和参照权值生成对应的信息熵;将每个属性对应的所述信息熵与类别信息熵进行差值计算,生成对应的信息增益;根据当前分裂节点所有属性的信息增益确定当前分裂点的分裂属性,将当前分裂点的所有样本数据按照当前分裂点的分裂属性进行分类,得到下一分裂节点;在下一分裂节点重新根据下一分裂节点的样本数据确定分裂属性,若下一分裂节点得到的类别信息熵为零时,停止属性分类,生成所述加权决策树模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:计算每个所述样本数据与预设目标数据之间的标准欧式距离;根据所述标准欧式距离生成每个属性对应的距离权值;根据网络质量影响程度设置每个属性的参照权值,根据所有属性的参照权值之和生成总权值。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当连续预设次数输出的分类结果与当前连接的网络数据不同时,进行DNS调整。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取多个历史网络数据;将所有历史网络数据按照衡量因素构造为对应的向量数据,所述衡量因素包括多个影响网络质量的属性;将所述向量数据进行归一化计算,得到对应的样本数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于决策树的DNS调整方法,其特征在于,所述方法包括:
获取实时网络数据;
输入所述实时网络数据至加权决策树模型中,输出目标分类结果,所述加权决策树模型为多个样本数据根据影响网络质量的属性基于决策树算法生成,所述加权决策树模型中的每个属性按照影响网络质量程度对应不同的权值,并通过所述目标分类结果进行DNS调整。
2.根据权利要求1所述的方法,其特征在于,所述生成加权决策树模型,包括:
获取当前分裂节点的所有样本数据;
基于决策树算法将当前分裂节点的所有样本数据进行类别统计,得到当前分裂节点的类别信息熵;
若当前分裂节点的类别信息熵不为零时,对当前分裂节点的每个所述样本数据中多个影响网络质量的属性分别进行加权处理,得到每个属性对应的权值,所述权值包括距离权值和参照权值;
根据所述每个属性对应的距离权值和参照权值生成对应的信息熵;
将每个属性对应的所述信息熵与类别信息熵进行差值计算,生成对应的信息增益;
根据当前分裂节点所有属性的信息增益确定当前分裂点的分裂属性,将当前分裂点的所有样本数据按照当前分裂点的分裂属性进行分类,得到下一分裂节点;
在下一分裂节点重新根据下一分裂节点的样本数据确定分裂属性,若下一分裂节点得到的类别信息熵为零时,停止属性分类,生成所述加权决策树模型。
3.根据权利要求2所述的方法,其特征在于,所述对当前分裂节点的每个所述样本数据中多个影响网络质量的属性分别进行加权处理,包括:
计算每个所述样本数据与预设目标数据之间的标准欧式距离;
根据所述标准欧式距离生成每个属性对应的距离权值;
根据网络质量影响程度设置每个属性的参照权值,根据所有属性的参照权值之和生成总权值。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当连续预设次数输出的目标分类结果与当前连接的网络数据不同时,进行DNS调整。
5.根据权利要求1所述的方法,其特征在于,所述生成样本数据,包括:
获取多个历史网络数据;
将所有历史网络数据按照衡量因素构造为对应的向量数据,所述衡量因素包括多个影响网络质量的属性;
将所述向量数据进行归一化计算,得到对应的样本数据。
6.一种基于决策树的DNS调整装置,其特征在于,所述装置包括:
数据获取模块,用于获取实时网络数据;
决策模块,用于输入所述实时网络数据至加权决策树模型中,输出目标分类结果,所述加权决策树模型为多个样本数据根据影响网络质量的属性基于决策树算法生成,所述加权决策树模型中的每个属性按照影响网络质量程度对应不同的权值,并通过所述目标分类结果进行DNS调整。
7.根据权利要求6所述的装置,其特征在于,所述决策模块模型生成模块,所述模型生成模块包括:
样本获取单元,用于获取当前分裂节点的所有样本数据;
统计单元,用于基于决策树算法将当前分裂节点的所有样本数据进行类别统计,得到当前分裂节点的类别信息熵;
加权单元,用于若当前分裂节点的类别信息熵不为零时,对当前分裂节点的每个所述样本数据中多个影响网络质量的属性分别进行加权处理,得到每个属性对应的权值,所述权值包括距离权值和参照权值;
信息熵生成单元,用于根据所述每个属性对应的距离权值和参照权值生成对应的信息熵;
增益生成单元,用于将每个属性对应的所述信息熵与类别信息熵进行差值计算,生成对应的信息增益;
分类单元,用于根据当前分裂节点所有属性的信息增益确定当前分裂点的分裂属性,将当前分裂点的所有样本数据按照当前分裂点的分裂属性进行分类,得到下一分裂节点;
决策生成单元,在下一分裂节点重新根据下一分裂节点的样本数据确定分裂属性,若下一分裂节点得到的类别信息熵为零时,停止属性分类,生成加权决策树模型。
8.根据权利要求7所述的装置,其特征在于,所述加权单元包括:
距离计算单元,用于计算每个所述样本数据与预设目标数据之间的标准欧式距离;
距离权值生成单元,用于根据所述标准欧式距离生成每个属性对应的距离权值;
参照权值设置单元,用于根据网络质量影响程度设置每个属性的参照权值,根据所有属性的参照权值之和生成总权值。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
CN202010176845.1A 2020-03-13 2020-03-13 基于决策树的dns调整方法、装置、计算机设备和存储介质 Active CN111405081B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010176845.1A CN111405081B (zh) 2020-03-13 2020-03-13 基于决策树的dns调整方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010176845.1A CN111405081B (zh) 2020-03-13 2020-03-13 基于决策树的dns调整方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN111405081A true CN111405081A (zh) 2020-07-10
CN111405081B CN111405081B (zh) 2023-03-17

Family

ID=71413414

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010176845.1A Active CN111405081B (zh) 2020-03-13 2020-03-13 基于决策树的dns调整方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN111405081B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113269179A (zh) * 2021-06-24 2021-08-17 中国平安人寿保险股份有限公司 数据处理方法、装置、设备及存储介质
CN113660687A (zh) * 2021-08-17 2021-11-16 中国联合网络通信集团有限公司 网络差小区处理方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104125106A (zh) * 2013-04-23 2014-10-29 中国银联股份有限公司 基于分类决策树的网络纯净性检测装置及方法
CN104836732A (zh) * 2015-03-31 2015-08-12 清华大学 网络连接的自动选择方法及系统
CN107154959A (zh) * 2016-03-02 2017-09-12 阿里巴巴集团控股有限公司 一种访问网络地址的方法与设备
CN110445653A (zh) * 2019-08-12 2019-11-12 灵长智能科技(杭州)有限公司 网络状态预测方法、装置、设备及介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104125106A (zh) * 2013-04-23 2014-10-29 中国银联股份有限公司 基于分类决策树的网络纯净性检测装置及方法
CN104836732A (zh) * 2015-03-31 2015-08-12 清华大学 网络连接的自动选择方法及系统
CN107154959A (zh) * 2016-03-02 2017-09-12 阿里巴巴集团控股有限公司 一种访问网络地址的方法与设备
CN110445653A (zh) * 2019-08-12 2019-11-12 灵长智能科技(杭州)有限公司 网络状态预测方法、装置、设备及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
单康康 等: "《基于混合分类算法模型的DNS 隧道检测》", 《通信学报》 *
张琼声 等: "《一种基于属性加权的决策树算法》", 《微计算机应用》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113269179A (zh) * 2021-06-24 2021-08-17 中国平安人寿保险股份有限公司 数据处理方法、装置、设备及存储介质
CN113269179B (zh) * 2021-06-24 2024-04-05 中国平安人寿保险股份有限公司 数据处理方法、装置、设备及存储介质
CN113660687A (zh) * 2021-08-17 2021-11-16 中国联合网络通信集团有限公司 网络差小区处理方法、装置、设备及存储介质
CN113660687B (zh) * 2021-08-17 2023-07-04 中国联合网络通信集团有限公司 网络差小区处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN111405081B (zh) 2023-03-17

Similar Documents

Publication Publication Date Title
CN111369342B (zh) 基于机器学习的贷款审批方法、装置、设备和存储介质
CN111405081B (zh) 基于决策树的dns调整方法、装置、计算机设备和存储介质
TW201928709A (zh) 對模型預測值進行融合的方法、裝置和設備
Andrés et al. Linkages between Formal Institutions, ICT Adoption, and inclusive human development in sub-Saharan Africa
CN107305611B (zh) 恶意账号对应的模型建立方法和装置、恶意账号识别的方法和装置
CN110888911A (zh) 样本数据处理方法、装置、计算机设备及存储介质
CN112101674B (zh) 基于群智能算法资源配置匹配方法、装置、设备及介质
CN113420204B (zh) 目标用户确定方法、装置、电子设备及存储介质
CN113536139B (zh) 基于兴趣的内容推荐方法、装置、计算机设备及存储介质
CN110880014A (zh) 数据处理方法、装置、计算机设备及存储介质
JP2019016239A (ja) 学習プログラム、学習方法及び学習装置
CN115115004A (zh) 决策树模型构建及应用方法、装置和相关设备
CN113157898B (zh) 候选问题的推荐方法、装置、计算机设备及存储介质
CN111652712B (zh) 基于地理信息的贷前分析方法、装置、设备与存储介质
JP6680663B2 (ja) 情報処理装置、情報処理方法、予測モデルの生成装置、予測モデルの生成方法、およびプログラム
CN114331388B (zh) 基于联邦学习的薪资计算方法、装置、设备及存储介质
JP2019200510A (ja) 予測システム、及び、予測方法
CN114510627A (zh) 对象推送方法、装置、电子设备及存储介质
CN111260435A (zh) 多因子权重赋值修正方法、装置、计算机设备和存储介质
CN112070593B (zh) 数据处理方法、装置、设备以及存储介质
CN112506423A (zh) 一种云储存系统中动态接入存储设备的方法及装置
CN116226527B (zh) 通过居民大数据实现行为预测的数字化社区治理方法
CN111190940B (zh) 用户访问的离散数据处理方法、装置、设备及介质
CN113365095B (zh) 直播资源推荐方法、装置、电子设备以及存储介质
Tang et al. Grey Weighted QoS Evaluation based on Real-Time Scene

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant