CN115952411B - 一种前端界面的动态语言反混淆特征提取方法及提取系统 - Google Patents

一种前端界面的动态语言反混淆特征提取方法及提取系统 Download PDF

Info

Publication number
CN115952411B
CN115952411B CN202310238378.4A CN202310238378A CN115952411B CN 115952411 B CN115952411 B CN 115952411B CN 202310238378 A CN202310238378 A CN 202310238378A CN 115952411 B CN115952411 B CN 115952411B
Authority
CN
China
Prior art keywords
binary
sentences
characters
character
dimensional matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310238378.4A
Other languages
English (en)
Other versions
CN115952411A (zh
Inventor
王洪哲
关锋
丁兆俊
王克照
秦漫
叶海峰
曲金凤
潘昭雄
胡鹏濠
蔡静静
易洪
郭伟钧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yousheng Boda Software Co ltd
Original Assignee
Beijing Yousheng Boda Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yousheng Boda Software Co ltd filed Critical Beijing Yousheng Boda Software Co ltd
Priority to CN202310238378.4A priority Critical patent/CN115952411B/zh
Publication of CN115952411A publication Critical patent/CN115952411A/zh
Application granted granted Critical
Publication of CN115952411B publication Critical patent/CN115952411B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种前端界面的动态语言反混淆特征提取方法及提取系统,包括步骤1、逐个字符提取脚本信息中的二元语句,并将二元语句的字符转换为标准代码语言的编码字符;步骤2、建立一个横坐标与纵坐标均包含全部标准代码语言的二维矩阵,根据编码字符将二元语句填入二维矩阵内;步骤3、根据二元语句的坐标值将出现频次填入二维矩阵内;步骤4、对二维矩阵进行归一化处理,得到特征矩阵。本发明一种前端界面的动态语言反混淆特征提取方法及提取系统,其结合标准编码信息将无限的自然语言转换为有限的标准编码信息,并建立二维矩阵,再将二维矩阵由字符型矩阵转换为数值型矩阵,便于简化矩阵特征,最终得到一个可由智能端学习的简易的特征矩阵。

Description

一种前端界面的动态语言反混淆特征提取方法及提取系统
技术领域
本发明实施例涉及信息处理技术领域,具体涉及一种前端界面的动态语言反混淆特征提取方法及提取系统。
背景技术
前端防御需要甄别请求的内容中是否有违规的SQL注入或者JS方法的调用,但是随着防御能力的提升,进攻者的方式也更加隐蔽。进攻者会在自己的进攻请求脚本中利用各种混淆技术加密自己的进攻脚本并自带解密算法。待请求被通过执行时,该请求会先利用自带的解密算法去解密自己的混淆脚本然后再利用脚本进行攻击。此种方法在一定程度上逃避了网络请求的初次过滤,类似一种病毒,只有在到一定阶段才开始自我展开并实行攻击。
从应用安全的角度考虑,最重要的一步就是要获知对方使用了脚本混淆技术,然后才可以进一步采取措施。由于市面上的脚本混淆技术和数据加解密技术数不胜数,根本无法在一套系统中穷尽所有的可能,所以考虑利用机器学习的方法去研究所有混淆脚本的特征,从而让机器积累经验代替人类去进行判断。
发明内容
为此,本发明实施例提供一种前端界面的动态语言反混淆特征提取方法及提取系统,以解决现有技术中由于脚本混淆技术和数据加解密技术数不胜数,而导致的无法在一套系统中穷尽所有脚本识别技术的问题。
为了实现上述目的,本发明实施例提供如下技术方案:
一种前端界面的动态语言反混淆特征提取方法,包括以下步骤:
步骤S01、逐个字符提取脚本信息中的二元语句,并将二元语句的字符转换为标准代码语言的编码字符,记录二元语句的出现频次。
步骤S02、建立一个横坐标与纵坐标均包含全部标准代码语言的二维矩阵,根据编码字符将二元语句填入二维矩阵内。
步骤S03、根据二元语句的坐标将二元语句的出现频次填入二维矩阵内,替换二元语句的坐标值。
步骤S04、对二维矩阵进行归一化处理,得到特征矩阵。
进一步的,所述逐个字符提取脚本信息中的二元语句包括先删除非文字字符,然后逐个字符提取脚本信息的二元语句;或者,在逐个字符提取脚本信息的过程中,若字符后遇到非文字字符,则二元语句直接跳过该非文字字符,与非文字字符后第一位的字符组成二元语句;或者,在逐个字符提取脚本信息的过程中,若字符后遇到非文字字符,则放弃该字符,跳到非文字字符后的第一个字符后开始逐个字符提取二元语句。
进一步的,所述标准代码语言为ASCII、UTF-8、UTF-16、UTF-32、ANSI、Unicode 中的任意一种。
进一步的,所述根据编码字符将二元语句填入二维矩阵内包括将二元语句的第一个字符的取值设为X轴坐标值,二元语句中第二个字符的取值设为Y轴坐标值;或者,将二元语句的第一个字符的取值设为Y轴坐标值,二元语句中第二个字符的取值设为X轴坐标值。
进一步的,所述步骤S02之后,对所述二维矩阵进行简化,简化方法包括计算每个二元语句的熵值,筛选掉熵值不满足筛选标准的二元语句,得到简化后的二维矩阵。
进一步的,所述二元语句的熵值E(x)的计算公式如下:
Figure SMS_1
上式中:
H(C)为系统原本的熵,具体计算如下:
Figure SMS_2
C为所有文档;
Figure SMS_3
为文档/>
Figure SMS_4
出现的概率,n=2,/>
Figure SMS_5
为正常文档,/>
Figure SMS_6
为混淆文档;
Figure SMS_7
为固定特征X后的条件熵,具体计算如下:
Figure SMS_8
上式中:
P(x)为二元语句x出现的概率;
Figure SMS_9
为二元语句x没有出现的概率;
Figure SMS_10
为出现二元语句x的熵值,即/>
Figure SMS_11
Figure SMS_12
为/>
Figure SMS_13
中出现二元语句/>
Figure SMS_14
的频率;
Figure SMS_15
为没有出现二元语句x的熵值,即/>
Figure SMS_16
,/>
Figure SMS_17
为/>
Figure SMS_18
中没有出现二元语句x的频率。
进一步的,所述步骤S03中对脚本信息进行窗口滑动,逐个字符的采集二元语句,建立二元语句与出现频次的键值对,以二元语句的字符为键,出现频次为值,每次采集二元语句均会对比已建立的全部键值对;若出现相同的二元语句,则计入所述二元语句的键值对的值中,即值+1;若未出现相同的二元语句,则建立新的键值对。
进一步的,所述归一化处理包括二维矩阵中每行的坐标值求和,得到行和值,然后将本行中每个坐标值均除以行和值,得到一个小于1的坐标值,转换完成后,每一行坐标值的加和均为1;或者,二维矩阵中每列的坐标值求和,得到列和值,然后将本列中每个坐标值均除以列和值,得到一个小于1的坐标值,转换完成后,每一列坐标值的加和均为1。
一种前端界面的动态语言反混淆特征提取系统,包括以下模块:
二元语句提取模块,用于逐个字符提取脚本信息中的二元语句,其连接标准编码信息数据库,从标准编码信息数据库中调取标准编码信息,将二元语句的字符转换为标准代码语言的编码字符,采集二元语句的出现频次。
频次采集模块,用于采集二元语句的出现频次,计算全部二元语句的出现频次总和,计算二元语句位于出现频次总和的占比,即计算二元语句的出现频率。
二维矩阵建立模块,其连接标准编码信息数据库,建立一个横坐标与纵坐标均包含全部标准代码语言的二维矩阵,根据编码字符将二元语句填入二维矩阵内,或者将二元语句的出现频次填入二维矩阵内,并对二维矩阵进行归一化处理,得到特征矩阵。
本发明实施例具有如下优点:
本发明实施例所述的一种前端界面的动态语言反混淆特征提取方法及提取系统,其结合标准编码信息将无限的自然语言转换为有限的标准编码信息,根据标准编码信息建立二维矩阵,再根据二元语句的出现频次,将二维矩阵由字符型矩阵转换为数值型矩阵,便于简化矩阵特征,最终得到一个可由智能端学习的简易的特征矩阵。
本发明实施例所述的一种前端界面的动态语言反混淆特征提取方法及提取系统通过对二元语句的出现频次的分析,确定二元语句对于脚本信息的重要性的熵值,并通过信息增益过滤的方法,过滤掉不满足标准的二元语句,实现对二维矩阵的缩减化,可通过调整过滤标准,将二维矩阵缩减到任意大小,大幅度减少本发明技术处理的数据量,减少错误率,提高系统运行效率。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。
图1为本发明实施例1提供的一种前端界面的动态语言反混淆特征提取方法的方法流程图;
图2为本发明实施例2提供的一种前端界面的动态语言反混淆特征提取系统的系统结构图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1所示,本实施例所述的一种前端界面的动态语言反混淆特征提取方法,包括以下步骤:
步骤S01、逐个字符提取脚本信息中的二元语句,并将二元语句的字符转换为标准代码语言的编码字符。
所述逐个字符提取脚本信息中的二元语句,其中删除空格、标点符号等非文字字符。具体的,先删除非文字字符,以中文为例,脚本信息为“我爱你,中国!”,先删除非文字字符“,”与“!”,得到“我爱你中国”,然后逐个字符提取脚本信息的二元语句,即“我爱”、“爱你”、“你中”、“中国”;或者,在逐个字符提取脚本信息的过程中,若字符后遇到非文字字符,则二元语句直接跳过该非文字字符,与非文字字符后第一位的字符组成二元语句;或者在逐个字符提取脚本信息的过程中,若字符后遇到非文字字符,则放弃该字符,跳到非文字字符后的第一个字符开始逐个字符提取二元语句。以英文为例,非文字字符的处理方式同前文所述,例如脚本信息为I LOVE YOU”,提取所述脚本信息的二元语句为“IL”、“LO ”、“OV”、“VE”、“EY”、“YO”、“OU”。
将二元语句的字符转换为标准代码语言的编码字符。具体包括根据ASCII、UTF-8、UTF-16、UTF-32、ANSI、Unicode 等标准代码语言对二元语句的两个字符分别进行编码,得到与二元语句的字符对应的编码字符。以ASCII语言为例,标准ASCII 码也叫标准ASCII(基础ASCII码),标准ASCII码用一个字节(8位)表示一个字符,并规定其最高位为0,实际只用到7位,码值为00000000~01111111,即 0~127,共 128 个不同字符。EASCII(ExtendedASCII,延伸美国标准信息交换码)扩展 ASCII 码用 8 位表示,最高位为 1,表示的码值范围为 10000000~11111111,即 128~255,共 128个不同字符。EASCII码比ASCII码扩充出来的符号包括表格符号、计算符号、希腊字母和特殊的拉丁符号,因此使用ASCII语言转换二元语句的字符,将得到的编码字符锁定在0-255的字符变化内,减少大量的字符种类,便于后续的数据处理。
在逐个字符提取脚本信息中二元语句的过程中记录二元语句的出现频次,可通过表格的方式或建立键值对的方式记录。
步骤S02、建立一个横坐标与纵坐标均包含全部标准代码语言的二维矩阵,根据编码字符将二元语句填入二维矩阵内。以ASCII语言为例,编码字符共包括256种字符变化,因此得到的二维矩阵为一个256*256的矩阵,其他标准编码语言同理。
本实施例中将二元语句的第一个字符的取值设为X轴坐标值,二元语句中第二个字符的取值设为Y轴坐标值,即二元语句的坐标为(x=第一字符的编码字符,y=第二字符的编码字符);反之,第一个字符的取值设为Y轴坐标值,二元语句中第二个字符的取值设为X轴坐标值。
步骤S02之后,可以简化该二维矩阵,将未出现的编码字符、出现频次较低的编码字符等易于混淆脚本的特征删除,以减少数据处理量,提高数据处理速度。所述简化方法为计算二元语句的熵值,筛选掉熵值低于筛选标准的二元语句,筛选标准如低于平均熵值,得到熵值较高的二元语句,其中熵值越高,则该二元语句的出现几率越大,该二元语句对于脚本信息的重要性越高。由于X轴与Y轴的坐标轴上均删减相同的编码字符,从而实现二维矩阵的成比例缩减,即X轴与Y轴的缩减量相同,在二维矩阵缩减的情况下保证了二维矩阵的形态不变。
如图2所示,所述二元语句x的熵值IG(X)为系统的熵值与固定特征X后的条件熵值之差,X代表出现二元语句x与没有出现二元语句
Figure SMS_19
,具体计算包括:
Figure SMS_20
上式中:
H(C)为系统原本的熵,具体计算如下:
Figure SMS_21
C为所有文档;
Figure SMS_22
为文档/>
Figure SMS_23
出现的概率,n=2,/>
Figure SMS_24
为正常文档,/>
Figure SMS_25
为混淆文档,由于已知的前端脚本代码只有正常和混淆,因此使用这两种集合的文档来计算特征矩阵的熵,相当于枚举了正常文档集合和混淆文档集合所有的可能性,这样就能对正常文档集合和混淆文档集合都进行判断,有利于缩小特征矩阵;
Figure SMS_26
为固定特征X后的条件熵,具体计算如下:
Figure SMS_27
上式中:
P(x)为二元语句x出现的概率;
Figure SMS_28
为二元语句x没有出现的概率;
Figure SMS_29
为二元语句x出现的熵值,即/>
Figure SMS_30
Figure SMS_31
为/>
Figure SMS_32
中出现二元语句/>
Figure SMS_33
的频率;
Figure SMS_34
为x没有出现的熵值,即/>
Figure SMS_35
Figure SMS_36
为/>
Figure SMS_37
中没有出现二元语句x的频率。
步骤S03、进行窗口滑动,采集二元语句的出现频次,根据二元语句的坐标值将出现频次填入二维矩阵内。
所述采集二元语句的出现频次包括对脚本信息进行窗口滑动,逐个字符的采集二元语句,建立二元语句与出现频次的键值对,以二元语句的字符为键,出现频次为值,每次采集二元语句均会对比已建立的全部键值对,若出现相同的二元语句,则计入所述二元语句的键值对的值中,即值+1;若未出现相同的二元语句,则建立新的键值对。当窗口滑动经过脚本信息内的全部字符后停止,根据键值对的键匹配二维矩阵内对应二元语句的坐标,将键值对的值填入该坐标内,得到一个全是数值的二维矩阵。本步骤中利用二元语句的显示频次,将全字符的二维矩阵转换为全数值的二维矩阵,实现二维矩阵由字符特征变化为数值特征,便于二维矩阵的特征简化。
步骤S04、对二维矩阵进行归一化处理,得到特征矩阵。所述归一化处理具体为二维矩阵中每行的坐标值求和,得到行和值,然后将本行中每个坐标值均除以行和值,得到一个小于1的坐标值,转换完成后,每一行坐标值的加和均为1;或者,二维矩阵中每列的坐标值求和,得到列和值,然后将本列中每个坐标值均除以列和值,得到一个小于1的坐标值,转换完成后,每一列坐标值的加和均为1。最后验证加和均为1后,形成的特征矩阵为一个马尔科夫字符矩阵,可作为CNN(卷积神经网络训练)模型的标准输入,用于智能机器学习的入参。模型输入后进行卷积、池化、全连接层,进行训练,可判断一个js脚本是否存在混淆特征,相对于现有基于代码层面的关键字和统计学进行分析的js混淆识别方法,本技术实现让CNN模型学习混淆和非混淆代码的特征,利用特殊算法提取代码特征向训练模型进行输入,解决了传统方法准确率低的问题。
本发明中马尔科夫矩阵认为每一个字符的出现只与其上一个字符出现有关,如二元语句“fu”所对应键值对的值为“f”后面出现“u”的频次;或者每一个字符的出现只与其下一个字符出现有关,如二元语句“fu”所对应键值对的值为“u”前面出现“f”的频次,而与其余的字符出现都没有关系。
实施例2
一种前端界面的动态语言反混淆特征提取系统,包括以下模块:
二元语句提取模块1,用于逐个字符提取脚本信息中的二元语句,并将二元语句的字符转换为标准代码语言的编码字符。
频次采集模块2,用于采集二元语句的出现频次,计算全部二元语句的出现频次总和,计算二元语句位于出现频次总和的占比,即计算二元语句的出现频率。
二维矩阵建立模块3,连接标准编码信息数据库4,建立一个横坐标与纵坐标均包含全部标准代码语言的二维矩阵,从标准编码信息数据库4中调取标准编码信息,将二元语句的字符转换为编码字符,并根据编码字符将二元语句填入二维矩阵内。或者将二元语句的出现频次填入二维矩阵内,并对二维矩阵进行归一化处理,得到特征矩阵。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (8)

1.一种前端界面的动态语言反混淆特征提取方法,其特征在于,包括以下步骤:
步骤S01、逐个字符提取脚本信息中的二元语句,并将二元语句的字符转换为标准代码语言的编码字符,记录二元语句的出现频次;
步骤S02、建立一个横坐标与纵坐标均包含全部标准代码语言的二维矩阵,根据编码字符将二元语句填入二维矩阵内,所述根据编码字符将二元语句填入二维矩阵内包括将二元语句的第一个字符的取值设为X轴坐标值,二元语句中第二个字符的取值设为Y轴坐标值,或者将二元语句的第一个字符的取值设为Y轴坐标值,二元语句中第二个字符的取值设为X轴坐标值;
步骤S03、根据二元语句的坐标将二元语句的出现频次填入二维矩阵内,替换二元语句的坐标值;
步骤S04、对二维矩阵进行归一化处理,得到特征矩阵。
2.根据权利要求1所述的一种前端界面的动态语言反混淆特征提取方法,其特征在于:所述逐个字符提取脚本信息中的二元语句包括先删除非文字字符,然后逐个字符提取脚本信息的二元语句;
或者,在逐个字符提取脚本信息的过程中,若字符后遇到非文字字符,则二元语句直接跳过该非文字字符,与非文字字符后第一位的字符组成二元语句;
或者,在逐个字符提取脚本信息的过程中,若字符后遇到非文字字符,则放弃该字符,跳到非文字字符后的第一个字符后开始逐个字符提取二元语句。
3.根据权利要求1所述的一种前端界面的动态语言反混淆特征提取方法,其特征在于:所述标准代码语言为ASCII、UTF-8、UTF-16、UTF-32、ANSI、Unicode 中的任意一种。
4.根据权利要求1所述的一种前端界面的动态语言反混淆特征提取方法,其特征在于:所述步骤S02之后,对所述二维矩阵进行简化,简化方法包括计算每个二元语句的熵值,筛选掉熵值不满足筛选标准的二元语句,得到简化后的二维矩阵。
5.根据权利要求4所述的一种前端界面的动态语言反混淆特征提取方法,其特征在于,所述二元语句的熵值IG(x)的计算公式如下:
Figure QLYQS_1
上式中:
H(C)为系统原本的熵,具体计算如下:
Figure QLYQS_2
C为所有文档;
Figure QLYQS_3
为文档/>
Figure QLYQS_4
出现的概率,n=2,/>
Figure QLYQS_5
为正常文档,/>
Figure QLYQS_6
为混淆文档;
Figure QLYQS_7
为固定特征X后的条件熵,具体计算如下:
Figure QLYQS_8
上式中:
P(x)为二元语句x出现的概率;
Figure QLYQS_9
为二元语句x没有出现的概率;
Figure QLYQS_10
为出现二元语句x的熵值,即
Figure QLYQS_11
,/>
Figure QLYQS_12
为/>
Figure QLYQS_13
中出现二元语句/>
Figure QLYQS_14
的频率;
Figure QLYQS_15
为没有出现二元语句x的熵值,即
Figure QLYQS_16
,/>
Figure QLYQS_17
为/>
Figure QLYQS_18
中没有出现二元语句x的频率。
6.根据权利要求1所述的一种前端界面的动态语言反混淆特征提取方法,其特征在于;所述步骤S03中建立二元语句与出现频次的键值对,以二元语句的字符为键,出现频次为值,每次采集二元语句均会对比已建立的全部键值对;
若出现相同的二元语句,则计入所述二元语句的键值对的值中,即值+1;
若未出现相同的二元语句,则建立新的键值对。
7.根据权利要求1所述的一种前端界面的动态语言反混淆特征提取方法,其特征在于;所述归一化处理包括二维矩阵中每行的坐标值求和,得到行和值,然后将本行中每个坐标值均除以行和值,得到一个小于1的坐标值,转换完成后,每一行坐标值的加和均为1;
或者,二维矩阵中每列的坐标值求和,得到列和值,然后将本列中每个坐标值均除以列和值,得到一个小于1的坐标值,转换完成后,每一列坐标值的加和均为1。
8.一种前端界面的动态语言反混淆特征提取系统,其特征在于,包括以下模块:
二元语句提取模块,用于逐个字符提取脚本信息中的二元语句,其连接标准编码信息数据库,从标准编码信息数据库中调取标准编码信息,将二元语句的字符转换为标准代码语言的编码字符,包括将二元语句的第一个字符的取值设为X轴坐标值,二元语句中第二个字符的取值设为Y轴坐标值,或者将二元语句的第一个字符的取值设为Y轴坐标值,二元语句中第二个字符的取值设为X轴坐标值;
频次采集模块,用于采集二元语句的出现频次,计算全部二元语句的出现频次总和,计算二元语句位于出现频次总和的占比,即计算二元语句的出现频率;
二维矩阵建立模块,其连接标准编码信息数据库,建立一个横坐标与纵坐标均包含全部标准代码语言的二维矩阵,根据编码字符将二元语句填入二维矩阵内,或者将二元语句的出现频次填入二维矩阵内,并对二维矩阵进行归一化处理,得到特征矩阵。
CN202310238378.4A 2023-03-14 2023-03-14 一种前端界面的动态语言反混淆特征提取方法及提取系统 Active CN115952411B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310238378.4A CN115952411B (zh) 2023-03-14 2023-03-14 一种前端界面的动态语言反混淆特征提取方法及提取系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310238378.4A CN115952411B (zh) 2023-03-14 2023-03-14 一种前端界面的动态语言反混淆特征提取方法及提取系统

Publications (2)

Publication Number Publication Date
CN115952411A CN115952411A (zh) 2023-04-11
CN115952411B true CN115952411B (zh) 2023-05-30

Family

ID=85906951

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310238378.4A Active CN115952411B (zh) 2023-03-14 2023-03-14 一种前端界面的动态语言反混淆特征提取方法及提取系统

Country Status (1)

Country Link
CN (1) CN115952411B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101540778A (zh) * 2008-03-19 2009-09-23 华为技术有限公司 一种数据传输的方法、装置和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502897A (zh) * 2018-05-16 2019-11-26 南京大学 一种基于混合分析的网页恶意JavaScript代码识别和反混淆方法
US12013941B2 (en) * 2018-06-28 2024-06-18 Crowdstrike, Inc. Analysis of malware
CN110765459A (zh) * 2019-10-18 2020-02-07 北京天融信网络安全技术有限公司 一种恶意脚本检测方法、装置和存储介质
CN113971284B (zh) * 2020-07-24 2024-03-05 中国电信股份有限公司 基于JavaScript的恶意网页检测方法、设备及计算机可读存储介质
CN113596007B (zh) * 2021-07-22 2023-04-14 广东电网有限责任公司 一种基于深度学习的漏洞攻击检测方法和设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101540778A (zh) * 2008-03-19 2009-09-23 华为技术有限公司 一种数据传输的方法、装置和系统

Also Published As

Publication number Publication date
CN115952411A (zh) 2023-04-11

Similar Documents

Publication Publication Date Title
Hill et al. On the (in) effectiveness of mosaicing and blurring as tools for document redaction
CN111885035B (zh) 一种网络异常检测方法、系统、终端以及存储介质
JP2020509436A (ja) システム言語切替方法およびシステム言語切替端末機器
WO2015043072A1 (zh) 一种选择读取目标文档的编码格式的方法及其系统
Shi et al. An approach to text steganography based on search in internet
CN111191008A (zh) 一种基于数字因子逆序的口令猜测方法
CN115952411B (zh) 一种前端界面的动态语言反混淆特征提取方法及提取系统
CN111666575A (zh) 基于词元编码的文本无载体信息隐藏方法
CN117521116B (zh) 一种大语言模型隐私信息保护方法
CN114528944A (zh) 一种医疗文本编码方法、装置、设备及可读存储介质
CN116861271B (zh) 基于大数据的数据分析处理方法
CN108090044B (zh) 联系方式的识别方法和装置
CN106126495A (zh) 一种基于大规模语料提词方法和装置
CN110210224B (zh) 一种基于描述熵的大数据移动软件相似性智能检测方法
CN110717412A (zh) 一种检测恶意pdf文档的方法及系统
CN110765300B (zh) 一种基于emoji的语义解析方法
CN113806782A (zh) 一种基于转移矩阵的密文判定方法、系统及设备
CN113472686A (zh) 信息识别方法、装置、设备及存储介质
Shanmugasundaram et al. Text preprocessing using enhanced intelligent dictionary based encoding (EIDBE)
CN112131570A (zh) 一种基于pca的密码硬编码检测方法、装置及介质
Sukanya et al. A Tool for Extracting Text from Scanned Documents and Convert it into Editable Format
CN111914513A (zh) 一种rdp窗口标题文字识别的方法及装置
CN112966282B (zh) 一种部件直方图的文本无载体隐写方法与装置
CN113065406B (zh) 一种基于编解码结构识别发票文本的报账智能平台
CN115086674B (zh) 基于生成对抗网络的图像隐写方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant