CN117811851B - 一种4g通信模块数据传输方法 - Google Patents
一种4g通信模块数据传输方法 Download PDFInfo
- Publication number
- CN117811851B CN117811851B CN202410235880.4A CN202410235880A CN117811851B CN 117811851 B CN117811851 B CN 117811851B CN 202410235880 A CN202410235880 A CN 202410235880A CN 117811851 B CN117811851 B CN 117811851B
- Authority
- CN
- China
- Prior art keywords
- text
- community
- character
- characters
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000004891 communication Methods 0.000 title claims abstract description 31
- 230000005540 biological transmission Effects 0.000 title claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims abstract description 27
- 238000001914 filtration Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000001174 ascending effect Effects 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005325 percolation Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及数据加密处理技术领域,具体涉及一种4G通信模块数据传输方法,该方法包括:采集待传输文本数据;获取文本比例位序,进而获取文本比例位序序列;获取各文本字符的特征语句,获取各文本字符的信息平凡因子;进而获取各文本字符的比例位序关联因子;计算各文本字符的文本特征系数;计算各文本社区之间的文本社区关联因子;根据非文本特征序列之间的DTW距离和文本社区关联因子获取各文本社区之间的文本社区关联度;根据文本社区关联度构建AES加密算法中的初始明文矩阵,使用AES加密算法对待传输数据进行加密处理。本发明旨在解决初始明文矩阵中每一列明文字符之间关联性较大容易被攻击者破解的问题。
Description
技术领域
本申请涉及遥感图像增强技术领域,具体涉及一种4G通信模块数据传输方法。
背景技术
4G通信模块是指将硬件加载到指定频段,软件支持标准的LTE协议,软硬件高度集成模组化的一种产品的统称。具有通信速度快、网络频谱宽、通信灵活等特点,4G通信模块将基带与射频集成在一个PCB小板上,实现了无线信号的收发和基带信号的处理,可支持语音拨号,短信接收,网络拨号,数据传输等功能。随着4G通信模块的广泛使用,对待传输的数据进行加密处理也形成了一种趋势。
AES数据加密算法作为一种对称加密算法,被广泛应用于数据保护与加密通信中,其具有安全性高、高效性能以及高灵活性的特点;但是传统的AES数据加密算法在对具有较高关联性的文本数据进行加密处理时,通过原始数据获取的初始明文矩阵中可能会存在明文字符与明文字符之间关联性较大的弊端,攻击者可能会根据明文字符之间的关联性更容易的对待传输通信的数据进行破解,进而无法保证通信数据安全性,造成相应的损失。
发明内容
为了解决上述技术问题,本发明提供一种4G通信模块数据传输方法,以解决现有的问题。
本发明的一种4G通信模块数据传输方法采用如下技术方案:
本发明提供了一种4G通信模块数据传输方法,该方法包括以下步骤:
采集待传输文本数据;
使用Tree-LSTM基于句法分析树的LSTM神经网络获取待传输文本数据中的各语句;根据文本字符在各语句中出现的位序获取各文本字符的文本比例位序序列;获取各文本字符的特征语句,使用TF-IDF词频-逆文档频率算法获取各文本字符的词频-逆文档频率值;根据文本字符在待传输的文本数据的次数获取各文本字符的信息平凡因子;根据各文本字符的文本比例位序序列之间的关系获取各文本字符的比例位序关联因子;根据词频-逆文档频率值、信息平凡因子和比例位序关联因子获取各文本字符的文本特征系数;根据文本特征系数获取各文本社区,使用无向图获取各文本社区与其他各文本社区之间的共享字符和非共享字符,根据非共享字符获取各文本社区与其他各文本社区之间的非文本特征序列;根据共享字符和文本特征系数获取各文本社区之间的文本社区关联因子;根据非文本特征序列之间的DTW距离和文本社区关联因子获取各文本社区之间的文本社区关联度;
根据文本社区关联度构建AES加密算法中的初始明文矩阵,使用AES加密算法对待传输数据进行加密处理。
进一步,所述根据文本字符在各语句中出现的位序获取各文本字符的文本比例位序序列,包括:
对于待传输文本数据中的各文本字符,将待传输的文本数据中的所有文本字符按照其在所述文本数据中出现的先后顺序进行编号,将文本字符在各语句中的出现位序与各语句中包含的文本字符总个数之比记为文本字符在各语句的文本比例位序,若各语句中不存在文本字符,则将文本字符在各语句中的文本比例位序记为0;若文本字符在各语句中出现多次,则将文本字符的出现位序的均值与各语句中的文本字符总个数之比记为文本字符在各语句的文本比例位序;
将待传输的文本数据中各文本字符在各语句的文本比例位序按照语句先后顺序组成的序列作为各文本字符的文本比例位序序列。
进一步,所述获取各文本字符的特征语句,使用TF-IDF词频-逆文档频率算法获取各文本字符的词频-逆文档频率值,包括:
将存在各文本字符的所有语句作为各文本字符的特征语句,将待传输的文本数据中的所有文本字符作为TF-IDF词频-逆文档频率算法的输入,所述TF-IDF词频-逆文档频率算法的输出为各文本字符的词频-逆文档频率值。
进一步,所述获取各文本字符的信息平凡因子,包括:
对于待传输文本数据中的各文本字符,计算文本字符在待传输文本数据中出现的总次数与文本字符的各特征语句中其他各文本字符在待传输文本数据中出现的总次数的差值,计算文本字符在待传输文本数据中的所有所述差值的和值,将以自然常数为底、以所述和值的倒数为指数的指数函数的计算结果作为各文本字符的信息平凡因子。
进一步,所述获取各文本字符的比例位序关联因子,包括:
对于待传输文本数据中各文本字符,计算文本字符与其他各文本字符的文本比例位序序列之间的豪斯多夫距离,计算文本字符的所有所述豪斯多夫距离的和值,计算所述和值与预设调整参数的求和结果的倒数,计算文本字符的各文本比例位序之间的差值绝对值,计算所述差值绝对值与所述倒数的乘积,将文本字符在待传输文本数据中所有所述乘积的和值作为各文本字符的比例位序关联因子。
进一步,所述获取各文本字符的文本特征系数,包括:
对于各文本字符,计算文本字符的信息平凡因子与预设调整参数的和值,计算文本字符的比例位序关联因子与所述和值的比值,将所述比值与文本字符的词频-逆文档频率值的乘积作为各文本字符的文本特征系数。
进一步,所述获取各文本社区,使用无向图获取各文本社区与其他各文本社区之间的共享字符和非共享字符,根据非共享字符获取各文本社区与其他各文本社区之间的非文本特征序列,包括:
将所有文本特征系数按照升序组成的序列作为待传输文本数据的文本特征序列,通过OTSU大津法获取文本特征序列的分割阈值,将所有大于等于分割阈值的文本特征系数对应的文本字符记为待传输文本数据的显著文本字符;
将待传输的文本数据中各文本字符作为无向图中的各节点获取待传输的文本数据的文本数据无向图,将所述文本数据无向图作为CPM派系过滤算法的输入,所述CPM派系过滤算法的输出为各无向图的文本社区;
对于各文本社区,将文本社区与其他各文本社区重叠的文本数据无向图节点作为文本社区与其他各文本社区之间的共享字符,将文本社区内除了共享字符外的其他所有字符作为文本社区与其他各文本社区之间的非共享字符,将所述文本社区的非共享字符按照其文本特征系数升序组成的序列作为各文本社区与其他各文本社区之间的非文本特征序列。
进一步,所述获取各文本社区之间的文本社区关联因子,包括:
文本社区关联因子的表达式为:
;
式中,为第p个文本社区与第q个文本社区之间的文本社区关联因子;/>为第p个文本社区与第q个文本社区的共享字符总个数;/>为第p个文本社区和第q个文本社区之间的非文本特征序列中所有非共享字符的文本特征系数的均值;/>为第q个文本社区与第p个文本社区之间的非文本特征序列中所有非共享字符的文本特征系数的均值;/>为第p个文本社区与第q个文本社区的第t个共享字符的文本特征系数。
进一步,所述获取各文本社区之间的文本社区关联度,表达式为:
;
式中,为第p个文本社区与第q个文本社区之间的文本社区关联度;/>分别为第p个文本社区与第q个文本社区的非文本特征序列,/>为第q个文本社区与第p个文本社区的非文本特征序列,/>为DTW距离;/>为预设调整参数。
进一步,所述构建AES加密算法中的初始明文矩阵,包括:
将每个文本社区与待传输文本数据中其余所有文本社区的文本社区关联度按照降序顺序组成的序列,作为所述文本社区的文本关联序列;
从待传输的文本数据中的第一个文本字符开始,将所述第一个文本字符作为AES加密算法初始明文矩阵的第一列的第一个文本字符,在所述第一个文本字符所在文本社区对应的文本关联序列中,按照自后向前的顺序选取三个文本社区关联度对应的文本社区,从选取的三个文本社区中分别随机挑选32bit文本字符共同作为AES加密算法初始明文矩阵的第一列的其他各文本字符;对于待传输的文本数据中的其他各文本字符,采用与待传输的文本数据中的第一个文本字符相同的方法获取初始明文矩阵的其他各列,构建初始明文矩阵。
本发明至少具有如下有益效果:
本发明通过文本字符在待传输文本数据中的位置以及次数特征获得文本字符的文本特征系数,在分析文本字符与待传输文本数据中其余文本字符关联性的基础上考虑了文本字符相对于待传输文本数据的重要程度;通过文本特征系数确定显著文本字符,根据显著文本字符总个数对待传输的文本数据进行社区划分,通过文本社区内各个文本字符的文本特征系数获取文本社区之间的文本社区关联度,综合考虑了文本社区内共享字符以及非共享字符之间的相似性,更精确的衡量文本社区间的关联性程度大小;通过文本社区之间的文本社区关联度构建AES加密算法中的初始明文矩阵,并通过AES加密算法对传输数据进行加密,最终通过4G通信模块进行数据传输,能够更为有效的避免初始明文矩阵中每一列明文字符之间关联性较大容易被攻击者破解的弊端,进一步提高了4G通信模块数据传输的安全性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明提供的一种4G通信模块数据传输方法的流程图;
图2为文本社区关联度获取流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种4G通信模块数据传输方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种4G通信模块数据传输方法的具体方案。
本发明一个实施例提供的一种4G通信模块数据传输方法,具体的,提供了如下的一种4G通信模块数据传输方法,请参阅图1,该方法包括以下步骤:
步骤S001,对待传输至4G通信模块的数据进行采集,并对采集的数据进行预处理。
通过4G通信模块所在的服务器获取待传输的文本数据,为确保数据的纯净性与一致性,提高数据传输和处理的效果,需对获取的待传输文本数据进行数据清洗,去除待传输文本数据中的无效字符,降低数据冗余性。
至此,获取数据清洗后的待传输文本数据。
步骤S002,通过文本字符在待传输文本数据中的位置以及次数特征获得文本字符的文本特征系数,通过文本特征系数确定显著文本字符,根据显著文本字符对待传输的文本数据进行社区划分,根据社区内文本字符的文本特征系数获取文本社区之间的文本社区关联度。
在4G通信模块待传输的文本数据中,若文本字符的出现频率较高时,通常表示该文本字符在整体文本数据中被反复强调,其具有较高的重要性以及信息丰富性,通过AES加密算法构建原始文本数据的初始明文矩阵时越应该将信息丰富性较高的字符放在矩阵的不同列中,提高待加密数据安全性;其次,仅针对文本字符的出现频率并不能准确的衡量其对于整体文本数据的重要性,还需根据上下文之间的相关性进行协同判断。
对于4G通信模块待传输的全部文本数据,采用基于句法分析树的LSTM长短时记忆递归神经网络(Tree-LSTM)获取待传输文本数据中的每个语句,使用Adam作为优化算法,使用MSE均方误差作为损失函数,由于Tree-LSTM基于句法分析树的LSTM长短时记忆递归神经网络为公知技术,具体获取过程不再赘述。
对于待传输文本数据中的各文本字符,将待传输的文本数据中的所有文本字符按
照其在所述文本数据中出现的先后顺序进行编号,将第i个文本字符在第n条语句中的出现
位序与第n条语句中包含的文本字符总个数之比记为第i个文本字符的第n个文本比例位序,若第n条语句中不存在第i个文本字符,则将第i个文本字符的第n个文本比例位序记为
0;若第i个文本字符在第n条语句中出现多次,则将第i个文本字符的出现位序的均值与第n
条语句中的文本字符总个数之比记为第i个文本字符的第n个文本比例位序。将待传输的文
本数据中每个文本字符的全部文本比例位序按照语句先后顺序组成的序列记为该文本字
符的文本比例位序序列a。
将存在第i个文本字符的所有语句均作为第i个文本字符的特征语句,将待传输的文本数据中的所有文本字符分别作为一个词输入TF-IDF词频-逆文档频率算法(TermFrequency-Inverse Document Frequency),获取待传输文本数据中每一个文本字符的词频-逆文档频率值记为Tf,TF-IDF词频-逆文档频率算法为公知技术,具体获取过程不再赘述。
基于上述分析,本实施例构建文本特征系数,用于表征文本字符在待传输文本数据内的特征显著程度,公式为:
;
;
;
为第i个文本字符的信息平凡因子;/>为第i个文本字符的特征语句总个数;为第i个文本字符的第x个特征语句中的字符总个数;/>为第i个文本字符在待传输的文本数据的出现总次数;/>为第i个文本字符的第x个特征语句中第h个文本字符在待传输的文本数据的出现总次数;exp{}为以自然常数e为底的指数函数。
当第i个文本字符在待传输的文本数据的出现总次数与第i个文本字符的所有特征语句中每一个文本字符在待传输文本数据出现总次数之间的差值之和越大时,即越大,表示第i个文本字符的出现次数越大于该文本字符对应全部特征语句中所有文本字符的出现总次数,该文本字符在其所有特征语句中相比较其他文本字符而言,重要程度可能越大,信息平凡因子/>越小。
为第i个文本字符的比例位序关联因子;/>为第i个文本字符对应文本比例位序序列中的数据总个数;/>、/>分别为第i个文本字符的第j、y个文本比例位序;/>为待传输的文本数据中的文本字符总个数;/>、/>分别为第i、g个文本字符对应的文本比例位序序列;/>为文本比例位序序列/>与/>之间的豪斯多夫距离;/>为调整参数,本实施例中取值为1,防止分母为0。
当第i个文本字符对应文本比例位序序列中的所有文本比例位序之间的差值绝对值之和越大时,即越大,表示第i个文本字符在整个待传输文本数据中每条语句的出现位序越灵活;同时当第i个文本字符的文本比例位序序列与待传输文本数据中所有文本字符的文本比例位序序列之间的豪斯多夫距离越小时,即/>越小,表示第i个文本字符与其余文本字符在待传输文本数据中相互搭配形成文本字符串的可能性越高,该文本字符与其余文本字符之间的关联性可能越大,比例位序关联因子/>越大。
为第i个文本字符的文本特征系数;/>为第i个文本字符的词频-逆文档频率值;/>为调整参数,本实施例中取值为1,防止分母为0。
当第i个文本字符的词频-逆文档频率值越大时,即越大,表示第i个文本字符在待传输文本数据中的重要性越高;同时当第i个文本字符的比例位序关联因子越大时,即越大,表示该文本字符与其余文本字符之间的关联性可能越大;同时当第i个文本字符的信息平凡因子越小时,即/>越小,表示该文本字符在其所有特征语句中相比较其他文本字符而言,重要程度可能越大,该文本字符的文本特征系数/>越大。
至此,可根据上述方式获取待传输文本数据中所有文本字符的文本特征系数。
将所有文本特征系数按照升序组成的序列作为待传输文本数据的文本特征序列,通过OTSU大津法获取文本特征序列的分割阈值,将所有大于等于分割阈值的文本特征系数对应的文本字符记为待传输文本数据的显著文本字符,由于OTSU大津法为公知技术,具体获取过程不再赘述。
将待传输的文本数据中每一个文本字符分别作为无向图中的一个节点,若两个文本字符在待传输的文本数据之间存在相邻关系,则所述两个文本字符在无向图中形成一条边,根据上述方式获取待传输的文本数据的文本数据无向图并作为输入,采用CPM派系过滤算法(Clique Percolation Method)获取文本数据无向图/>中的所有文本社区,本实施例中CPM派系过滤算法中的K值设置为待传输文本数据中的显著文本字符总个数,将待传输文本数据中的显著文本字符总个数作为CPM派系过滤算法中的K值原因在于能够最大限度的保留各个文本社区内重要性程度以及与其它文本字符关联程度较大的文本字符,即最大限度保留完全子图内文本特征系数较大的文本字符。由于CPM派系过滤算法为公知技术,具体获取过程不再赘述。
将第p个文本社区与第q个文本社区中重叠的文本数据无向图节点,即文本字符,记为所述两个文本社区的共享字符,将第p个文本社区内除与第q个文本社区的共享字符外其余所有文本字符记为第p个文本社区的非共享字符,将第p个文本社区的所有非共享字符按照文本特征系数升序顺序组成的序列记为第p个文本社区与第q个文本社区之间的非文本特征序列。同理,获取各文本社区与其他各文本社区的非文本序列。
具体的,第p个文本社区与第q个文本社区之间的非文本特征序列为剔除第p个文本社区内与第q个文本社区的共享字符外其余所有文本字符组成的序列,第q个文本社区与第p个文本社区之间的非文本特征序列为剔除第q个文本社区内与第p个文本社区的共享字符外其余所有文本字符组成的序列。
基于上述分析,本实施例构建文本社区关联度,用于表征文本社区与其余文本社区的关联性程度。
;
;
式中,为第p个文本社区与第q个文本社区之间的文本社区关联因子;/>为第p个文本社区与第q个文本社区的共享字符总个数;/>为第p个文本社区和第q个文本社区之间的非文本特征序列中所有非共享字符的文本特征系数的均值;/>为第q个文本社区的与第p个文本社区之间的非文本特征序列中所有非共享字符的文本特征系数的均值;为第p个文本社区与第q个文本社区的第t个共享字符的文本特征系数。
当第p个文本社区的非文本特征序列中所有文本特征系数均值与第p个文本社区和第q个文本社区的所有共享字符对应的文本特征系数之间的差值绝对值之和越小时,即越小,表示第p个文本社区的所有非共享字符对应文本特征系数与第p个文本社区和第q个文本社区的全部共享字符的文本特征系数之间的差异越小,第p个文本社区与第q个文本社区内所有文本字符的重要性程度越相似;同时当第q个文本社区的非p文本特征序列中所有文本特征系数均值与第p个文本社区和第q个文本社区的所有共享字符对应的文本特征系数之间的差值绝对值之和越小时,即/>越小,表示第q个文本社区的所有非p共享字符对应文本特征系数与第p个文本社区和第q个文本社区的全部共享字符的文本特征系数之间的差异越小,第q个文本社区与第p个文本社区内所有文本字符的重要性程度越相似,第p个文本社区与第q个文本社区之间的关联程度可能性越大,第p个文本社区与第q个文本社区之间的文本社区关联因子/>越大。
为第p个文本社区与第q个文本社区之间的文本社区关联度;/>、/>分别为第p个文本社区与第q个文本社区的非文本特征序列以及第q个文本社区与第p个文本社区的非文本特征序列。/>为序列/>与/>之间的DTW距离;/>为调整参数,本实施例中取值为1,防止分母为0。其中,文本社区关联度获取流程图如图2所示。
当第p个文本社区与第q个文本社区的文本社区关联因子越大时,即越大,表示第p个文本社区与与第q个文本社区之间的关联程度可能性越大;同时当第p个文本社区的非文本特征序列与第q个文本社区的非p文本特征序列之间的DTW距离越小时,即越小,表示第p个文本社区以及第q个文本社区除共享字符外,其余文本字符的文本特征系数差异越小,第p个文本社区与第q个文本社区之间的关联程度越高,第p个文本社区与第q个文本社区之间的文本社区关联度/>越大。
至此,可根据上述方式获得4G通信模块待传输文本数据中每一个文本社区与其余所有文本社区之间的文本社区关联度,用于后续构建AES加密算法中的初始明文矩阵。
步骤S003,根据获得的各个文本社区之间的文本社区关联度构建AES加密算法中的初始明文矩阵,使用AES加密算法对待传输数据进行加密处理后通过4G通信模块进行数据传输。
将每个文本社区与待传输文本数据中其余所有文本社区的文本社区关联度按照降序顺序组成的序列作为所述文本社区的文本关联序列,之后构建初始明文矩阵,构建方式如下:
从待传输的文本数据中的第一个文本字符开始,将所述第一个文本字符作为AES加密算法初始明文矩阵的第一列的第一个文本字符,在所述第一个文本字符所在文本社区对应的文本关联序列中,按照自后向前的顺序选取三个文本社区关联度对应的文本社区,从选取的三个文本社区中分别随机挑选32bit文本字符共同作为AES加密算法初始明文矩阵的第一列的其他各文本字符;其中,第一个文本字符与后续选取的文本字符字节总长度为128bit,即除第一个字符数据外,还需选取三个文本社区中的随机32bit字符数据,同时将已选取的文本字符从待传输的文本数据中删除,之后进行待传输文本数据中第二个文本字符的初始明文矩阵的列选取,以此类推,可根据上述方式获取AES加密算法的初始明文矩阵。之后通过AES加密算法获取待传输文本数据的密钥长度,初始密钥字节矩阵,完成数据加密处理,获得待传输数据的密文,由于AES加密算法为公知技术,本实施例不再过多赘述,通过4G通信模块对AES加密后的密文进行传输,实现一种4G通信模块数据传输方式。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,均应包含在本申请的保护范围之内。
Claims (6)
1.一种4G通信模块数据传输方法,其特征在于,该方法包括以下步骤:
采集待传输文本数据;
使用Tree-LSTM基于句法分析树的LSTM神经网络获取待传输文本数据中的各语句;根据文本字符在各语句中出现的位序获取各文本字符的文本比例位序序列;获取各文本字符的特征语句,使用TF-IDF词频-逆文档频率算法获取各文本字符的词频-逆文档频率值;根据文本字符在待传输的文本数据的次数获取各文本字符的信息平凡因子;根据各文本字符的文本比例位序序列之间的关系获取各文本字符的比例位序关联因子;根据词频-逆文档频率值、信息平凡因子和比例位序关联因子获取各文本字符的文本特征系数;根据文本特征系数获取各文本社区,使用无向图获取各文本社区与其他各文本社区之间的共享字符和非共享字符,根据非共享字符获取各文本社区与其他各文本社区之间的非文本特征序列;根据共享字符和文本特征系数获取各文本社区之间的文本社区关联因子;根据非文本特征序列之间的DTW距离和文本社区关联因子获取各文本社区之间的文本社区关联度;
根据文本社区关联度构建AES加密算法中的初始明文矩阵,使用AES加密算法对待传输数据进行加密处理;
所述获取各文本字符的信息平凡因子,包括:
对于待传输文本数据中的各文本字符,计算文本字符在待传输文本数据中出现的总次数与文本字符的各特征语句中其他各文本字符在待传输文本数据中出现的总次数的差值,计算文本字符在待传输文本数据中的所有所述差值的和值,将以自然常数为底、以所述和值的倒数为指数的指数函数的计算结果作为各文本字符的信息平凡因子;
所述获取各文本社区,使用无向图获取各文本社区与其他各文本社区之间的共享字符和非共享字符,根据非共享字符获取各文本社区与其他各文本社区之间的非文本特征序列,包括:
将所有文本特征系数按照升序组成的序列作为待传输文本数据的文本特征序列,通过OTSU大津法获取文本特征序列的分割阈值,将所有大于等于分割阈值的文本特征系数对应的文本字符记为待传输文本数据的显著文本字符;
将待传输的文本数据中各文本字符作为无向图中的各节点获取待传输的文本数据的文本数据无向图,将所述文本数据无向图作为CPM派系过滤算法的输入,所述CPM派系过滤算法的输出为各无向图的文本社区;
对于各文本社区,将文本社区与其他各文本社区重叠的文本数据无向图节点作为文本社区与其他各文本社区之间的共享字符,将文本社区内除了共享字符外的其他所有字符作为文本社区与其他各文本社区之间的非共享字符,将所述文本社区的非共享字符按照其文本特征系数升序组成的序列作为各文本社区与其他各文本社区之间的非文本特征序列;
所述获取各文本社区之间的文本社区关联因子,包括:
文本社区关联因子的表达式为:
;
式中,为第p个文本社区与第q个文本社区之间的文本社区关联因子;/>为第p个文本社区与第q个文本社区的共享字符总个数;/>为第p个文本社区和第q个文本社区之间的非文本特征序列中所有非共享字符的文本特征系数的均值;/>为第q个文本社区与第p个文本社区之间的非文本特征序列中所有非共享字符的文本特征系数的均值;/>为第p个文本社区与第q个文本社区的第t个共享字符的文本特征系数;
所述获取各文本社区之间的文本社区关联度,表达式为:
;
式中,为第p个文本社区与第q个文本社区之间的文本社区关联度;/>为第p个文本社区与第q个文本社区之间的文本社区关联因子;/>分别为第p个文本社区与第q个文本社区的非文本特征序列,/>为第q个文本社区与第p个文本社区的非文本特征序列,为DTW距离;/>为预设调整参数。
2.如权利要求1所述的一种4G通信模块数据传输方法,其特征在于,所述根据文本字符在各语句中出现的位序获取各文本字符的文本比例位序序列,包括:
对于待传输文本数据中的各文本字符,将待传输的文本数据中的所有文本字符按照其在所述文本数据中出现的先后顺序进行编号,将文本字符在各语句中的出现位序与各语句中包含的文本字符总个数之比记为文本字符在各语句的文本比例位序,若各语句中不存在文本字符,则将文本字符在各语句中的文本比例位序记为0;若文本字符在各语句中出现多次,则将文本字符的出现位序的均值与各语句中的文本字符总个数之比记为文本字符在各语句的文本比例位序;
将待传输的文本数据中各文本字符在各语句的文本比例位序按照语句先后顺序组成的序列作为各文本字符的文本比例位序序列。
3.如权利要求1所述的一种4G通信模块数据传输方法,其特征在于,所述获取各文本字符的特征语句,使用TF-IDF词频-逆文档频率算法获取各文本字符的词频-逆文档频率值,包括:
将存在各文本字符的所有语句作为各文本字符的特征语句,将待传输的文本数据中的所有文本字符作为TF-IDF词频-逆文档频率算法的输入,所述TF-IDF词频-逆文档频率算法的输出为各文本字符的词频-逆文档频率值。
4.如权利要求2所述的一种4G通信模块数据传输方法,其特征在于,所述获取各文本字符的比例位序关联因子,包括:
对于待传输文本数据中各文本字符,计算文本字符与其他各文本字符的文本比例位序序列之间的豪斯多夫距离,计算文本字符的所有所述豪斯多夫距离的和值,计算所述和值与预设调整参数的求和结果的倒数,计算文本字符的各文本比例位序之间的差值绝对值,计算所述差值绝对值与所述倒数的乘积,将文本字符在待传输文本数据中所有所述乘积的和值作为各文本字符的比例位序关联因子。
5.如权利要求1所述的一种4G通信模块数据传输方法,其特征在于,所述获取各文本字符的文本特征系数,包括:
对于各文本字符,计算文本字符的信息平凡因子与预设调整参数的和值,计算文本字符的比例位序关联因子与所述和值的比值,将所述比值与文本字符的词频-逆文档频率值的乘积作为各文本字符的文本特征系数。
6.如权利要求1所述的一种4G通信模块数据传输方法,其特征在于,所述构建AES加密算法中的初始明文矩阵,包括:
将每个文本社区与待传输文本数据中其余所有文本社区的文本社区关联度按照降序顺序组成的序列,作为所述文本社区的文本关联序列;
从待传输的文本数据中的第一个文本字符开始,将所述第一个文本字符作为AES加密算法初始明文矩阵的第一列的第一个文本字符,在所述第一个文本字符所在文本社区对应的文本关联序列中,按照自后向前的顺序选取三个文本社区关联度对应的文本社区,从选取的三个文本社区中分别随机挑选32bit文本字符共同作为AES加密算法初始明文矩阵的第一列的其他各文本字符;对于待传输的文本数据中的其他各文本字符,采用与待传输的文本数据中的第一个文本字符相同的方法获取初始明文矩阵的其他各列,构建初始明文矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410235880.4A CN117811851B (zh) | 2024-03-01 | 2024-03-01 | 一种4g通信模块数据传输方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410235880.4A CN117811851B (zh) | 2024-03-01 | 2024-03-01 | 一种4g通信模块数据传输方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117811851A CN117811851A (zh) | 2024-04-02 |
CN117811851B true CN117811851B (zh) | 2024-05-17 |
Family
ID=90420357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410235880.4A Active CN117811851B (zh) | 2024-03-01 | 2024-03-01 | 一种4g通信模块数据传输方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117811851B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107797990A (zh) * | 2017-10-18 | 2018-03-13 | 渡鸦科技(北京)有限责任公司 | 用于确定文本核心语句的方法和装置 |
KR20180137387A (ko) * | 2017-06-15 | 2018-12-27 | 한양대학교 산학협력단 | 중첩 커뮤니티 검출 장치 및 방법 |
CN110674290A (zh) * | 2019-08-09 | 2020-01-10 | 国家计算机网络与信息安全管理中心 | 一种用于重叠社区发现的关系预测方法、装置和存储介质 |
CN112632285A (zh) * | 2020-12-31 | 2021-04-09 | 北京有竹居网络技术有限公司 | 一种文本聚类方法、装置、电子设备及存储介质 |
CN114461879A (zh) * | 2022-01-21 | 2022-05-10 | 哈尔滨理工大学 | 基于文本特征整合的语义社交网络多视角社区发现方法 |
CN114707485A (zh) * | 2022-03-22 | 2022-07-05 | 深圳市百川数安科技有限公司 | 基于互联网社区的文本相似度确定方法及装置 |
CN116187852A (zh) * | 2023-02-13 | 2023-05-30 | 浙江工业大学 | 一种基于社区关联和行为特征学习的在线课程推荐方法 |
-
2024
- 2024-03-01 CN CN202410235880.4A patent/CN117811851B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180137387A (ko) * | 2017-06-15 | 2018-12-27 | 한양대학교 산학협력단 | 중첩 커뮤니티 검출 장치 및 방법 |
CN107797990A (zh) * | 2017-10-18 | 2018-03-13 | 渡鸦科技(北京)有限责任公司 | 用于确定文本核心语句的方法和装置 |
CN110674290A (zh) * | 2019-08-09 | 2020-01-10 | 国家计算机网络与信息安全管理中心 | 一种用于重叠社区发现的关系预测方法、装置和存储介质 |
CN112632285A (zh) * | 2020-12-31 | 2021-04-09 | 北京有竹居网络技术有限公司 | 一种文本聚类方法、装置、电子设备及存储介质 |
CN114461879A (zh) * | 2022-01-21 | 2022-05-10 | 哈尔滨理工大学 | 基于文本特征整合的语义社交网络多视角社区发现方法 |
CN114707485A (zh) * | 2022-03-22 | 2022-07-05 | 深圳市百川数安科技有限公司 | 基于互联网社区的文本相似度确定方法及装置 |
CN116187852A (zh) * | 2023-02-13 | 2023-05-30 | 浙江工业大学 | 一种基于社区关联和行为特征学习的在线课程推荐方法 |
Non-Patent Citations (2)
Title |
---|
"基于复杂网络的文本语义社区的构建";周德志 等;《情报杂志》;20131018(10);全文 * |
"基于社区发现的文本分析模型研究";范伟成;《中国优秀硕士学位论文全文数据库(信息科技I辑)》;20190115;正文第3-5章 * |
Also Published As
Publication number | Publication date |
---|---|
CN117811851A (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11620321B2 (en) | Artificial intelligence based method and apparatus for processing information | |
US10755048B2 (en) | Artificial intelligence based method and apparatus for segmenting sentence | |
CN104809117B (zh) | 视频数据聚合处理方法、聚合系统及视频搜索平台 | |
US20190163699A1 (en) | Method and apparatus for information interaction | |
CN113628059B (zh) | 一种基于多层图注意力网络的关联用户识别方法及装置 | |
CN108418683B (zh) | 一种基于汉字结构特征的无载体文本隐写方法 | |
CN115296862B (zh) | 一种基于数据编码的网络数据安全传输方法 | |
CN110059218A (zh) | 一种基于快速傅里叶逆变换的语音检索方法及系统 | |
CN116859830B (zh) | 用于电子级氟化铵生产的生产管理控制系统 | |
CN111368551A (zh) | 一种确定事件主体的方法和装置 | |
CN110322959A (zh) | 一种基于知识的深度医疗问题路由方法及系统 | |
CN113516253B (zh) | 一种联邦学习中数据加密优化方法及装置 | |
CN117811851B (zh) | 一种4g通信模块数据传输方法 | |
WO2022073341A1 (zh) | 基于语音语义的疾病实体匹配方法、装置及计算机设备 | |
Zhao et al. | Semantic information extraction for text data with probability graph | |
CN116825259B (zh) | 一种基于物联网的医疗数据管理方法 | |
CN113076744A (zh) | 一种基于卷积神经网络的文物知识关系抽取方法 | |
CN113129875A (zh) | 一种基于对抗样本的语音数据隐私保护方法 | |
CN103092838B (zh) | 一种获取英文词的方法及装置 | |
CN115881317A (zh) | 一种基于问诊服务定制化的快速接入集成方法 | |
CN115017324A (zh) | 实体关系抽取方法、装置、终端及存储介质 | |
CN111460105B (zh) | 基于短文本的主题挖掘方法、系统、设备及存储介质 | |
Ahmadini et al. | [Retracted] Statistical Analysis of the People Fully Vaccinated against COVID‐19 in Two Different Regions | |
Yang et al. | A generation-based text steganography by maintaining consistency of probability distribution | |
CN113626414A (zh) | 一种高维数据集的数据降维、去噪方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |