CN115470507B - 一种中小企业研发项目数据管理方法 - Google Patents
一种中小企业研发项目数据管理方法 Download PDFInfo
- Publication number
- CN115470507B CN115470507B CN202211341523.3A CN202211341523A CN115470507B CN 115470507 B CN115470507 B CN 115470507B CN 202211341523 A CN202211341523 A CN 202211341523A CN 115470507 B CN115470507 B CN 115470507B
- Authority
- CN
- China
- Prior art keywords
- spectrogram
- point
- pixel
- corner
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/08—Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
- H04L9/0861—Generation of secret information including derivation or calculation of cryptographic keys or passwords
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/08—Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
- H04L9/0894—Escrow, recovery or storing of secret information, e.g. secret key escrow or cryptographic key storage
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Abstract
本发明涉及数据处理技术领域,具体涉及一种中小企业研发项目数据管理方法,包括:获取研发项目数据中每个文字的量化语谱图;根据量化语谱图中的角点以及角点边获取量化语谱图中每个像素点的局部信息加密系数;根据量化语谱图与其八邻域内所有量化语谱图中对应位置的像素点的像素值差异获取量化语谱图中每个像素点的相邻整体信息加密系数;根据局部信息加密系数以及相邻整体信息加密系数获取每个像素点的噪声程度,进一步获得量化噪声语谱图,将量化噪声语谱图转换为音频信号作为密文音频信号,将每个文字的音频信号作为明文音频信号;将明文音频信号与密文音频信号的差异作为密钥。本发明大大的增强了文字类信息的隐蔽性。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种中小企业研发项目数据管理方法。
背景技术
企业研发项目数据对于整个项目研发过程是极为重要的,若该类数据被泄露,则会对企业项目研发过程造成较为严重的危害,被盗用的话将会危害企业的经济利益。因此需要对项目研发数据需要进行加密存储。而相对于图像类的数据的加密而言,图像类的数据的加密效果远远高于文本数据的加密效果,而对于文本数据的加密若仅通过更改文字的顺序,可根据语义关系进行暴力破解,并且文本数据中包含有许多极为重要的研发数据信息。因此文本数据是主要盗取的对象。
文本数据往往存在规律性的特征,例如笔划都是规则的,并且文字和文字之间存在一定的语义关系,因此不法分子会根据文本数据之间的语义关系进行破解。
为了消除文本数据之间规律性特征,并且减少语义关系,本发明引入模态转换的思想,结合文字对应的音频信号的语谱图特性,获取语谱图中每个像素点的局部信息加密系数以及相邻整体信息加密系数,进而获取加入噪声信息后的音频信号,实现数据加密,防止文本数据被盗用破解。
发明内容
本发明提供一种中小企业研发项目数据管理方法,以解决现有的问题。
本发明的一种中小企业研发项目数据管理方法采用如下技术方案:
本发明一个实施例提供了一种中小企业研发项目数据管理方法,该方法包括以下步骤:
采集企业研发项目中的文本数据,对文本数据进行文本图像分割,得到每个文字的图像;
根据每个文字的图像获取每个文字的语谱图;对每个语谱图进行量化处理得到量化语谱图,获取每个量化语谱图中的角点以及角点边;计算每个角点边的方向角度;根据每个角点边的方向角度以及长度获取每个角点的局部信息加密系数;
将每个量化语谱图中的非角点分为第一像素点与第二像素点;根据每个量化语谱图中每个角点的局部信息加密系数获取每个量化语谱图中每个第一像素点的局部信息加密系数;将每个量化语谱图中所有第一像素点的局部信息加密系数的均值作为每个量化语谱图中每个第二像素点的局部信息加密系数;
将所有量化语谱图构建成一个二维矩阵,根据每个量化语谱图在二维矩阵中八邻域范围内的量化语谱图获取每个量化语谱图中每个像素点的相邻整体信息加密系数;
根据每个像素点的局部信息加密系数以及相邻整体信息加密系数获取每个像素点噪声程度;将每个量化语谱图中每个像素点的像素值加上噪声程度得到量化噪声语谱图;
将每个量化噪声语谱图转换成音频信号,作为密文音频信号;获取每个文字的音频信号,作为明文音频信号;将明文音频信号与密文音频信号中每一时刻的振幅值差异作为密钥;将密文音频信号以及密钥进行存储。
优选的,所述对每个语谱图进行量化处理得到量化语谱图包括:
将每个语谱图中每个像素点的能量值进行最大值最小值归一化再乘以255并取整,得到每个像素点的像素值,所有像素点的像素值构成量化语谱图。
优选的,所述获取每个量化语谱图中的角点以及角点边包括:
对每个量化语谱图进行角点检测,获取每个量化语谱图中所有角点;将每个角点与所述角点顺时针方向上相邻的角点连接构成角点边。
优选的,所述方向角度的表达式为:
优选的,所述每个角点的局部信息加密系数的表达式为:
其中表示第个角点的局部信息加密系数;表示第个角点和第个角点构成的角点边的方向角度;表示第个角点和第个角点构成的角点边的方向角度;表示第个角点和第个角点构成的角点边的长度;表示第个角点和第个角点构成的角点边的长度。
优选的,所述将每个量化语谱图中的非角点分为第一像素点与第二像素点包括:
将每个量化语谱图中位于角点边上的非角点作为第一像素点,将每个量化语谱图中不在角点边上的非角点作为第二像素点。
优选的,所述每个第一像素点的局部信息加密系数的表达式为:
优选的,所述相邻整体信息加密系数的表达式为:
优选的,所述噪声程度的表达式为:
其中为第个量化语谱图中第个像素点的噪声程度;为第个量化语谱图中第个像素点的局部信息加密系数;为第个量化语谱图中第个像素点的相邻整体信息加密系数;表示第个量化语谱图中所有像素点的像素值均值;为双曲正切函数。
本发明的技术方案的有益效果是:本发明通过将文本数据转换为音频数据,根据音频数据的语谱图特性,利用数据中每个文字信息的拐角点的特性以及文字之间的语义关系,获取语谱图中每个像素点的局部信息加密系数以及相邻整体信息加密系数,来自适应获取每个像素点的噪声程度,并根据噪声程度进行量化获取加入噪声信息的音频信号。每个文字信息的拐角点特性表征着每个文字的结构以及对应的形状,本发明通过对每个文字信息的拐角特性量化局部信息加密系数,利用局部信息加密系数往音频信号加入噪声,使得文字的拐角点的加密效果更好;相邻文字信息之间的分布特征表征每个文字的语义信息的分布,本发明通过对相邻文字信息之间的特性量化相邻整体信息加密系数,使得文字之间的语义信息减少。相较于现有技术的文本数据的加密方法,本发明能够通过结合每个文字的结构特性以及文字之间的语义关系分布,来自适应获取加入噪声信息的程度以及往音频信号加入噪声,为数据加密提供准确的噪声程度系数的参考。本发明通过存储加入噪声后的音频信号,实现研发项目数据的安全存储,并大大的加强了文本数据的信息的隐蔽性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种中小企业研发项目数据管理方法的步骤流程图;
图2为本发明的一种中小企业研发项目数据管理方法的明文音频信号;
图3为本发明的一种中小企业研发项目数据管理方法的量化语谱图。
图4为本发明的一种中小企业研发项目数据管理方法的密文音频信号;
图5为本发明的一种中小企业研发项目数据管理方法的量化噪声语谱图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种中小企业研发项目数据管理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种中小企业研发项目数据管理方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种中小企业研发项目数据管理方法的步骤流程图,该方法包括以下步骤:
101.采集企业研发项目中的文本数据,获取量化语谱图。
需要说明的是,企业的研发项目数据主要包含有文本数据和图像类数据。其中本发明实施例中的文本数据不是文字类格式数据,而是采集的文字图像类数据。本发明实施例以研发项目文书作为对象,进行研究分析。研发项目文书对于企业项目研发过程是极为重要的,若该类数据被泄露,则会对企业项目研发项目造成较为严重的危害,若研发项目文书中文本信息被盗用的话将会危害企业的经济利益。因此需要对研发项目文书需要进行加密存储。而相对于图像数据的加密而言,图像数据的加密效果远远高于文本数据的加密效果,现有的对于文本数据的加密仅通过更改文字的顺序来实现加密,可根据语义关系进行暴力破解。并且文本数据中包含有许多极为重要的研发数据信息,因此文本数据是主要盗取的对象。本发明实施例通过对文本数据进行加密处理,防止文本数据被盗用破解。
在本发明实施例中,采集企业研发项目中的文本数据,比如研发项目文书等。其中研发项目文书中包含有大量的文本信息、图像信息。将采集的企业研发项目数据传输至数据库系统,进行加密存储。本发明实施例以研发项目文书为对象进行研究分析。
需要说明的是,文本数据往往存在规律性的特征,例如笔划都是规则的,并且文字和文字之间存在一定的语义关系,因此不法分子会根据文本数据之间的语义关系进行破解。基于此,为了消除文本数据之间规律性特征,减少语义关系,本发明实施例引入模态转换的思想,将文本数据转换为音频信号,通过对音频信号进行处理,并根据音频信号的语谱图形式进行数据信号的偏移,进而增加文本数据的隐蔽性,实现项目研发数据的加密。
在本发明实施例中,对于项目文书类的数据,为了实现文本数据转换为音频数据,首先对项目文书类的数据进行文本图像分割,通过OCR算法中的CTPN文本检测模型将每个文字分割成不同的大小分割框,其中每个分割框仅包含有一个文字,每个分割框可视作每个文字分割出的图像。由于每个文字的分割框大小是不同的,因此对应的每个文字分割出的图像大小是不相同的。为了计算简便,将每个文字分割出的图像调整为统一的图像大小:选取所有文字分割出的图像大小中的最大值,作为基本框大小,将其他文字分割出的图像设置为基本框大小的图像作为每个文字的图像,其中补充的像素点的像素值可设置为0。
将每个文字的图像转换为音频信号,根据音频信号获取文字的语谱图,具体方法为:将图像视作某个音频信号的语谱图处理,通过反傅里叶变换得到一维的音频信号;再通过一维的音频信号经过傅里叶变换得到对应的音频信号的语谱图(具体可参考Kawamura在2016年发表在《Applied acousties》上的文章)。
将每个文字的音频信号记为明文音频信号。
需要说明的是,每个文字的图像大小相同,则对应的音频信号的时间帧数相同,进一步对应的每个文字的语谱图大小也是相同的。语谱图的横坐标为时间,纵坐标为频率,坐标点的值为音频信号的能量。由于语谱图中的每个坐标点的能量值仅代表音频信号的能量的大小,颜色表示能量值的大小,仅有语义含义,因此为了方便计算需将能量值量化到范围内。
式中表示语谱图中第个像素点的量化后的值,表示语谱图中第个像素点的能量值;和表示语谱图中所有像素点的能量值的最大值和最小值;表示归一化,用于将语谱图中第个像素点的能量值归一化;表示范围内的量化值;表示取整函数。
将语谱图中每个像素点的量化后的值作为每个像素点的像素值,得到量化语谱图。
至此,获取了量化语谱图。本发明实施例以文字“孙”为例,获得的明文音频信号参见图2,量化语谱图参见图3。
102.获取量化语谱图中每个像素点的局部信息加密系数以及相邻整体信息加密系数。
需要说明的是,由于音频信号是声波的频率、幅度变化的信息载体,通过调整声波的频率以及幅度变化往往能实现很好的信息加密,而在传统的音频信号的处理过程中,音频的噪声信息往往会极大的影响着声波的频率以及幅度的变化。而音频信号所表征的声波的频率以及幅度的变化,可以在音频信号对应的语谱图上一同表现。由于音频信号的语谱图上的表征的信息比音频信号的声波图的表征的信息更加丰富。因此本发明实施例通过在文本数据转换来的音频信息中对应语谱图中自适应增加音频的噪声信息实现数据的加密存储,其中音频的噪声信息根据语谱图中表征的文本数据其本身的特征以及文本数据的分布特征进行自适应,进而实现文本数据的本身局部信息加密以及相邻整体信息加密,大大增加了文本数据的隐蔽性,从而实现文本数据的安全存储。
语谱图中文本数据中每个文字呈现一定的规律性的特征,例如笔划都是规则的,因此对应的文本数据中每个文字都存在一些关键点,而这些关键点往往对应的是文字的拐角点,而若不法分子获取语谱图中这些文字的拐角点特征,会很容易进行破解得到文字的形状,进而破解文本数据。因此通过计算文本数据中每个文字的拐角点特征来确定音频信息对应的语谱图中信息的噪声信息,进而获取局部信息加密系数。
在本发明实施例中,对量化语谱图进行Harris角点检测,获取量化语谱图中对应的角点,而这些角点对应的量化语谱图中像素点拐角点的位置,即构成文本数据文字形状的关键点。为了减少角点之间的分布关系(即角点和角点之间会构成文字的笔划),将相邻的角点进行连接(其中连接的方式为,沿着文字类像素点顺时针方向进行连接),构成角点边,获取角点边的方向角度,其中第个角点和第个角点构成的角点边的方向角度的计算表达式为:
需要说明的是,为了减少量化语谱图中角点的信息表征能力,通过计算像素点的局部信息加密系数来计算每个像素点的噪声信息加密程度,其中先通过角点的局部信息加密系数来获取其余像素点的局部信息加密系数。角点的局部信息加密系数与角点的相邻两个角点边的长度以及方向角度差异有关,该角点的相邻两个角点边之间长度以及方向角度的差异越大,则表明该角点对于文字的形状的表征能力就越大,则对应的该角点的局部信息加密系数越大,越可以使得后续通过局部加密系数对音频信号添加噪声后保证文本数据具有更强的隐蔽性。
其中表示第个角点的局部信息加密系数;表示第个角点和第个角点构成的角点边的方向角度;表示第个角点和第个角点构成的角点边的方向角度;表示第个角点和第个角点构成的角点边的长度;表示第个角点和第个角点构成的角点边的长度。通过角点的相邻两个角点边之间长度均值以及方向角度的差异来表征该角点对于文字的形状的表征能力。若该角点的相邻的两个角点边长度越长,相邻的两个角点边的角度差越大,表明该角点是构成文字形状的主要的拐角点,即文字的主要笔划的构成点,则表明该点对于文字形状的表征能力就越大,则对应的该角点的局部信息加密系数越大,那么后续根据该局部信息加密系数对音频信号添加噪声后就越能够将文字信息隐藏起来,实现较好的加密效果。
同理,得到所有角点的局部信息加密系数。对于其他非角点的像素点来说,若像素点位于角点边上,则将像素点作为第一像素点,若像素点不在角点边上,则将像素点作为第二像素点。则每个第一像素点的局部信息加密系数与构成角点边的两个角点的局部信息加密系数有关,因此本发明实施例中以第一像素点和角点之间的欧式距离作为权重,根据构成角点边的两个角点的局部信息加密系数以及权重获取第一像素点的局部信息加密系数。则对应的,第个第一像素点位于第个角点和第个角点构成的角点角点边上,则第个第一像素点的局部信息加密系数的计算表达式为:
另一个实施方式中,为了进一步增加第二像素点的信息隐蔽性,可将每个量化语谱图像中所有第一像素点的局部信息加密系数的均值作为每个第二像素点的局部信息加密系数。
需要说明的是,对一段文本数据而言,文字和文字之间存在一定的语义关系,为了减少文字之间的语义关系的识别,还需要通过整体文字与其他文字进行相邻整体信息加密系数的计算。
在本发明实施例中,将每个文字的量化语谱图按照研发项目文书原文件中文字的顺序进行排列,按照十个文字为一行,下一个文字另起一行的顺序将所有文字的量化语谱图排列成一个二维矩阵的形式,二维矩阵的共有10列。对于每个量化语谱图,其8邻域内共有9个量化语谱图(包含每个量化语谱图本身),如将第个量化语谱图记为,则其八邻域内的量化语谱图为(包含第个量化语谱图本身)。通过计算第个量化语谱图中第个像素点与第个量化语谱图八邻域内的量化语谱图中第像素点之间的像素值方差,来表征第个量化语谱图中第个像素点的相邻整体信息加密系数。具体的,第个量化语谱图中第个像素点的相邻整体信息加密系数的计算表达式为:
其中表示第个量化语谱图中第个像素点的相邻整体信息加密系数;表示第个量化语谱图中的八邻域内第个量化语谱图中第个像素点的像素值;表示第个量化语谱图中的八邻域内第个量化语谱图中第个像素点的像素值;表示第个量化语谱图中的八邻域内所有量化语谱图中第个像素点的像素值的均值;通过量化语谱图的像素点,与其八邻域内的量化语谱图中同一位置的像素点之间的像素值方差,来表征量化语谱图中同一位置的像素点之间的像素差异,差异越大,则表明当前像素点的对于其八邻域内的语谱图差异更加明显,则其像素点的信息表征能力越大,则对应的对于该像素点的相邻整体信息加密系数需要越大,使得后续根据相邻整体信息加密系数对音频信号添加噪声后保证文本数据具有更强的隐蔽性。
至此,得到量化语谱图中所有像素点的相邻整体信息加密系数。
至此,根据量化语谱图中表征的文本数据其本身的特征以及文本数据的分布特征获取量化语谱图中每个像素点的局部信息加密系数以及相邻整体信息加密系数。
103.获取每个像素点的噪声程度,根据噪声程度获取量化噪声语谱图,得到密文音频信号。
其中为第个量化语谱图中第个像素点的噪声程度;为第个量化语谱图中第个像素点的局部信息加密系数;为第个量化语谱图中第个像素点的相邻整体信息加密系数;表示第个量化语谱图中所有像素点的像素值均值,作为调整超参数;为双曲正切函数;每个像素点需要的噪声程度与局部信息加密系数以及相邻整体信息加密系数有关,像素点的局部信息加密系数越大,表明该点对于文字形状的表征能力就越大,则对应的噪声程度就越大;像素点的相邻整体信息加密系数越大,表明该点对于其邻域内的语谱图差异更加明显,则其像素点的信息表征能力越大,则对应的噪声程度就越大。
将量化噪声语谱图通过正弦函数映射变化实现图像到音频信号的转变,进而获得加入噪声信息后的音频信号,作为密文音频信号。其中量化噪声语谱图转换为音频信号的映射变化采用正弦函数映射,根据量化噪声语谱图的大小以及音频信号的语音长度进行正弦函数映射。该正弦函数映射的输入数据:每个文字的音频信号的语音长度、正弦函数、量化噪声语谱图的大小;输出数据:量化噪声语谱图对应的音频信号(具体实现过程可参考马玉洁的论文《基于时频分析的语音增强方法研究》)。
至此,根据量化语谱图中每个像素点的局部信息加密系数以及相邻整体信息加密系数,获取了密文音频信号。
本方案实施例以文字“孙”为例,密文音频信号参见图4,量化噪声语谱图参见图5。
104.获取明文音频信号,结合密文音频信号获取密钥,根据密钥进行研发项目数据管理。
在本发明实施例中将密文音频信号作为加密存储的载体。将步骤101中获取的每个文字的音频信号作为明文音频信号。
由于音频信号的噪声信息体现在声波的频率以及幅度的变化,因此密钥即为:明文音频信号减去密文音频信号的值。对应到音频信号中,明文音频信号的第时刻内的音频信号的振幅值为,密文音频信号的第时刻内的音频信号的振幅值为,则第时刻明文音频信号与密文的振幅值差异为。获取每一时刻明文音频信号与密文音频信号的差异作为对应的密钥。
将密文音频信号存储至服务器中,并将其对应的密钥相应的传输至服务器中进行保存。将对应的密钥下发到每个登陆服务器的用户中,当用户访问服务器读取数据时,输入密钥才可以显示消除噪声后的音频信号(即明文音频信号)。消除噪声后的音频信号为无噪声影响的数据,用户可以对无噪声影响的数据进行下载分析处理。
通过以上步骤,完成了企业研发项目数据管理。
本发明实施例通过将文本数据转换为音频数据,根据音频数据的语谱图特性,利用数据中每个文字信息的拐角点的特性以及文字之间的语义关系,获取语谱图中每个像素点的局部信息加密系数以及相邻整体信息加密系数,来自适应获取每个像素点的噪声程度,并根据噪声程度进行量化获取加入噪声信息的音频信号。每个文字信息的拐角点特性表征着每个文字的结构以及对应的形状,本发明通过对每个文字信息的拐角特性量化局部信息加密系数,利用局部信息加密系数往音频信号加入噪声,使得文字的拐角点的加密效果更好;相邻文字信息之间的分布特征表征每个文字的语义信息的分布,本发明通过对相邻文字信息之间的特性量化相邻整体信息加密系数,使得文字之间的语义信息减少。相较于现有技术的文本数据的加密方法,本发明能够通过结合每个文字的结构特性以及文字之间的语义关系分布,来自适应获取加入噪声信息的程度以及往音频信号加入噪声,为数据加密提供准确的噪声程度系数的参考。本发明通过存储加入噪声后的音频信号,实现研发项目数据的安全存储,并大大的加强了文本数据的信息的隐蔽性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (3)
1.一种中小企业研发项目数据管理方法,其特征在于,该方法包括以下步骤:
采集企业研发项目中的文本数据,对文本数据进行文本图像分割,得到每个文字的图像;
根据每个文字的图像获取每个文字的语谱图;对每个语谱图进行量化处理得到量化语谱图,获取每个量化语谱图中的角点以及角点边;计算每个角点边的方向角度;根据每个角点边的方向角度以及长度获取每个角点的局部信息加密系数;
将每个量化语谱图中的非角点分为第一像素点与第二像素点;根据每个量化语谱图中每个角点的局部信息加密系数获取每个量化语谱图中每个第一像素点的局部信息加密系数;将每个量化语谱图中所有第一像素点的局部信息加密系数的均值作为每个量化语谱图中每个第二像素点的局部信息加密系数;
将所有量化语谱图构建成一个二维矩阵,根据每个量化语谱图在二维矩阵中八邻域范围内的量化语谱图获取每个量化语谱图中每个像素点的相邻整体信息加密系数;
根据每个像素点的局部信息加密系数以及相邻整体信息加密系数获取每个像素点噪声程度;将每个量化语谱图中每个像素点的像素值加上噪声程度得到量化噪声语谱图;
将每个量化噪声语谱图转换成音频信号,作为密文音频信号;获取每个文字的音频信号,作为明文音频信号;将明文音频信号与密文音频信号中每一时刻的振幅值差异作为密钥;将密文音频信号以及密钥进行存储;
所述方向角度的表达式为:
所述每个角点的局部信息加密系数的表达式为:
其中表示第个角点的局部信息加密系数;表示第个角点和第个角点构成的角点边的方向角度;表示第个角点和第个角点构成的角点边的方向角度;表示第个角点和第个角点构成的角点边的长度;表示第个角点和第个角点构成的角点边的长度;
所述将每个量化语谱图中的非角点分为第一像素点与第二像素点包括:
将每个量化语谱图中位于角点边上的非角点作为第一像素点,将每个量化语谱图中不在角点边上的非角点作为第二像素点;
所述每个第一像素点的局部信息加密系数的表达式为:
所述相邻整体信息加密系数的表达式为:
所述噪声程度的表达式为:
2.根据权利要求1所述的一种中小企业研发项目数据管理方法,其特征在于,所述对每个语谱图进行量化处理得到量化语谱图包括:
将每个语谱图中每个像素点的能量值进行最大值最小值归一化再乘以255并取整,得到每个像素点的像素值,所有像素点的像素值构成量化语谱图。
3.根据权利要求1所述的一种中小企业研发项目数据管理方法,其特征在于,所述获取每个量化语谱图中的角点以及角点边包括:
对每个量化语谱图进行角点检测,获取每个量化语谱图中所有角点;将每个角点与所述角点顺时针方向上相邻的角点连接构成角点边。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211341523.3A CN115470507B (zh) | 2022-10-31 | 2022-10-31 | 一种中小企业研发项目数据管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211341523.3A CN115470507B (zh) | 2022-10-31 | 2022-10-31 | 一种中小企业研发项目数据管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115470507A CN115470507A (zh) | 2022-12-13 |
CN115470507B true CN115470507B (zh) | 2023-02-07 |
Family
ID=84336183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211341523.3A Active CN115470507B (zh) | 2022-10-31 | 2022-10-31 | 一种中小企业研发项目数据管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115470507B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069843A (zh) * | 2015-08-22 | 2015-11-18 | 浙江中测新图地理信息技术有限公司 | 一种面向城市三维建模的密集点云的快速提取方法 |
CN108847252A (zh) * | 2018-04-26 | 2018-11-20 | 杭州电子科技大学 | 基于声信号语谱图纹理分布的声特征提取方法 |
US11194330B1 (en) * | 2017-11-03 | 2021-12-07 | Hrl Laboratories, Llc | System and method for audio classification based on unsupervised attribute learning |
CN114861139A (zh) * | 2022-05-30 | 2022-08-05 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频处理方法、版权读取方法及计算机设备、存储介质 |
WO2022179264A1 (zh) * | 2021-02-27 | 2022-09-01 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音频生成方法及设备 |
WO2022178941A1 (zh) * | 2021-02-26 | 2022-09-01 | 平安科技(深圳)有限公司 | 语音合成方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112331232B (zh) * | 2020-11-06 | 2022-08-12 | 杭州电子科技大学 | 一种结合cgan谱图去噪和双边滤波谱图增强的语音情感识别方法 |
-
2022
- 2022-10-31 CN CN202211341523.3A patent/CN115470507B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069843A (zh) * | 2015-08-22 | 2015-11-18 | 浙江中测新图地理信息技术有限公司 | 一种面向城市三维建模的密集点云的快速提取方法 |
US11194330B1 (en) * | 2017-11-03 | 2021-12-07 | Hrl Laboratories, Llc | System and method for audio classification based on unsupervised attribute learning |
CN108847252A (zh) * | 2018-04-26 | 2018-11-20 | 杭州电子科技大学 | 基于声信号语谱图纹理分布的声特征提取方法 |
WO2022178941A1 (zh) * | 2021-02-26 | 2022-09-01 | 平安科技(深圳)有限公司 | 语音合成方法、装置、设备及存储介质 |
WO2022179264A1 (zh) * | 2021-02-27 | 2022-09-01 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音频生成方法及设备 |
CN114861139A (zh) * | 2022-05-30 | 2022-08-05 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频处理方法、版权读取方法及计算机设备、存储介质 |
Non-Patent Citations (3)
Title |
---|
On sound signal processing in image to sound mapping technique;Arata Kawamura;《Applied Acoustics》;20170228;第117卷;第1-11页 * |
Semantic Labeling of Quality Impairments in Speech Spectrograms with Deep Convolutional Networks;Gabriel Mittag 等;《 2019 Eleventh International Conference on Quality of Multimedia Experience (QoMEX)》;20190624;第1-3页 * |
基于兴趣点多特征融合的图像检索方法;陈艳利;《中国优秀硕士学位论文全文数据库 信息科技辑》;20121015(第10期);第I138-2470页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115470507A (zh) | 2022-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103999076B (zh) | 包括将声音信号变换成频率调频域的处理声音信号的系统和方法 | |
CN108711436B (zh) | 基于高频和瓶颈特征的说话人验证系统重放攻击检测方法 | |
US8411977B1 (en) | Audio identification using wavelet-based signatures | |
US7457749B2 (en) | Noise-robust feature extraction using multi-layer principal component analysis | |
CN103403710B (zh) | 对来自音频信号的特征指纹的提取和匹配 | |
WO2018223727A1 (zh) | 识别声纹的方法、装置、设备及介质 | |
CN111091841B (zh) | 一种基于深度学习的身份认证音频水印算法 | |
US20160149904A1 (en) | Systems and methods to generate authorization data based on biometric data and non-biometric data | |
CN109326294B (zh) | 一种文本相关的声纹密钥生成方法 | |
US8185390B2 (en) | Zero-search, zero-memory vector quantization | |
US20170169084A9 (en) | Method and System for Analysing, Storing, and Regenerating Information | |
Chen et al. | Robust audio hashing based on discrete-wavelet-transform and non-negative matrix factorisation | |
Zhang et al. | An encrypted speech retrieval algorithm based on Chirp-Z transform and perceptual hashing second feature extraction | |
CN115470507B (zh) | 一种中小企业研发项目数据管理方法 | |
Ghosh et al. | Processing speech signal using auditory-like filterbank provides least uncertainty about articulatory gestures | |
Su et al. | New design paradigm of distortion cost function for efficient JPEG steganography | |
US20070076869A1 (en) | Digital goods representation based upon matrix invariants using non-negative matrix factorizations | |
Vadlamudi et al. | Robust hash generation technique for content-based image authentication using histogram | |
CN111028847B (zh) | 一种基于后端模型的声纹识别优化方法和相关装置 | |
Raj et al. | Multilayered convolutional neural network-based auto-CODEC for audio signal denoising using mel-frequency cepstral coefficients | |
Liu et al. | An efficient audio fingerprint design for MP3 music | |
CN1638328B (zh) | 基于矩阵不变性的数字商品表示 | |
CN103180847A (zh) | 音乐查询方法和装置 | |
US20100241423A1 (en) | System and method for frequency to phase balancing for timbre-accurate low bit rate audio encoding | |
Yuanchao et al. | Improved pitch shifting data augmentation for ship-radiated noise classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |