CN116915258A - 一种企业薪酬管理方法及系统 - Google Patents
一种企业薪酬管理方法及系统 Download PDFInfo
- Publication number
- CN116915258A CN116915258A CN202311166675.9A CN202311166675A CN116915258A CN 116915258 A CN116915258 A CN 116915258A CN 202311166675 A CN202311166675 A CN 202311166675A CN 116915258 A CN116915258 A CN 116915258A
- Authority
- CN
- China
- Prior art keywords
- character
- type
- salary data
- index
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007726 management method Methods 0.000 title claims abstract description 30
- 238000009825 accumulation Methods 0.000 claims abstract description 61
- 238000000034 method Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 238000013144 data compression Methods 0.000 abstract description 13
- 238000007906 compression Methods 0.000 description 17
- 230000006835 compression Effects 0.000 description 16
- 230000000694 effects Effects 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3068—Precoding preceding compression, e.g. Burrows-Wheeler transformation
- H03M7/3077—Sorting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
- G06Q10/1053—Employment or hiring
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6035—Handling of unkown probabilities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Economics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及金融数据处理技术领域,具体涉及一种企业薪酬管理方法及系统,包括:根据待压缩的薪酬数据中每类字符的出现频率,确定该薪酬数据中每类字符的排布优先指标值;并根据该薪酬数据中每类字符中的各个字符的索引位置与该薪酬数据中字符排布的中值索引位置的差异,确定该薪酬数据中每类字符的优先级影响因子;基于排布优先指标值和优先级影响因子,确定该薪酬数据中每类字符的优先级指标,从而确定该薪酬数据中的各类字符在分布累计表中的排列次序,并构造分布累计表;根据该分布累计表,对薪酬数据进行压缩,得到压缩后的薪酬数据。本发明通过自适应确定分布累计表,有效提高了数据压缩效率。
Description
技术领域
本发明涉及金融数据处理技术领域,具体涉及一种企业薪酬管理方法及系统。
背景技术
随着企业规模和员工数量的增长,企业薪酬管理会变得越来越复杂,同时薪酬数据的存储和传输也面临着安全和效率的挑战。在企业薪酬管理中,薪酬数据通常包括员工的基本信息、薪资结构、绩效评估结果等。这些数据通常是结构化的,并且存在一定的重复性。因此,利用数据压缩技术对薪酬数据进行压缩可以有效地减少薪酬数据的存储和传输成本。
在传统的压缩算法中,熵编码压缩RANS算法可以通过统计数据的重复项的频数构建分布累计表,并基于该分布累计表对数据进行压缩,可以有效地降低数据中的重复项冗余。然而,在传统的RANS算法压缩过程中,由于RANS算法所构建的分布累计表中的各类字符的分布顺序是随机的,而不同的分布顺序会对最终的压缩效果产生不同的影响,导致数据的压缩效果不可控,无法实现数据最优压缩,从而不利于企业薪酬管理。
发明内容
本发明的目的在于提供一种企业薪酬管理方法及系统,用于解决现有企业薪酬管理过程中数据压缩效果较差的问题。
为解决上述技术问题,本发明提供了一种企业薪酬管理方法,包括以下步骤:
获取待压缩的薪酬数据,对所述薪酬数据中每类字符出现的频次进行统计,确定所述薪酬数据中每类字符的出现频率;
根据所述薪酬数据中每类字符的出现频率,确定所述薪酬数据中每类字符的排布优先指标值,所述排布优先指标值与所述出现频率成负相关关系;
确定所述薪酬数据中字符排布的中值索引位置,并根据所述薪酬数据中每类字符中的各个字符的索引位置与所述中值索引位置的差异,确定所述薪酬数据中每类字符的优先级影响因子;
根据所述薪酬数据中每类字符的排布优先指标值和优先级影响因子,确定所述薪酬数据中每类字符的优先级指标;
构造所述薪酬数据的分布累计表,所述薪酬数据中的各类字符在所述分布累计表中的排列次序根据所述薪酬数据中每类字符的优先级指标确定;
根据所述分布累计表,对所述薪酬数据进行压缩,得到压缩后的薪酬数据。
进一步的,确定所述薪酬数据中每类字符的优先级影响因子,包括:
确定所述薪酬数据中每类字符中的各个字符的索引位置的平均值,从而得到所述薪酬数据中每类字符的索引位置均值;
根据所述薪酬数据中每类字符的索引位置均值与所述中值索引位置的差异,确定所述薪酬数据中每类字符的整体索引位置指标;
根据所述薪酬数据中每类字符中的各个字符的索引位置分布,确定所述薪酬数据中每类字符的索引位置离散指标;
根据所述薪酬数据中每类字符的整体索引位置指标和索引位置离散指标,确定所述薪酬数据中每类字符的优先级影响因子,所述整体索引位置指标与所述优先级影响因子成负相关关系,所述索引位置离散指标与所述优先级影响因子成正相关关系。
进一步的,确定所述薪酬数据中每类字符的索引位置离散指标,包括:
将所述薪酬数据中每类字符中的各个字符的索引位置的方差,确定为所述薪酬数据中每类字符的索引位置离散指标。
进一步的,确定所述薪酬数据中每类字符的优先级影响因子,对应的计算公式为:
其中, 表示所述薪酬数据中第a类字符的优先级影响因子;/>表示所述薪酬数据中第a类字符的整体索引位置指标;/>表示所述薪酬数据中第a类字符的索引位置离散指标;/>表示大于0的调节常数;/>以自然常数e为底数的指数函数。
进一步的,确定所述薪酬数据中字符排布的中值索引位置,包括:
确定所述薪酬数据中所有字符的总数目,并将所述总数目的一半确定为所述薪酬数据中字符排布的中值索引位置。
进一步的,确定所述薪酬数据中每类字符的排布优先指标值,对应的计算公式为:
其中,表示所述薪酬数据中第a类字符的排布优先指标值;/>表示所述薪酬数据中第a类字符的出现频率;/>表示调节参数;/>表示以自然常数e为底数的指数函数。
进一步的,按照所述优先级指标从大到小的顺序,对所述薪酬数据中的各类字符进行排列,从而得到所述薪酬数据中的各类字符在分布累计表中的排列次序。
进一步的,确定所述薪酬数据中每类字符的优先级指标,包括:
将所述薪酬数据中每类字符的排布优先指标值和优先级影响因子的乘积值,确定为所述薪酬数据中每类字符的优先级指标。
进一步的,采用RANS算法对所述薪酬数据进行压缩。
为了解决上述技术问题,本发明还提供了一种企业薪酬管理系统,包括:存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述一种企业薪酬管理方法的步骤。
本发明具有如下有益效果:在数据压缩过程中,由于频率较大的字符会在分布累计表中被赋予较大的编码范围,频率较小的字符会被赋予较小的编码范围且在编码时需要更多的比特位,字符出现的频率会影响到最终数据压缩的效率,因此通过统计薪酬数据中每类字符的出现频率,使出现频率较低的字符更优先排序,确定受到字符出现频率影响下的每类字符在分布累计表中的排布优先情况,从而得到每类字符的排布优先指标值。同时,在根据分布累计表对数据进行编码时,每对一个字符进行编码,都需要查找其在分布累计表中所对应的取值,该取值越小,则编码完成后得到的整数就越小,因此字符的位置分布也会影响到最终数据压缩的效率。所以,通过对薪酬数据中每类字符中的各个字符的索引位置进行分析,可以确定受到字符位置分布影响下的每类字符在分布累计表中的排布优先情况,从而得到每类字符的优先级影响因子。最终综合考虑薪酬数据中每类字符的排布优先指标值和优先级影响因子,确定每类字符的优先级指标,从而确定各类字符在分布累计表中的排列次序,最终实现薪酬数据的更高效压缩,有效提供了数据压缩效率,便于企业薪酬管理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明实施例的企业薪酬管理方法的流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的技术方案的具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。另外,本文所涉及公式中的所有参数或者指标均为归一化之后的消除了量纲影响的数值。
为了解决现有企业薪酬管理过程中数据压缩效果较差的问题,本实施例提供了一种企业薪酬管理方法。该方法通过分析企业薪酬数据中的各类字符的分布特征,自适应获取分布累计表中的各类字符的分布顺序,从而使利用调整后的分布累计表对数据进行压缩时的结果最优,以达到使企业薪酬管理系统在一定的存储空间内可以存储更多的数据的目的。
本实施例所提供的一种企业薪酬管理方法的流程图如图1所示,具体包括以下步骤:
步骤S1:获取待压缩的薪酬数据,对所述薪酬数据中每类字符出现的频次进行统计,确定所述薪酬数据中每类字符的出现频率。
企业薪酬数据是指记录和统计企业员工薪资报酬等各类信息的数据,这些数据中包括员工的基本工资、绩效奖金、年终奖金、福利待遇、加班工资等各种薪酬相关信息。企业薪酬数据可以用于薪酬管理、绩效评估、薪酬调整、人力资源规划等方面的决策和分析。由于企业薪酬数据的数据量较大,在企业薪酬管理过程中通常需要对企业薪酬数据进行压缩存储。
RANS算法的主要思想是将需要压缩的字符串利用分布累计表编码为一个整数,该整数转化为二进制数据的长度即为压缩后的编码长度。而由于企业薪酬数据中包括许多固定的结构化数据,所以数据中的各个字符的局部特性较强,从而导致各个字符的分布位置不同,利用固定的分布累计表进行压缩时,无法实现数据的最优压缩,因此需要分析数据中的各类字符的分布特征,对分布累计表中的字符顺序进行排列调整,使数据利用调整后的分布累计表进行编码压缩的数据长度变小,即使数据的压缩效果提升。
基于上述分析,为了实现企业薪酬数据的最优压缩,首先获取企业薪酬数据对应的字符序列数据,并将该字符序列数据称为薪酬数据,后续进行数据压缩所涉及到的薪酬数据均是指该字符序列数据。遍历该薪酬数据,获取该薪酬数据中的字符种类总数、各类字符的频数以及各类字符的分布位置。根据该薪酬数据中各类字符的频数以及所有字符的总数目,可以确定该薪酬数据中各类字符的出现频率。同时,根据该薪酬数据中各类字符的分布位置,可以确定该薪酬数据中各类字符中每个字符的索引位置。
步骤S2:根据所述薪酬数据中每类字符的出现频率,确定所述薪酬数据中每类字符的排布优先指标值,所述排布优先指标值与所述出现频率成负相关关系。
在传统的RANS算法中,字符的频率用于计算每一个字符在分布累计表中的概率分布情况,使频率较大的字符被赋予较大的编码范围,频率较小的字符被赋予较小的编码范围,然后将这些字符赋予到的编码范围进行随机排序,这些字符的编码范围累加和所构成的区间即可构成分布累计表。由于分布累计表中字符的编码范围是随机排布的,因此无法保证所编码出的整数尽可能小,因此无法保证最终的数据压缩效果。
薪酬数据通常由不同部门和级别的薪酬组成,而薪酬的类型又包括基本工资、津贴、奖金等多种,因此薪酬数据中的字符会存在一定的局部分布特性,即数据中存在一些字符的频率较高,而另外一些字符的频率较低。同时,由于企业中的高级管理层和核心岗位相对较少,而普通员工较多,因此数据中会存在一些字符的频率相差较大。
基于上述薪酬数据的分布特点,考虑到在采用RANS算法进行数据压缩的过程中,频率较小的字符在编码时需要更多的比特位,通过令频率较小的字符的优先级更高,可以使其在增加等量的比特位的基础上,使对频率较小的字符进行编码后的整数增加量尽可能小,从而使将数据编码完成后的整数取值尽可能小。
基于上述分析,根据薪酬数据中每类字符的出现频率,可以确定薪酬数据中每类字符的排布优先指标值,对应的计算公式为:
其中,表示所述薪酬数据中第a类字符的排布优先指标值;/>表示所述薪酬数据中第a类字符的出现频率;/>表示调节参数,本实施例设置/>;/>表示以自然常数e为底数的指数函数。
根据上述的排布优先指标值的计算公式可知,若薪酬数据中第a类字符的出现频率越小,说明该第a类字符在分布累计表中越应该优先排序,此时该第a类字符的排布优先指标值就越大。
步骤S3:确定所述薪酬数据中字符排布的中值索引位置,并根据所述薪酬数据中每类字符中的各个字符的索引位置与所述中值索引位置的差异,确定所述薪酬数据中每类字符的优先级影响因子。
在采用RANS算法进行数据压缩的过程中,需要根据分布累计表对数据进行编码,使每一次所编码完成的数据都为一个整数,每对一位字符进行编码,都需要查找其在分布累计表中所对应的取值,若该取值越小,则编码完成后得到的整数就越小,从而使最终编码完成后得到的数据长度越短,即压缩效果越好。
由于在薪酬数据中包括不同部门和级别的薪酬,且薪酬的种类又比较多样化,这就导致在薪酬数据中各类字符的分布情况不同。在采用RANS算法对薪酬数据进行编码时,按照薪酬数据中字符的顺序进行编码,若薪酬数据中索引位置靠前的字符在分布累计表中的优先级较低,即索引位置靠前的字符在分布累计表中的位置靠后,则该字符在分布累计表中所对应的取值就较大,在编码时就会使编码完成后所得到的整数过大,那么就会使得在对后续字符进行编码的过程中,编码完成后所得到的整数越来越大,编码长度越来越长。基于这种特点,需要对薪酬数据中各类字符的位置分布情况进行分析,确定薪酬数据中每类字符的优先级影响因子,并将该优先级影响因子与排布优先指标值相结合,最终使薪酬数据中索引位置靠前的字符在分布累计表中更优先排序,从而保证最终的数据压缩效果。
为了确定薪酬数据中每类字符的优先级影响因子,首先需要确定该薪酬数据中字符排布的中值索引位置,即:确定所述薪酬数据中所有字符的总数目,并将所述总数目的一半确定为所述薪酬数据中字符排布的中值索引位置。
在确定薪酬数据中字符排布的中值索引位置之后,将薪酬数据中每类字符中的各个字符的索引位置与该中值索引位置进行比较,从而确定该薪酬数据中每类字符的优先级影响因子,实现步骤包括:
确定所述薪酬数据中每类字符中的各个字符的索引位置的平均值,从而得到所述薪酬数据中每类字符的索引位置均值;
根据所述薪酬数据中每类字符的索引位置均值与所述中值索引位置的差异,确定所述薪酬数据中每类字符的整体索引位置指标;
根据所述薪酬数据中每类字符中的各个字符的索引位置分布,确定所述薪酬数据中每类字符的索引位置离散指标;
根据所述薪酬数据中每类字符的整体索引位置指标和索引位置离散指标,确定所述薪酬数据中每类字符的优先级影响因子,所述整体索引位置指标与所述优先级影响因子成负相关关系,所述索引位置离散指标与所述优先级影响因子成正相关关系。
可选择地,确定所述薪酬数据中每类字符的索引位置离散指标,包括:
将所述薪酬数据中每类字符中的各个字符的索引位置的方差,确定为所述薪酬数据中每类字符的索引位置离散指标。
具体的,确定该薪酬数据中每类字符的优先级影响因子,对应的计算公式为:
其中,表示薪酬数据中第a类字符的优先级影响因子;/>表示薪酬数据中字符排布的中值索引位置;/>表示薪酬数据中第/>个第a类字符的索引位置;/>表示薪酬数据中第a类字符的频次;/>表示薪酬数据中第a类字符的索引位置均值;/>表示以自然常数/>为底数的指数函数;/>表示薪酬数据中第a类字符的整体索引位置指标;/>表示薪酬数据中第a类字符的索引位置离散指标;/>表示大于0的调节常数,用于防止分母为0,本实施例设置/>。
在上述的优先级影响因子的计算公式中,也就是/>表示薪酬数据中第a类字符的索引位置均值与整个薪酬数据所有字符的索引位置中值的差异,当该差异的取值越小时,则说明第a类字符的平均索引位置在整个薪酬数据中越靠前,该差异的取值越大时,则说明第a类字符的平均索引位置在整个薪酬数据中越靠后。/>表示薪酬数据中第a类字符中各个字符的索引位置的方差,其表征了薪酬数据中第a类字符的索引位置分散程度,/>的取值越小,则说明第a类字符在整个薪酬数据中的索引位置分布越集中,分散程度越差。/>的取值越小且/>的取值越小,则说明第a类字符越集中分布在整个薪酬数据的靠前的位置,即第a类字符的整体索引位置越小,且第a类字符的各个字符索引位置越集中时,说明该第a类字符在分布累计表中越应该优先排序,此时第a类字符的优先级影响因子的取值越大。/>的取值越大且/>的取值越小,则说明第a类字符越集中分布在整个薪酬数据的靠后的位置,即第a类字符的整体索引位置越大,且第a类字符的各个字符索引位置越集中时,说明该第a类字符在分布累计表中越应该靠后排序,此时第a类字符的优先级影响因子的取值越小。
步骤S4:根据所述薪酬数据中每类字符的排布优先指标值和优先级影响因子,确定所述薪酬数据中每类字符的优先级指标。
基于上述步骤确定的薪酬数据中每类字符的排布优先指标值和优先级影响因子,确定该薪酬数据中每类字符的优先级指标,即:将所述薪酬数据中每类字符的排布优先指标值和优先级影响因子的乘积值,确定为所述薪酬数据中每类字符的优先级指标。此时,薪酬数据中每类字符的优先级指标的计算公式为:
其中,表示所述薪酬数据中第a类字符的优先级指标;/>表示所述薪酬数据中第a类字符的排布优先指标值;/>表示所述薪酬数据中第a类字符的优先级影响因子。
根据上述的优先级指标的计算公式可知,当第a类字符的排布优先指标值越大且优先级影响因子越大时,说明第a类字符在薪酬数据中的占比越小,且第a类字符越集中分布在薪酬数据靠前的位置,此时越应该将第a类字符在分布累计表中优先分布,此时对应的优先级指标的取值也就越大。
步骤S5:构造所述薪酬数据的分布累计表,所述薪酬数据中的各类字符在所述分布累计表中的排列次序根据所述薪酬数据中每类字符的优先级指标确定。
基于上述所确定的薪酬数据中每类字符的优先级指标,确定该薪酬数据中的各类字符在分布累计表中的排列次序,即:按照所述优先级指标从大到小的顺序,对所述薪酬数据中的各类字符进行排列,从而得到所述薪酬数据中的各类字符在分布累计表中的排列次序。
另外,基于分布累计表中各类字符的排布次序,按照该排布次序从前往后的顺序,确定每一类字符在分布累计表中所占区间的大小,具体计算公式为:
其中,表示分布累计表中前第n-1类字符中第a类字符所占区间的大小;/>表示分布累计表中前第n-1类字符中第a类字符在薪酬数据中的出现频率;n表示分布累计表中不同字符的种类数;/>表示向下取整符号;/>表示分布累计表中第n类字符所占区间的大小。
根据上述的每一类字符在分布累计表中所占区间的大小的计算公式可知,基于分布累计表中各类字符的排布次序,第a类字符在薪酬数据中的出现频率越大,则该类字符所占区间越大,此时在利用上述所确定的分布累计表进行压缩时,遇到该字符进行压缩时的编码长度越短。
按照分布累计表中各类字符的排布次序,在分布累计表中设置各类字符的所占区间,最终即可获得薪酬数据的各类字符在分布累计表中的排列次序和所占区间,从而实现了分布累计表的自适应调整。
步骤S6:根据所述分布累计表,对所述薪酬数据进行压缩,得到压缩后的薪酬数据。
基于上述所确定的分布累计表,对薪酬数据进行编码压缩,从而得到压缩后的薪酬数据。由于编码压缩的具体实现过程属于现有技术,此处不再赘述。 将压缩后的薪酬数据存储在企业薪酬管理系统中,便于后续对所压缩的薪酬数据的分析。
本实施例还提供了一种企业薪酬管理系统,包括:存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的一种企业薪酬管理方法的步骤。由于该企业薪酬管理系统实质上是一种软系统,其核心在于实现上述的企业薪酬管理方法,而该方法的具体实现步骤已经在上述内容中进行了详细介绍,此处对该系统不再进行赘述。
本发明通过对薪酬数据中各类字符的出现频率和分布位置特征进行分析,确定各类字符在分布累计表中的优先级指标,并根据该优先级指标对分布累计表中各类字符的排列次序进行自适应调整,使分布累计表中优先级指标越高的字符的索引越靠前,以减小最终所压缩的整数结果大小,从而达到提升压缩效果的目的。
需要说明的是:以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种企业薪酬管理方法,其特征在于,包括以下步骤:
获取待压缩的薪酬数据,对所述薪酬数据中每类字符出现的频次进行统计,确定所述薪酬数据中每类字符的出现频率;
根据所述薪酬数据中每类字符的出现频率,确定所述薪酬数据中每类字符的排布优先指标值,所述排布优先指标值与所述出现频率成负相关关系;
确定所述薪酬数据中字符排布的中值索引位置,并根据所述薪酬数据中每类字符中的各个字符的索引位置与所述中值索引位置的差异,确定所述薪酬数据中每类字符的优先级影响因子;
根据所述薪酬数据中每类字符的排布优先指标值和优先级影响因子,确定所述薪酬数据中每类字符的优先级指标;
构造所述薪酬数据的分布累计表,所述薪酬数据中的各类字符在所述分布累计表中的排列次序根据所述薪酬数据中每类字符的优先级指标确定;
根据所述分布累计表,对所述薪酬数据进行压缩,得到压缩后的薪酬数据。
2.根据权利要求1所述的一种企业薪酬管理方法,其特征在于,确定所述薪酬数据中每类字符的优先级影响因子,包括:
确定所述薪酬数据中每类字符中的各个字符的索引位置的平均值,从而得到所述薪酬数据中每类字符的索引位置均值;
根据所述薪酬数据中每类字符的索引位置均值与所述中值索引位置的差异,确定所述薪酬数据中每类字符的整体索引位置指标;
根据所述薪酬数据中每类字符中的各个字符的索引位置分布,确定所述薪酬数据中每类字符的索引位置离散指标;
根据所述薪酬数据中每类字符的整体索引位置指标和索引位置离散指标,确定所述薪酬数据中每类字符的优先级影响因子,所述整体索引位置指标与所述优先级影响因子成负相关关系,所述索引位置离散指标与所述优先级影响因子成正相关关系。
3.根据权利要求2所述的一种企业薪酬管理方法,其特征在于,确定所述薪酬数据中每类字符的索引位置离散指标,包括:
将所述薪酬数据中每类字符中的各个字符的索引位置的方差,确定为所述薪酬数据中每类字符的索引位置离散指标。
4.根据权利要求2所述的一种企业薪酬管理方法,其特征在于,确定所述薪酬数据中每类字符的优先级影响因子,对应的计算公式为:
其中, 表示所述薪酬数据中第a类字符的优先级影响因子;/>表示所述薪酬数据中第a类字符的整体索引位置指标;/>表示所述薪酬数据中第a类字符的索引位置离散指标;表示大于0的调节常数;/>以自然常数e为底数的指数函数。
5.根据权利要求1所述的一种企业薪酬管理方法,其特征在于,确定所述薪酬数据中字符排布的中值索引位置,包括:
确定所述薪酬数据中所有字符的总数目,并将所述总数目的一半确定为所述薪酬数据中字符排布的中值索引位置。
6.根据权利要求1所述的一种企业薪酬管理方法,其特征在于,确定所述薪酬数据中每类字符的排布优先指标值,对应的计算公式为:
其中,表示所述薪酬数据中第a类字符的排布优先指标值;/>表示所述薪酬数据中第a类字符的出现频率;/>表示调节参数;/>表示以自然常数e为底数的指数函数。
7.根据权利要求1所述的一种企业薪酬管理方法,其特征在于,按照所述优先级指标从大到小的顺序,对所述薪酬数据中的各类字符进行排列,从而得到所述薪酬数据中的各类字符在分布累计表中的排列次序。
8.根据权利要求1所述的一种企业薪酬管理方法,其特征在于,确定所述薪酬数据中每类字符的优先级指标,包括:
将所述薪酬数据中每类字符的排布优先指标值和优先级影响因子的乘积值,确定为所述薪酬数据中每类字符的优先级指标。
9.根据权利要求1所述的一种企业薪酬管理方法,其特征在于,采用RANS算法对所述薪酬数据进行压缩。
10.一种企业薪酬管理系统,其特征在于,包括:存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-9任意一项所述一种企业薪酬管理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311166675.9A CN116915258B (zh) | 2023-09-12 | 2023-09-12 | 一种企业薪酬管理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311166675.9A CN116915258B (zh) | 2023-09-12 | 2023-09-12 | 一种企业薪酬管理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116915258A true CN116915258A (zh) | 2023-10-20 |
CN116915258B CN116915258B (zh) | 2023-12-01 |
Family
ID=88360585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311166675.9A Active CN116915258B (zh) | 2023-09-12 | 2023-09-12 | 一种企业薪酬管理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116915258B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117155406A (zh) * | 2023-10-30 | 2023-12-01 | 深圳市成为高科技有限公司 | 一种社会调查数据智能管理系统 |
CN117176178A (zh) * | 2023-11-03 | 2023-12-05 | 深圳市华宜达通信设备有限公司 | 一种光电通信系统的数据处理方法 |
CN117171399A (zh) * | 2023-11-02 | 2023-12-05 | 吉林省有继科技有限公司 | 基于云平台的新能源数据优化存储方法 |
CN117278055A (zh) * | 2023-11-07 | 2023-12-22 | 杭州易靓好车互联网科技有限公司 | 基于数据分析的车辆销售信息优化存储方法 |
CN117278056A (zh) * | 2023-11-22 | 2023-12-22 | 湖南立人科技有限公司 | 一种社保信息处理方法及系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4870662A (en) * | 1987-12-01 | 1989-09-26 | Concord Data Systems, Inc. | System and method for compressing transmitted or stored data |
US6075470A (en) * | 1998-02-26 | 2000-06-13 | Research In Motion Limited | Block-wise adaptive statistical data compressor |
US20030030575A1 (en) * | 2001-05-07 | 2003-02-13 | Harmonic Data Systems Ltd. | Lossless data compression |
US6674908B1 (en) * | 2002-05-04 | 2004-01-06 | Edward Lasar Aronov | Method of compression of binary data with a random number generator |
CN101350624A (zh) * | 2008-09-11 | 2009-01-21 | 中国科学院计算技术研究所 | 一种支持ansi编码的中文文本的压缩方法 |
US20160248440A1 (en) * | 2015-02-11 | 2016-08-25 | Daniel Greenfield | System and method for compressing data using asymmetric numeral systems with probability distributions |
CN111600609A (zh) * | 2020-05-19 | 2020-08-28 | 东南大学 | 一种优化中文存储的dna存储编码方法 |
CN111930697A (zh) * | 2020-07-09 | 2020-11-13 | 北京皮尔布莱尼软件有限公司 | 一种基于3d信息的数据传输方法、计算设备及系统 |
CN112131865A (zh) * | 2020-09-11 | 2020-12-25 | 成都运达科技股份有限公司 | 一种轨道交通报文数字压缩处理方法、装置及存储介质 |
CN114520659A (zh) * | 2022-02-21 | 2022-05-20 | 上海大学 | 结合rANS和LZ4编码的数据无损压缩、解码方法 |
CN115459782A (zh) * | 2022-08-29 | 2022-12-09 | 北京思维实创科技有限公司 | 基于时序分割和聚类的工业物联网高频数据压缩方法 |
CN116542697A (zh) * | 2023-07-04 | 2023-08-04 | 酒仙网络科技股份有限公司 | 基于大数据的白酒线上销售供货管理系统 |
CN116723337A (zh) * | 2023-08-10 | 2023-09-08 | 深圳市君兰电子有限公司 | 一种hdmi高清数据优化传输方法及系统 |
-
2023
- 2023-09-12 CN CN202311166675.9A patent/CN116915258B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4870662A (en) * | 1987-12-01 | 1989-09-26 | Concord Data Systems, Inc. | System and method for compressing transmitted or stored data |
US6075470A (en) * | 1998-02-26 | 2000-06-13 | Research In Motion Limited | Block-wise adaptive statistical data compressor |
US20030030575A1 (en) * | 2001-05-07 | 2003-02-13 | Harmonic Data Systems Ltd. | Lossless data compression |
US6674908B1 (en) * | 2002-05-04 | 2004-01-06 | Edward Lasar Aronov | Method of compression of binary data with a random number generator |
CN101350624A (zh) * | 2008-09-11 | 2009-01-21 | 中国科学院计算技术研究所 | 一种支持ansi编码的中文文本的压缩方法 |
US20160248440A1 (en) * | 2015-02-11 | 2016-08-25 | Daniel Greenfield | System and method for compressing data using asymmetric numeral systems with probability distributions |
CN111600609A (zh) * | 2020-05-19 | 2020-08-28 | 东南大学 | 一种优化中文存储的dna存储编码方法 |
CN111930697A (zh) * | 2020-07-09 | 2020-11-13 | 北京皮尔布莱尼软件有限公司 | 一种基于3d信息的数据传输方法、计算设备及系统 |
CN112131865A (zh) * | 2020-09-11 | 2020-12-25 | 成都运达科技股份有限公司 | 一种轨道交通报文数字压缩处理方法、装置及存储介质 |
CN114520659A (zh) * | 2022-02-21 | 2022-05-20 | 上海大学 | 结合rANS和LZ4编码的数据无损压缩、解码方法 |
CN115459782A (zh) * | 2022-08-29 | 2022-12-09 | 北京思维实创科技有限公司 | 基于时序分割和聚类的工业物联网高频数据压缩方法 |
CN116542697A (zh) * | 2023-07-04 | 2023-08-04 | 酒仙网络科技股份有限公司 | 基于大数据的白酒线上销售供货管理系统 |
CN116723337A (zh) * | 2023-08-10 | 2023-09-08 | 深圳市君兰电子有限公司 | 一种hdmi高清数据优化传输方法及系统 |
Non-Patent Citations (2)
Title |
---|
HEEHUN JEONG: "Lossless Data Compression with Bit-back Coding on Massive Smart Meter Data,", 《2022 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA)》, pages 6667 - 6669 * |
TOBÍAS ALONSO: "LOCO-ANS: An Optimization of JPEG-LS Using an Efficient and Low-Complexity Coder Based on ANS", 《IEEE ACCESS 》, pages 106606 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117155406A (zh) * | 2023-10-30 | 2023-12-01 | 深圳市成为高科技有限公司 | 一种社会调查数据智能管理系统 |
CN117155406B (zh) * | 2023-10-30 | 2024-02-02 | 深圳市成为高科技有限公司 | 一种社会调查数据智能管理系统 |
CN117171399A (zh) * | 2023-11-02 | 2023-12-05 | 吉林省有继科技有限公司 | 基于云平台的新能源数据优化存储方法 |
CN117176178A (zh) * | 2023-11-03 | 2023-12-05 | 深圳市华宜达通信设备有限公司 | 一种光电通信系统的数据处理方法 |
CN117176178B (zh) * | 2023-11-03 | 2024-04-12 | 深圳市华宜达通信设备有限公司 | 一种光电通信系统的数据处理方法 |
CN117278055A (zh) * | 2023-11-07 | 2023-12-22 | 杭州易靓好车互联网科技有限公司 | 基于数据分析的车辆销售信息优化存储方法 |
CN117278055B (zh) * | 2023-11-07 | 2024-04-16 | 杭州易靓好车互联网科技有限公司 | 基于数据分析的车辆销售信息优化存储方法 |
CN117278056A (zh) * | 2023-11-22 | 2023-12-22 | 湖南立人科技有限公司 | 一种社保信息处理方法及系统 |
CN117278056B (zh) * | 2023-11-22 | 2024-01-30 | 湖南立人科技有限公司 | 一种社保信息处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116915258B (zh) | 2023-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116915258B (zh) | 一种企业薪酬管理方法及系统 | |
Baker et al. | A methodology for evaluating the impact of data compression on climate simulation data | |
US9235651B2 (en) | Data retrieval apparatus, data storage method and data retrieval method | |
CN116388767B (zh) | 用于软件开发数据的安全管理方法 | |
US9047272B1 (en) | System and methods for index selection in collections of data | |
US11677414B2 (en) | Fingerprints for compressed columnar data search | |
US20200311581A1 (en) | High quality pattern mining model and method based on improved multi-objective evolutionary algorithm | |
JP2008525897A (ja) | 適応型クエリ識別及び加速のためのシステム及び方法 | |
CN116975312B (zh) | 一种智慧校园教育数据管理系统 | |
CN114020779B (zh) | 自适应优化检索性能数据库及数据查询方法 | |
CN117290364B (zh) | 一种市场调查数据智能存储方法 | |
CN115955513B (zh) | 一种物联网数据优化传输方法 | |
CN117375631B (zh) | 一种基于哈夫曼编码的快速编码方法 | |
CN115543946A (zh) | 一种金融大数据优化存储方法 | |
Khaled et al. | A hybrid color image quantization algorithm based on k-means and harmony search algorithms | |
CN117273764B (zh) | 一种电子雾化器防伪管理方法及系统 | |
CN116934487B (zh) | 一种金融清算数据优化存储方法及系统 | |
CN116707538B (zh) | 基于云边协同的田径运动员信息数据管理方法及系统 | |
CN112347104B (zh) | 一种基于深度强化学习的列存储布局优化方法 | |
CN108182283A (zh) | 一种基于单快照的多体模拟有损压缩技术 | |
JP4963341B2 (ja) | 文書間関係可視化方法、可視化装置、可視化プログラム及びそのプログラムを記録した記録媒体 | |
CN115599792B (zh) | 一种物联网大数据分类存储方法 | |
CN117668269B (zh) | 基于流形学习的车辆审核信息优化存储方法 | |
CN117573357B (zh) | 一种基于可感知冗余的云边协同缓存方法、系统和介质 | |
CN114581058B (zh) | 一种基于业务流程的人员组织结构优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |