CN116915258A

CN116915258A - 一种企业薪酬管理方法及系统

Info

Publication number: CN116915258A
Application number: CN202311166675.9A
Authority: CN
Inventors: 陈剑飞; 沈小平
Original assignee: Hunan Xianghui Human Resources Service Co ltd
Current assignee: Hunan Xianghui Human Resources Service Co ltd
Priority date: 2023-09-12
Filing date: 2023-09-12
Publication date: 2023-10-20
Anticipated expiration: 2043-09-12
Also published as: CN116915258B

Abstract

本发明涉及金融数据处理技术领域，具体涉及一种企业薪酬管理方法及系统，包括：根据待压缩的薪酬数据中每类字符的出现频率，确定该薪酬数据中每类字符的排布优先指标值；并根据该薪酬数据中每类字符中的各个字符的索引位置与该薪酬数据中字符排布的中值索引位置的差异，确定该薪酬数据中每类字符的优先级影响因子；基于排布优先指标值和优先级影响因子，确定该薪酬数据中每类字符的优先级指标，从而确定该薪酬数据中的各类字符在分布累计表中的排列次序，并构造分布累计表；根据该分布累计表，对薪酬数据进行压缩，得到压缩后的薪酬数据。本发明通过自适应确定分布累计表，有效提高了数据压缩效率。

Description

一种企业薪酬管理方法及系统

技术领域

本发明涉及金融数据处理技术领域，具体涉及一种企业薪酬管理方法及系统。

背景技术

随着企业规模和员工数量的增长，企业薪酬管理会变得越来越复杂，同时薪酬数据的存储和传输也面临着安全和效率的挑战。在企业薪酬管理中，薪酬数据通常包括员工的基本信息、薪资结构、绩效评估结果等。这些数据通常是结构化的，并且存在一定的重复性。因此，利用数据压缩技术对薪酬数据进行压缩可以有效地减少薪酬数据的存储和传输成本。

在传统的压缩算法中，熵编码压缩RANS算法可以通过统计数据的重复项的频数构建分布累计表，并基于该分布累计表对数据进行压缩，可以有效地降低数据中的重复项冗余。然而，在传统的RANS算法压缩过程中，由于RANS算法所构建的分布累计表中的各类字符的分布顺序是随机的，而不同的分布顺序会对最终的压缩效果产生不同的影响，导致数据的压缩效果不可控，无法实现数据最优压缩，从而不利于企业薪酬管理。

发明内容

本发明的目的在于提供一种企业薪酬管理方法及系统，用于解决现有企业薪酬管理过程中数据压缩效果较差的问题。

为解决上述技术问题，本发明提供了一种企业薪酬管理方法，包括以下步骤：

获取待压缩的薪酬数据，对所述薪酬数据中每类字符出现的频次进行统计，确定所述薪酬数据中每类字符的出现频率；

根据所述薪酬数据中每类字符的出现频率，确定所述薪酬数据中每类字符的排布优先指标值，所述排布优先指标值与所述出现频率成负相关关系；

确定所述薪酬数据中字符排布的中值索引位置，并根据所述薪酬数据中每类字符中的各个字符的索引位置与所述中值索引位置的差异，确定所述薪酬数据中每类字符的优先级影响因子；

根据所述薪酬数据中每类字符的排布优先指标值和优先级影响因子，确定所述薪酬数据中每类字符的优先级指标；

构造所述薪酬数据的分布累计表，所述薪酬数据中的各类字符在所述分布累计表中的排列次序根据所述薪酬数据中每类字符的优先级指标确定；

根据所述分布累计表，对所述薪酬数据进行压缩，得到压缩后的薪酬数据。

进一步的，确定所述薪酬数据中每类字符的优先级影响因子，包括：

确定所述薪酬数据中每类字符中的各个字符的索引位置的平均值，从而得到所述薪酬数据中每类字符的索引位置均值；

根据所述薪酬数据中每类字符的索引位置均值与所述中值索引位置的差异，确定所述薪酬数据中每类字符的整体索引位置指标；

根据所述薪酬数据中每类字符中的各个字符的索引位置分布，确定所述薪酬数据中每类字符的索引位置离散指标；

根据所述薪酬数据中每类字符的整体索引位置指标和索引位置离散指标，确定所述薪酬数据中每类字符的优先级影响因子，所述整体索引位置指标与所述优先级影响因子成负相关关系，所述索引位置离散指标与所述优先级影响因子成正相关关系。

进一步的，确定所述薪酬数据中每类字符的索引位置离散指标，包括：

将所述薪酬数据中每类字符中的各个字符的索引位置的方差，确定为所述薪酬数据中每类字符的索引位置离散指标。

进一步的，确定所述薪酬数据中每类字符的优先级影响因子，对应的计算公式为：

其中，表示所述薪酬数据中第a类字符的优先级影响因子；/>表示所述薪酬数据中第a类字符的整体索引位置指标；/>表示所述薪酬数据中第a类字符的索引位置离散指标；/>表示大于0的调节常数；/>以自然常数e为底数的指数函数。

进一步的，确定所述薪酬数据中字符排布的中值索引位置，包括：

确定所述薪酬数据中所有字符的总数目，并将所述总数目的一半确定为所述薪酬数据中字符排布的中值索引位置。

进一步的，确定所述薪酬数据中每类字符的排布优先指标值，对应的计算公式为：

其中，表示所述薪酬数据中第a类字符的排布优先指标值；/>表示所述薪酬数据中第a类字符的出现频率；/>表示调节参数；/>表示以自然常数e为底数的指数函数。

进一步的，按照所述优先级指标从大到小的顺序，对所述薪酬数据中的各类字符进行排列，从而得到所述薪酬数据中的各类字符在分布累计表中的排列次序。

进一步的，确定所述薪酬数据中每类字符的优先级指标，包括：

将所述薪酬数据中每类字符的排布优先指标值和优先级影响因子的乘积值，确定为所述薪酬数据中每类字符的优先级指标。

进一步的，采用RANS算法对所述薪酬数据进行压缩。

为了解决上述技术问题，本发明还提供了一种企业薪酬管理系统，包括：存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述任意一项所述一种企业薪酬管理方法的步骤。

本发明具有如下有益效果：在数据压缩过程中，由于频率较大的字符会在分布累计表中被赋予较大的编码范围，频率较小的字符会被赋予较小的编码范围且在编码时需要更多的比特位，字符出现的频率会影响到最终数据压缩的效率，因此通过统计薪酬数据中每类字符的出现频率，使出现频率较低的字符更优先排序，确定受到字符出现频率影响下的每类字符在分布累计表中的排布优先情况，从而得到每类字符的排布优先指标值。同时，在根据分布累计表对数据进行编码时，每对一个字符进行编码，都需要查找其在分布累计表中所对应的取值，该取值越小，则编码完成后得到的整数就越小，因此字符的位置分布也会影响到最终数据压缩的效率。所以，通过对薪酬数据中每类字符中的各个字符的索引位置进行分析，可以确定受到字符位置分布影响下的每类字符在分布累计表中的排布优先情况，从而得到每类字符的优先级影响因子。最终综合考虑薪酬数据中每类字符的排布优先指标值和优先级影响因子，确定每类字符的优先级指标，从而确定各类字符在分布累计表中的排列次序，最终实现薪酬数据的更高效压缩，有效提供了数据压缩效率，便于企业薪酬管理。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1为本发明实施例的企业薪酬管理方法的流程图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的技术方案的具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外，一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。另外，本文所涉及公式中的所有参数或者指标均为归一化之后的消除了量纲影响的数值。

为了解决现有企业薪酬管理过程中数据压缩效果较差的问题，本实施例提供了一种企业薪酬管理方法。该方法通过分析企业薪酬数据中的各类字符的分布特征，自适应获取分布累计表中的各类字符的分布顺序，从而使利用调整后的分布累计表对数据进行压缩时的结果最优，以达到使企业薪酬管理系统在一定的存储空间内可以存储更多的数据的目的。

本实施例所提供的一种企业薪酬管理方法的流程图如图1所示，具体包括以下步骤：

步骤S1：获取待压缩的薪酬数据，对所述薪酬数据中每类字符出现的频次进行统计，确定所述薪酬数据中每类字符的出现频率。

企业薪酬数据是指记录和统计企业员工薪资报酬等各类信息的数据，这些数据中包括员工的基本工资、绩效奖金、年终奖金、福利待遇、加班工资等各种薪酬相关信息。企业薪酬数据可以用于薪酬管理、绩效评估、薪酬调整、人力资源规划等方面的决策和分析。由于企业薪酬数据的数据量较大，在企业薪酬管理过程中通常需要对企业薪酬数据进行压缩存储。

RANS算法的主要思想是将需要压缩的字符串利用分布累计表编码为一个整数，该整数转化为二进制数据的长度即为压缩后的编码长度。而由于企业薪酬数据中包括许多固定的结构化数据，所以数据中的各个字符的局部特性较强，从而导致各个字符的分布位置不同，利用固定的分布累计表进行压缩时，无法实现数据的最优压缩，因此需要分析数据中的各类字符的分布特征，对分布累计表中的字符顺序进行排列调整，使数据利用调整后的分布累计表进行编码压缩的数据长度变小，即使数据的压缩效果提升。

基于上述分析，为了实现企业薪酬数据的最优压缩，首先获取企业薪酬数据对应的字符序列数据，并将该字符序列数据称为薪酬数据，后续进行数据压缩所涉及到的薪酬数据均是指该字符序列数据。遍历该薪酬数据，获取该薪酬数据中的字符种类总数、各类字符的频数以及各类字符的分布位置。根据该薪酬数据中各类字符的频数以及所有字符的总数目，可以确定该薪酬数据中各类字符的出现频率。同时，根据该薪酬数据中各类字符的分布位置，可以确定该薪酬数据中各类字符中每个字符的索引位置。

步骤S2：根据所述薪酬数据中每类字符的出现频率，确定所述薪酬数据中每类字符的排布优先指标值，所述排布优先指标值与所述出现频率成负相关关系。

在传统的RANS算法中，字符的频率用于计算每一个字符在分布累计表中的概率分布情况，使频率较大的字符被赋予较大的编码范围，频率较小的字符被赋予较小的编码范围，然后将这些字符赋予到的编码范围进行随机排序，这些字符的编码范围累加和所构成的区间即可构成分布累计表。由于分布累计表中字符的编码范围是随机排布的，因此无法保证所编码出的整数尽可能小，因此无法保证最终的数据压缩效果。

薪酬数据通常由不同部门和级别的薪酬组成，而薪酬的类型又包括基本工资、津贴、奖金等多种，因此薪酬数据中的字符会存在一定的局部分布特性，即数据中存在一些字符的频率较高，而另外一些字符的频率较低。同时，由于企业中的高级管理层和核心岗位相对较少，而普通员工较多，因此数据中会存在一些字符的频率相差较大。

基于上述薪酬数据的分布特点，考虑到在采用RANS算法进行数据压缩的过程中，频率较小的字符在编码时需要更多的比特位，通过令频率较小的字符的优先级更高，可以使其在增加等量的比特位的基础上，使对频率较小的字符进行编码后的整数增加量尽可能小，从而使将数据编码完成后的整数取值尽可能小。

基于上述分析，根据薪酬数据中每类字符的出现频率，可以确定薪酬数据中每类字符的排布优先指标值，对应的计算公式为：

其中，表示所述薪酬数据中第a类字符的排布优先指标值；/>表示所述薪酬数据中第a类字符的出现频率；/>表示调节参数，本实施例设置/>；/>表示以自然常数e为底数的指数函数。

根据上述的排布优先指标值的计算公式可知，若薪酬数据中第a类字符的出现频率越小，说明该第a类字符在分布累计表中越应该优先排序，此时该第a类字符的排布优先指标值就越大。

步骤S3：确定所述薪酬数据中字符排布的中值索引位置，并根据所述薪酬数据中每类字符中的各个字符的索引位置与所述中值索引位置的差异，确定所述薪酬数据中每类字符的优先级影响因子。

在采用RANS算法进行数据压缩的过程中，需要根据分布累计表对数据进行编码，使每一次所编码完成的数据都为一个整数，每对一位字符进行编码，都需要查找其在分布累计表中所对应的取值，若该取值越小，则编码完成后得到的整数就越小，从而使最终编码完成后得到的数据长度越短，即压缩效果越好。

由于在薪酬数据中包括不同部门和级别的薪酬，且薪酬的种类又比较多样化，这就导致在薪酬数据中各类字符的分布情况不同。在采用RANS算法对薪酬数据进行编码时，按照薪酬数据中字符的顺序进行编码，若薪酬数据中索引位置靠前的字符在分布累计表中的优先级较低，即索引位置靠前的字符在分布累计表中的位置靠后，则该字符在分布累计表中所对应的取值就较大，在编码时就会使编码完成后所得到的整数过大，那么就会使得在对后续字符进行编码的过程中，编码完成后所得到的整数越来越大，编码长度越来越长。基于这种特点，需要对薪酬数据中各类字符的位置分布情况进行分析，确定薪酬数据中每类字符的优先级影响因子，并将该优先级影响因子与排布优先指标值相结合，最终使薪酬数据中索引位置靠前的字符在分布累计表中更优先排序，从而保证最终的数据压缩效果。

为了确定薪酬数据中每类字符的优先级影响因子，首先需要确定该薪酬数据中字符排布的中值索引位置，即：确定所述薪酬数据中所有字符的总数目，并将所述总数目的一半确定为所述薪酬数据中字符排布的中值索引位置。

在确定薪酬数据中字符排布的中值索引位置之后，将薪酬数据中每类字符中的各个字符的索引位置与该中值索引位置进行比较，从而确定该薪酬数据中每类字符的优先级影响因子，实现步骤包括：

可选择地，确定所述薪酬数据中每类字符的索引位置离散指标，包括：

具体的，确定该薪酬数据中每类字符的优先级影响因子，对应的计算公式为：

其中，表示薪酬数据中第a类字符的优先级影响因子；/>表示薪酬数据中字符排布的中值索引位置；/>表示薪酬数据中第/>个第a类字符的索引位置；/>表示薪酬数据中第a类字符的频次；/>表示薪酬数据中第a类字符的索引位置均值；/>表示以自然常数/>为底数的指数函数；/>表示薪酬数据中第a类字符的整体索引位置指标；/>表示薪酬数据中第a类字符的索引位置离散指标；/>表示大于0的调节常数，用于防止分母为0，本实施例设置/>。

在上述的优先级影响因子的计算公式中，也就是/>表示薪酬数据中第a类字符的索引位置均值与整个薪酬数据所有字符的索引位置中值的差异，当该差异的取值越小时，则说明第a类字符的平均索引位置在整个薪酬数据中越靠前，该差异的取值越大时，则说明第a类字符的平均索引位置在整个薪酬数据中越靠后。/>表示薪酬数据中第a类字符中各个字符的索引位置的方差，其表征了薪酬数据中第a类字符的索引位置分散程度，/>的取值越小，则说明第a类字符在整个薪酬数据中的索引位置分布越集中，分散程度越差。/>的取值越小且/>的取值越小，则说明第a类字符越集中分布在整个薪酬数据的靠前的位置，即第a类字符的整体索引位置越小，且第a类字符的各个字符索引位置越集中时，说明该第a类字符在分布累计表中越应该优先排序，此时第a类字符的优先级影响因子的取值越大。/>的取值越大且/>的取值越小，则说明第a类字符越集中分布在整个薪酬数据的靠后的位置，即第a类字符的整体索引位置越大，且第a类字符的各个字符索引位置越集中时，说明该第a类字符在分布累计表中越应该靠后排序，此时第a类字符的优先级影响因子的取值越小。

步骤S4：根据所述薪酬数据中每类字符的排布优先指标值和优先级影响因子，确定所述薪酬数据中每类字符的优先级指标。

基于上述步骤确定的薪酬数据中每类字符的排布优先指标值和优先级影响因子，确定该薪酬数据中每类字符的优先级指标，即：将所述薪酬数据中每类字符的排布优先指标值和优先级影响因子的乘积值，确定为所述薪酬数据中每类字符的优先级指标。此时，薪酬数据中每类字符的优先级指标的计算公式为：

其中，表示所述薪酬数据中第a类字符的优先级指标；/>表示所述薪酬数据中第a类字符的排布优先指标值；/>表示所述薪酬数据中第a类字符的优先级影响因子。

根据上述的优先级指标的计算公式可知，当第a类字符的排布优先指标值越大且优先级影响因子越大时，说明第a类字符在薪酬数据中的占比越小，且第a类字符越集中分布在薪酬数据靠前的位置，此时越应该将第a类字符在分布累计表中优先分布，此时对应的优先级指标的取值也就越大。

步骤S5：构造所述薪酬数据的分布累计表，所述薪酬数据中的各类字符在所述分布累计表中的排列次序根据所述薪酬数据中每类字符的优先级指标确定。

基于上述所确定的薪酬数据中每类字符的优先级指标，确定该薪酬数据中的各类字符在分布累计表中的排列次序，即：按照所述优先级指标从大到小的顺序，对所述薪酬数据中的各类字符进行排列，从而得到所述薪酬数据中的各类字符在分布累计表中的排列次序。

另外，基于分布累计表中各类字符的排布次序，按照该排布次序从前往后的顺序，确定每一类字符在分布累计表中所占区间的大小，具体计算公式为：

其中，表示分布累计表中前第n-1类字符中第a类字符所占区间的大小；/>表示分布累计表中前第n-1类字符中第a类字符在薪酬数据中的出现频率；n表示分布累计表中不同字符的种类数；/>表示向下取整符号；/>表示分布累计表中第n类字符所占区间的大小。

根据上述的每一类字符在分布累计表中所占区间的大小的计算公式可知，基于分布累计表中各类字符的排布次序，第a类字符在薪酬数据中的出现频率越大，则该类字符所占区间越大，此时在利用上述所确定的分布累计表进行压缩时，遇到该字符进行压缩时的编码长度越短。

按照分布累计表中各类字符的排布次序，在分布累计表中设置各类字符的所占区间，最终即可获得薪酬数据的各类字符在分布累计表中的排列次序和所占区间，从而实现了分布累计表的自适应调整。

步骤S6：根据所述分布累计表，对所述薪酬数据进行压缩，得到压缩后的薪酬数据。

基于上述所确定的分布累计表，对薪酬数据进行编码压缩，从而得到压缩后的薪酬数据。由于编码压缩的具体实现过程属于现有技术，此处不再赘述。将压缩后的薪酬数据存储在企业薪酬管理系统中，便于后续对所压缩的薪酬数据的分析。

本实施例还提供了一种企业薪酬管理系统，包括：存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述的一种企业薪酬管理方法的步骤。由于该企业薪酬管理系统实质上是一种软系统，其核心在于实现上述的企业薪酬管理方法，而该方法的具体实现步骤已经在上述内容中进行了详细介绍，此处对该系统不再进行赘述。

本发明通过对薪酬数据中各类字符的出现频率和分布位置特征进行分析，确定各类字符在分布累计表中的优先级指标，并根据该优先级指标对分布累计表中各类字符的排列次序进行自适应调整，使分布累计表中优先级指标越高的字符的索引越靠前，以减小最终所压缩的整数结果大小，从而达到提升压缩效果的目的。

需要说明的是：以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种企业薪酬管理方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种企业薪酬管理方法，其特征在于，确定所述薪酬数据中每类字符的优先级影响因子，包括：

3.根据权利要求2所述的一种企业薪酬管理方法，其特征在于，确定所述薪酬数据中每类字符的索引位置离散指标，包括：

4.根据权利要求2所述的一种企业薪酬管理方法，其特征在于，确定所述薪酬数据中每类字符的优先级影响因子，对应的计算公式为：

其中，表示所述薪酬数据中第a类字符的优先级影响因子；/>表示所述薪酬数据中第a类字符的整体索引位置指标；/>表示所述薪酬数据中第a类字符的索引位置离散指标；表示大于0的调节常数；/>以自然常数e为底数的指数函数。

5.根据权利要求1所述的一种企业薪酬管理方法，其特征在于，确定所述薪酬数据中字符排布的中值索引位置，包括：

6.根据权利要求1所述的一种企业薪酬管理方法，其特征在于，确定所述薪酬数据中每类字符的排布优先指标值，对应的计算公式为：

7.根据权利要求1所述的一种企业薪酬管理方法，其特征在于，按照所述优先级指标从大到小的顺序，对所述薪酬数据中的各类字符进行排列，从而得到所述薪酬数据中的各类字符在分布累计表中的排列次序。

8.根据权利要求1所述的一种企业薪酬管理方法，其特征在于，确定所述薪酬数据中每类字符的优先级指标，包括：

9.根据权利要求1所述的一种企业薪酬管理方法，其特征在于，采用RANS算法对所述薪酬数据进行压缩。

10.一种企业薪酬管理系统，其特征在于，包括：存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1-9任意一项所述一种企业薪酬管理方法的步骤。