CN116956097B

CN116956097B - 基于K-means的专家画像分析方法及系统

Info

Publication number: CN116956097B
Application number: CN202311200245.4A
Authority: CN
Inventors: 叶祖焕; 杨琦; 孙海鹏
Original assignee: Hunan Valin E Commerce Co ltd
Current assignee: Hunan Valin E Commerce Co ltd
Priority date: 2023-09-18
Filing date: 2023-09-18
Publication date: 2023-12-12
Anticipated expiration: 2043-09-18
Also published as: CN116956097A

Abstract

本发明涉及智能画像数据分析技术领域，尤其涉及一种基于K‑means的专家画像分析方法及系统。所述方法包括以下步骤：通过专家数据库获取专家数据，对专家数据进行数据预处理，生成标准专家数据；对标准专家数据进行数据特征提取处理，生成专家特征数据；通过K‑means算法对专家特征数据进行画像构建处理，从而生成专家特征画像；对专家特征画像进行画像标记处理，生成专家履职画像；对专家履职画像进行边缘层级分离处理，剔除生成的边缘层级画像，从而得到中心层级画像；对中心层级画像进行深度图像色深检测处理，得到专家履职色深图像。本发明能够精准地实现K‑means的专家画像分析方法。

Description

基于K-means的专家画像分析方法及系统

技术领域

本发明涉及智能画像数据分析技术领域，尤其涉及一种基于K-means的专家画像分析方法及系统。

背景技术

在企业采购活动中，非招标项目的评审专家一般从企业自建评审专家库中抽取或选定。采购项目评审工作是采购过程中的核心环节，评审专家作为招标采购过程中的“裁判员”，对采购结果至关重要，其专业背景、业务水平、职业道德、行为偏好等因素将直接影响采购项目的评审质量。但仍存在诸多问题，如采购人对评审专家综合能力了解不足，评审结果受评审专家主观影响较大，专家行为偏好缺乏数据量化和体系化分析，工作效率低。

发明内容

基于此，本发明提供一种基于K-means的专家画像分析方法及系统，以解决至少一个上述技术问题。

为实现上述目的，一种基于K-means的专家画像分析方法，所述方法包括以下步骤：

步骤S1：通过专家数据库获取专家数据，对专家数据进行数据预处理，生成标准专家数据；对标准专家数据进行数据特征提取处理，生成专家特征数据；

步骤S2：通过K-means算法对专家特征数据进行画像构建处理，从而生成专家特征画像；对专家特征画像进行画像标记处理，生成专家履职画像；

步骤S3：对专家履职画像通过预设的标准层级进行边缘层级分离处理，剔除生成的边缘层级画像，从而得到中心层级画像；

步骤S4：对中心层级画像进行深度图像色深检测处理，得到专家履职色深图像；

步骤S5：利用神经网络模型对专家履职色深图像进行机器学习处理，生成专家履职网络模型；利用专家履职网络模型对专家数据进行数据预测处理，从而生成专家履职报告。

本发明通过专家数据库获取专家数据，对专家数据进行数据预处理，生成标准专家数据，可以剔除非法、重复和缺失的数据，从而提高数据的质量和准确性，降低数据处理的复杂性和计算量，提高分析效率和准确性，消除冗余数据，节省存储空间和计算资源，提高数据的使用效率和利用价值，降低数据不一致性、数据间不匹配等问题的影响，保证数据处理的一致性和标准化，通过对标准专家数据进行数据特征提取处理，可以提取出专家数据中专家特征结果，提高数据的辨识度和区分度，便于数据的可视化和分析，提高数据处理和分析的效率和准确性；通过K-means算法对专家特征数据进行画像构建处理，构建出专家特征画像，可以提高数据可读性，降低数据复杂度，更加客观地展示专家特征，便于专家的管理和评价，通过对专家特征画像进行画像标记，能够突出表现画像中的关键特征，给画像进行分类，加强数据交流，便于数据分析和挖掘，以便后续对画像的处理；对专家履职画像通过预设的标准层级进行边缘层级分离，剔除无颜色的边缘层级画像，可以提高画像信息的准确性和可信度，突出画像中核心区域的画像特征，更好的反应画像的本质和特点，提高画像的分析效率，从而得到中心层级画像；通过对中心层级画像进行深度图像色深检测，可以更加准确反应画像颜色深度的细节和特征，提高画像的细节度和准确性，突出画像中的色彩特征，以便后续的处理和分析；利用神经网络模型对专家履职色深图像进行机器学习处理，生成专家履职网络模型，可以提高数据分析和预测的准确性，促进数据自动化处理和分析，实现自动评价，提高数据的管理和考评效率，利用专家履职网络模型对专家数据进行数据预测处理，从而生成专家履职报告，能够实现专家履职自动评价、自动分类，促进管理和考评的自动化处理，提高工作效率。

优选地，步骤S1包括以下步骤：

步骤S11：获取专家数据；对专家数据进行数据清洗，生成专家清洗数据；对专家清洗数据进行数据离散化处理，生成专家离散数据；对专家离散数据进行数据归一化处理，从而生成专家归一化数据；

步骤S12：对专家归一化数据利用预设的类型标准进行数据筛选处理，剔除不满足预设的类型标准的数据，从而生成标准专家数据；

步骤S13：对标准专家数据进行特征向量提取处理，生成专家特征向量；根据线性判别分析算法对专家特征向量进行特征向量降维处理，生成专家特征降维向量；

步骤S14：对专家特征降维向量进行特征向量标准化，从而生成专家特征数据。

本发明通过获取专家数据，对专家数据进行数据清洗，能够剔除脏数据和异常数据，保证数据的质量和准确性，使数据更加可靠和有价值，降低数据处理和分析成本，从而生成标准专家数据，对专家清洗数据进行数据离散化处理，将连续性的数据处理成离散型数据，能够减少数据处理的复杂性，降低数据处理的难度，提高数据处理的安全性和数据的易读性，从而生成专家离散数据，对专家离散数据进行数据归一化，将不同量级的数据映射到相同尺度上，提高数据处理的精确度和精度，便于后续对数据进行分析处理；对专家归一化数据利用预设的类型标准进行数据筛选处理，剔除不满足预设的类型标准的数据，可以剔除异常数据和不符合标准的数据，从而提高数据规范性和标准化，让数据更加准确和有价值，减少人工筛选工作时间和成本，保证数据处理的一致性和可靠性，生成标准专家数据；对标准专家数据进行特征向量提取处理，生成专家特征向量，可以突出专家数据中的关键特征维度，以便对专家进行更细粒度的分类和比较分析，降低数据处理难度，据线性判别分析算法对专家特征向量进行特征向量降维处理，能够从大量的原始变量中提取有用的信息，从而发现数据中的潜在特征和规律，从而生成专家特征降维向量；对专家特征降维向量进行特征向量标准化，可以消除向量不同量级的影响，提高数据处理的精度和准确度，使数据更加清晰和直观。

优选地，步骤S2包括以下步骤：

步骤S21：利用预设的特征标签对专家特征数据进行特征标签对比处理，将符合预设的特征标签的专家特征数据进行画像构建处理，从而生成专家特征画像，将不符合预设的特征标签的专家特征数据根据K-means算法进行画像重构处理，生成专家重构画像；

步骤S22：对专家重构画像进行中心向量聚类处理，得到重构中心向量；对重构中心向量与专家特征画像进行中心向量距离比对处理，生成画像中心向量距离；

步骤S23：利用预设的中心向量距离判别值对画像中心向量距离进行距离缩进处理，直至重新生成专家特征画像；

步骤S24：对专家特征画像进行边缘去噪处理，生成专家核心区域特征画像；利用画像核心区域标记分区公式对专家核心区域特征画像进行画像标记处理，生成专家履职画像。

本发明通过利用预设的特征标签对专家特征数据进行特征标签对比处理，将符合预设的特征标签的专家特征数据进行画像构建处理，从而生成专家特征画像，将不符合预设的特征标签的专家特征数据根据K-means算法进行画像重构处理，生成专家重构画像，可以通过画像构建深入挖掘专家特征，提高画像构建的精度，优化专家画像呈现方式，进行专家之间的比较和分析，从而更好地发现和挖掘数据中的规律和特征；对专家重构画像进行中心向量聚类处理，得到重构中心向量，可以提高聚类效果和准确度，简化数据分析过程，便于对数据进行分类，从而更好地实现数据分类和归纳，对重构中心向量与专家特征画像进行中心向量距离比对处理，生成画像中心向量距离，可以评估专家特征水平，更好地发现和挖掘数据中的规律和特征，便于后续分析处理；利用预设的中心向量距离判别值对画像中心向量距离进行距离缩进处理，直至重新生成专家特征画像，可以提高识别图像的准确率，减少后续计算量；对专家特征画像进行边缘去噪处理，可以使得专家特征画像更加清晰、可读，更加容易、准确地对该专家进行分析、分类、预测等操作，从而生成专家核心区域特征画像，利用画像核心区域标记分区公式对专家核心区域特征画像进行画像标记处理，生成专家履职画像，突出专家核心能力。

优选地，步骤S24中的画像核心区域标记分区公式具体如下：

;

式中，表示为画像标记分区函数，表示为画像闭圆上的像素点系数，表示为画像核心区域第个特征权重，表示为画像核心区域中所有特征灰度值的平均值，表示为画像核心区域参数控制特征点分布的范围，表示为画像核心区域圆心横坐标，表示为画像核心区域圆心第个特征横坐标，表示为画像核心区域圆心纵坐标，表示为画像核心区域圆心第个特征纵坐标，表示为画像核心区域特征点的数量，表示为画像核心区域特征标记异常调整值。

本发明构建了一种画像核心区域标记分区公式，该公式充分考虑了画像闭圆上的像素点系数、画像核心区域第个特征权重、画像核心区域中所有特征灰度值的平均值、画像核心区域参数控制特征点分布的范围、画像核心区域圆心横坐标、画像核心区域圆心第个特征横坐标、画像核心区域圆心纵坐标、画像核心区域圆心第个特征纵坐标、画像核心区域特征点的数量，根据画像核心区域中所有特征灰度值的平均值与画像核心区域参数控制特征点分布的范围以及函数之间的相互作用，以形成函数关系：

；

通过画像核心区域圆心横坐标以及画像核心区域圆心第个特征横坐标的相互作用关系，保证核心区域数据精确的情况下进行画像标记生成，生成画像闭圆上的像素点系数和画像核心区域第个特征权重，并利用画像核心区域特征标记异常调整值，保证数据准确的情况下减少数据冗余，节约了算力，使计算达到快速收敛，通过画像核心区域特征标记异常调整值对画像标记分区进行调整，更加准确的生成画像标记分区函数，提高了画像标记分区的准确性和可靠性。同时该公式中的画像核心区域特征点的数量、画像闭圆上的像素点系数等参数可以根据实际情况进行调整，从而适应不同的画像标记分区场景，提高了算法的适用性和灵活性。

优选地，步骤S3包括以下步骤：

步骤S31：通过预设的标准层级对专家履职画像进行层级分割处理，得到专家层级画像；

步骤S32：对专家层级画像进行色彩投影处理，从而生成专家色彩投影画像；

步骤S33：对专家色彩投影画像进行画像过滤处理，过滤出无颜色的区域，从而生成专家过滤色彩图像；

步骤S34：将专家过滤色彩图像进行边缘检测处理，剔除边缘层级画像，从而得到中心层级画像。

本发明通过预设的标准层级对专家履职画像进行层级分割处理，得到专家层级画像，可以生成更加清晰明确的专家履职画像，有助于后续对专家的评估和选择处理；对专家层级画像进行色彩投影处理，可以增强图像的色彩对比度，突出图像中的重要信息，以及帮助更好地理解和评估专家的特定技能、能力和经验；对专家色彩投影画像进行画像过滤处理，过滤出无颜色的区域，从而生成专家过滤色彩图像，可避免输出图像中出现不必要的信息和噪点，仅保留专家图像中的关键信息和特征；将专家过滤色彩图像进行边缘检测处理，剔除边缘层级画像，从而得到中心层级画像，有助于突出专家履职画像中的关键信息和特征，提高专家画像的质量和准确性。

优选地，步骤S4包括以下步骤：

步骤S41：对中心层级画像进行色块切割处理，生成中心层级色块；

步骤S42：利用深度色彩检测公式对中心层级色块进行色彩深度检测处理，生成色深检测图像；

步骤S43：对色深检测图像进行邻域色彩对比处理，从而生成专家履职色深图像。

本发明通过对中心层级画像进行色块切割处理，生成中心层级色块，可以提高画像展示效果，便于分析画像特征，提高画像处理效率，支持画像分类和检索；利用深度色彩检测公式对中心层级色块进行色彩深度检测处理，生成色深检测图像，可以有助于提取画像中的关键信息和特征，提高专家画像的质量和准确性；对色深检测图像进行邻域色彩对比处理，可以调整每个像素的亮度和对比度，增强色深检测图像的色彩对比度，提高图像的真实感，便于突出画像中的颜色深度和特征，从而生成专家履职色深图像。

优选地，步骤S42中的深度色彩检测公式具体如下：

;

；

式中，表示为中心层级色块的深度色彩值，表示为中心层级色块的样本数量，表示为中心层级色块第个样本点红原色值，表示为中心层级色块第个样本点绿原色值，表示为中心层级色块第个样本点蓝原色值，表示为中心层级色块所有样本红原色均值，表示为中心层级色块所有样本绿原色均值，表示为中心层级色块所有样本蓝原色均值，表示为中心层级色块控制偏差权重系数，表示为中心层级色块控制样本颜色值与权重系数比例的缩放系数，表示为中心层级色块权重系数调整样本值的贡献函数值，表示为中心层级色块色彩调整值。

本发明构建了一种深度色彩检测公式，该公式充分考虑了中心层级色块的样本数量、中心层级色块第个样本点红原色值、中心层级色块第个样本点绿原色值、中心层级色块第个样本点蓝原色值、中心层级色块所有样本红原色均值、中心层级色块所有样本绿原色均值、中心层级色块所有样本蓝原色均值、中心层级色块控制偏差权重系数、中心层级色块控制样本颜色值与权重系数比例的缩放系数、中心层级色块权重系数调整样本值的贡献函数值、中心层级色块色彩调整值，根据中心层级色块权重系数调整样本值的贡献函数值与中心层级色块的样本数量以及函数之间的相互作用，以形成函数关系：

；

通过中心层级色块第个样本点红原色值以及中心层级色块所有样本红原色均值的相互作用关系，保证中心层级色块原色精确的情况下进行中心层级色块权重调整，生成中心层级色块权重系数调整样本值的贡献函数值，并利用中心层级色块色彩调整值，保证数据准确的情况下减少数据冗余，节约了算力，使计算达到快速收敛，通过中心层级色块色彩调整值对中心层级色块色彩检测进行调整，更加准确的生成中心层级色块的深度色彩值，提高了中心层级色块色彩检测的准确性和可靠性。同时该公式中的中心层级色块的样本数量、中心层级色块控制样本颜色值与权重系数比例的缩放系数等参数可以根据实际情况进行调整，从而适应不同的中心层级色块场景，提高了算法的适用性和灵活性。

优选地，步骤S43包括以下步骤：

步骤S431：将色深检测图像进行像素点切割处理，生成色深像素点；

步骤S432：对色深像素点进行色深地址计算处理，生成色深像素点地址；

步骤S433：利用对比度算法对色深像素点进行邻域颜色获取处理，生成色深邻域像素点；

步骤S434:将色深邻域像素点与色深像素点地址进行邻域色彩定位处理，生成色深定位像素点，通过预设的色彩标准值对色深定位像素点进行色彩差异对比处理，剔除大于预设的色彩标准值的色深定位像素点，生成标准的色深定位像素点；将色深定位像素点进行色彩聚合处理，生成专家履职色深图像。

本发明通过将色深检测图像进行像素点切割处理，生成色深像素点，可以将图像分解为像素点，从而对图像进行更细粒度的处理，从微观层面上展示色深信息和特征，更好地呈现专家履职画像的视觉效果和识别度，更细粒度地突出专家履职画像中的颜色深度和特征；通过对色深像素点进行色深地址计算处理，可以生成色深像素点地址。这有助于精细化处理专家履职画像的色深数据，提高图像的识别度和视觉效果；利用对比度算法对色深像素点进行邻域颜色获取处理，可以使得图片中不同颜色之间的差异更加明显，从而提高了图像的清晰度和可读性，增加整个图像的平滑度和连续性，减少噪点和失真，生成色深邻域像素点；将色深邻域像素点与色深像素点地址进行邻域色彩定位处理，生成色深定位像素点，通过预设的色彩标准值对色深定位像素点进行色彩差异对比处理，剔除大于预设的色彩标准值的色深定位像素点，生成标准的色深定位像素点；将色深定位像素点进行色彩聚合处理，生成专家履职色深图像，可以提高图像的清晰度，明确轮廓，增加图像的可读性，提高图像色彩的准确性和一致性，从而更好地呈现专家履职画像中的颜色深度和特征。

优选地，步骤S5包括以下步骤：

步骤S51：获取历史专家数据；

步骤S52：利用卷积神经网络模型对专家履职色深图像根据历史专家数据进行深度训练，生成专家画像分析模型；

步骤S53：将专家数据导入至专家画像分析模型进行分析预测处理，从而生成专家履职报告。

本发明通过获取历史专家数据，利用卷积神经网络模型对专家履职色深图像根据历史专家数据进行深度训练，生成专家画像分析模型，可以更准确地分析专家的履职情况和预测未来的行为；通过将专家数据导入到生成的专家画像分析模型中，进行分析预测处理，并生成专家履职报告，可以帮助相关人员更好地了解专家的履职情况和表现，提高数据的准确性和质量，并且减少处理有效数据时的时间和资源浪费，提高科学决策的准确性和效率。

在本说明书中，提供一种基于K-means的专家画像分析系统，包括，

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器内存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上任一项所述的基于K-means的专家画像分析方法。

本发明通过获取专家数据，对专家数据进行数据预处理，生成标准专家数据，剔除非法、重复和缺失的数据，从而提高数据的质量和准确性，降低数据处理的复杂性和计算量，提高分析效率和准确性，消除冗余数据，对标准专家数据进行数据特征提取处理，生成专家特征数据，提取出专家数据中专家特征结果，提高数据的辨识度和区分度，便于数据的可视化和分析，提高数据处理和分析的效率和准确性，通过利用K-means算法对专家特征数据进行画像构建处理，降低数据复杂度，更加客观地展示专家特征，便于专家的管理和评价，对专家特征画像进行画像标记，能够突出表现画像中的关键特征，给画像进行分类，加强数据交流，便于数据分析和挖掘，以便后续对画像的处理；对专家履职画像通过预设的标准层级进行边缘层级分离，剔除无颜色的边缘层级画像，可以提高画像信息的准确性和可信度，突出画像中核心区域的画像特征，从而得到中心层级画像，通过对中心层级画像进行深度图像色深检测，可以更加准确反应画像颜色深度的细节和特征，提高画像的细节度和准确性，利用神经网络模型对专家履职色深图像进行机器学习处理，生成专家履职网络模型，可以提高数据分析和预测的准确性，促进数据自动化处理和分析，实现自动评价，提高数据的管理和考评效率，利用专家履职网络模型对专家数据进行数据预测处理，从而生成专家履职报告，能够实现专家履职自动评价、自动分类，促进管理和考评的自动化处理，提高工作效率。因此，本发明的K-means的专家画像分析方法对专家数据进行画像构建和分类，并对画像的色深信息通过专家履职网络模型进行分析识别，解决了人工繁琐步骤和专家偏好数据量化和体系化分析的缺乏。

附图说明

图1为本发明一种基于K-means的专家画像分析方法及系统的步骤流程示意图；

图2为图1中步骤S1的详细实施步骤流程示意图；

图3为图1中步骤S2的详细实施步骤流程示意图；

图4为图1中步骤S4中的步骤S43的详细实施步骤流程示意图；

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

下面结合附图对本发明专利的技术方法进行清楚、完整的描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域所属的技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

此外，附图仅为本发明的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器方法和/或微控制器方法中实现这些功能实体。

应当理解的是，虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元，但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说，在不背离示例性实施例的范围的情况下，第一单元可以被称为第二单元，并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。

为实现上述目的，请参阅图1至图4，一种基于K-means的专家画像分析方法，所述方法包括以下步骤：

本发明实施例中，参考图1所述，为本发明一种基于K-means的专家画像分析方法的步骤流程示意图，在本实例中，所述一种基于K-means的专家画像分析方法包括以下步骤：

本发明实施例中，获取专家数据，对专家数据进行数据预处理，其中数据预处理的步骤包括：对专家数据进行数据清洗，剔除无效或不完整数据；对清洗后的专家数据进行转换处理，将数据转换为标准格式和结构；利用均值填充方法对缺失值进行填充处理；对专家数据进行归一化处理等，从而生成标准专家数据，对标准专家数据进行数据特征提取处理，其中特征提取的步骤包括：对标准专家数据进行特征选择、特征提取、特征预处理等子步骤，从而生成专家特征数据。

本发明实施例中，通过K-means算法对专家特征数据进行画像构建处理，其中使用K-means算法步骤包括：首先采用手肘法选择最优的聚类数，运用K-means算法进行聚类分析，在空间中随机选择K个聚类中心点，然后将所有样本点分配到最近的聚类中心点中，计算每个聚类中心点的坐标，并将其平移至各聚类点的中心，重复这个过程直到达到预期的收敛条件为止，根据K-means聚类结果，将聚类中心点的特征向量或特征矩阵进行可视化展示，并根据聚类中心点的属性和特征进行画像构建，生成专家特征画像，利用画像核心区域分区标记公式对画像进行标记处理，生成专家履职画像。

步骤S3：对专家履职画像通过预设的标准层级进行边缘层级分离处理，剔除生成的边缘层级画像，从而得到中心层级画像。

本发明实施例中，通过对专家履职画像进行层级切割处理，得到专家层级画像，根据画像上色彩面积进行色彩投影处理，从而生成专家色彩投影画像，对专家色彩投影画像进行画像过滤，提取有颜色的区域，剔除无颜色的画像区域，从而得到专家过滤色彩图像，对专家过滤色彩图像，根据层级分离算法如边缘检测算法、分水岭算法、模糊C均值算法等对专家过滤色彩图像进行层级分离，得到中心层级画像。

本发明实施例中，利用深度色彩检测公式对中心层级画像进行深度图像色深检测处理，通过检测图像中每个像素点的颜色分辨程度进行数据汇总和统计，生成专家履职色深图像。

本发明实施例中，通过利用卷积神经网络模型对专家履职色深图像进行无监督学习训练，将历史专家数据导入至模型中，通过反向传播算法不断更新模型参数，形成专家画像分析模型，利用专家画像分析模型对专家数据进行预测，从而生成标准的专家履职报告。

优选地，步骤S1包括以下步骤：

作为本发明的一个实例，参考图2所示，为图1中步骤S1的详细实施步骤流程示意图，在本实例中所述步骤S1包括：

本发明实施例中，通过获取专家数据，对专家数据进行数据清洗，去除脏数据和重复数据，统一数据格式等操作，生成专家清洗数据，对清洗数据进行离散化处理，将连续变量转换为离散变量，利用相关的频率法、等宽法等离散化算法将数据进行划分，得到专家离散数据，对专家离散数据进行数据归一化处理，利用极差法、标准差法、正态化法等归一化方法将不同指标的数据映射到同一尺度上，使得不同指标的权重相等，得到专家归一化数据。

本发明实施例中，根据专家履职数据的特点和分析目的，设定适当的类型标准。类型标准一般包括记录类型、信息内容、信息格式等，将专家归一化数据与设定的类型标准进行比对，剔除不符合标准的数据，经过数据筛选处理后，即可生成符合标准的专家数据。

本发明实施例中，从标准专家数据中提取出代表专家履职特征的指标，构建出专家特征向量，这些指标可以是专家的发表论文数、科研项目经费、专利数量等，使用线性判别分析（Linear Discriminant Analysis, LDA）算法，将高维数据映射到低维空间中，使用Fisher判别分析和LDA-LPP算法等LDA算法对专家特征向量进行降维处理，生成专家特征降维向量。

本发明实施例中，对降维后的专家向量进行标准化处理，使得不同指标之间具有可比性，可以采用多种标准化方法，包括最大-最小标准化，Z-score标准化和sigmoid标准化等，对标准化处理后的特征向量进行组合，生成专家特征数据，这些数据可以反映专家在履职过程中的特点和优势，包括创新能力、团队协作能力、领导能力等。

优选地，步骤S2包括以下步骤：

作为本发明的一个实例，参考图3所示，为图1中步骤S2的详细实施步骤流程示意图，在本实例中所述步骤S2包括：

本发明实施例中，通过预设的特征标签对专家特征数据进行特征标签对比处理，标签值的设置例如年龄、性别、学历、工作经验等，对于每个专家，根据其对应的特征标签是否符合预设的标签值，将该专家特征数据划分为符合标签要求和不符合标签要求两部分，对符合特征标签要求的专家特征数据进行画像构建处理，生成专家特征画像，对于不符合特征标签要求的专家特征数据，采用K-means聚类算法进行画像重构处理，从而生成专家重构画像，其中画像重构处理包括以下子步骤：

第一步：随机选取K个点作为聚类中心，即K个类中心向量；

第二步：分别计算其他样本点到各个类中心向量的距离，并将其划分到距离最近的类；

第三步：更新各个类的中心向量；

第四步：更新各个类的中心向量判断新的类中心向量是否发生改变，若发生改变则转到第二步，若类中心向量不再发生变化，停止输出聚类结果。

其中，随机选取K值的步骤包括以下子步骤：

第一步：通过手肘法选取k值;

第二步：计算初始化K点；随机选择初始质心，每一个质心为一个类，对剩余每个样本点，计算它们到各个质心的欧氏距离，并将其归入到互相间距离最小的质心所在的簇。

第三步:迭代计算重新划分；计算各个新簇的质心，在所有样本点都划分完毕后，根据划分情况重新计算各个族的质心所在位置，然后迭代计算各个样本点到各簇质心的距离，对所有样本点进行重新划分，重复第二步和第三步，直至质心不在发生变化时或者到达最大迭代次数。

本发明实施例中，通过利用层次聚类算法对专家重构画像进行聚类处理，得到若干个聚类簇，对于每个聚类簇，计算所有成员的重构画像的平均值或者中位数，得到该簇的重构中心向量，对于每个专家，将其特征画像与所有聚类簇的重构中心向量进行距离比对，得到一个距离值，生成画像中心向量距离。

本发明实施例中，通过利用预设的中心向量距离判别值判别画像中心向量距离，对于每个专家，将其与所属的聚类簇的重构中心向量的距离值进行比较，若距离值小于预设的判别值，则将该专家视为该聚类簇的成员，将其特征画像加入该聚类簇的重构中心向量中重新计算，从而更新该聚类簇的重构中心向量。若距离值大于或等于预设的判别值，则视为该专家为新的聚类簇代表，从而生成一个新的聚类簇及其重构中心向量。重复上述步骤，对于每个专家，将其与所属的聚类簇的重构中心向量的距离值进行比较，若距离值小于预设的判别值，则将该专家视为该聚类簇的成员，将其特征画像加入该聚类簇的重构中心向量中重新计算，从而更新该聚类簇的重构中心向量。若距离值大于或等于预设的判别值，则视为该专家为新的聚类簇代表，从而生成一个新的聚类簇及其重构中心向量，根据新的聚类结果重新生成专家特征画像。

本发明实施例中，通过去噪算法，例如高斯滤波、中值滤波、小波变换等对专家特征画像进行边缘去噪处理，生成专家核心区域特征画像，利用画像核心区域标记分区公式对专家核心区域特征画像进行画像标记处理，生成专家履职画像。

优选地，步骤S24中的画像核心区域标记分区公式具体如下：

;

本发明提供了一种画像核心区域标记分区公式，该公式充分考虑了画像闭圆上的像素点系数、画像核心区域第个特征权重、画像核心区域中所有特征灰度值的平均值、画像核心区域参数控制特征点分布的范围、画像核心区域圆心横坐标、画像核心区域圆心第个特征横坐标、画像核心区域圆心纵坐标、画像核心区域圆心第个特征纵坐标、画像核心区域特征点的数量，根据画像核心区域中所有特征灰度值的平均值与画像核心区域参数控制特征点分布的范围以及函数之间的相互作用，以形成函数关系：

；

优选地，步骤S3包括以下步骤：

本发明实施例中，通过预设一个标准层级，用于分割专家履职画像。可以根据具体应用需求来确定层级数量。然后，利用图像分割算法对专家履职画像进行层级分割，得到每一层级的图像。常用的分割算法有基于阈值、区域生长、边缘检测、聚类等方法，得到分割后的专家层级画像，将每个层级图像投影到一个特定的色彩空间中，例如RGB、HSV、LAB、YUV等，采用基于颜色阈值或者基于形状的方法来过滤无关区域例如，可以选取色彩投影后的图像中的所有饱和度或者亮度值大于某个预设阈值的像素，将这些像素看作有颜色的像素，形成一个二值化的图像，二值化后，可以基于连通性对图像进行区域处理，将所有有颜色的区域形成一个一个的目标区域，从而生成专家过滤色彩图像，使用基于梯度、拉普拉斯、Canny等算法的边缘检测方法对其进行边缘检测处理，去除边缘图像从而得到中心层级图像。

优选地，步骤S4包括以下步骤：

本发明实施例中，将中心层级图像进行色块切割。色块切割是指将每个颜色区域分别分离出来，并形成独立的色块。可以通过图像分割算法对中心层级画像进行色块切割，得到每个颜色区域的独立图像。利用深度色彩检测公式对中心层级色块进行色彩深度检测。颜色深度是指颜色的饱和度和亮度的综合评价，可以由颜色的亮度值、饱和度值和色相值来决定，对色深检测图像进行邻域色彩对比处理，从而生成专家履职色深图像。邻域色彩对比处理是指将每个色块与其周围的颜色区域进行对比，得出该色块的颜色深度。可以采用基于窗口的方法，在每个窗口内进行颜色深度计算。计算得到的色深值可以通过颜色映射来可视化，得到专家履职的色深图像。

优选地，步骤S42中的深度色彩检测公式具体如下：

;

；

本发明提供了一种深度色彩检测公式，该公式充分考虑了中心层级色块的样本数量、中心层级色块第个样本点红原色值、中心层级色块第个样本点绿原色值、中心层级色块第个样本点蓝原色值、中心层级色块所有样本红原色均值、中心层级色块所有样本绿原色均值、中心层级色块所有样本蓝原色均值、中心层级色块控制偏差权重系数、中心层级色块控制样本颜色值与权重系数比例的缩放系数、中心层级色块权重系数调整样本值的贡献函数值、中心层级色块色彩调整值，根据中心层级色块权重系数调整样本值的贡献函数值与中心层级色块的样本数量以及函数之间的相互作用，以形成函数关系：

；

优选地，步骤S43包括以下步骤：

作为本发明的一个实例，参考图4所示，为图1中步骤S43的详细实施步骤流程示意图，在本实例中所述步骤S43包括：

本发明实施例中，对生成的专家履职色深图像进行像素点切割处理，其中，像素点切割是指通过二值化处理、分割算法等方式对图像进行像素点切割，将专家履职色深图像中的每个像素点分离出来，成为一个独立的个体。通过对每个像素点的颜色深度值进行筛选和分类，得到不同的色深像素点。例如，可以根据颜色深度阈值或区间划分，将颜色深度在某个范围内的像素点筛选出来，统计其出现的次数，形成一个独立的色深像素点。

本发明实施例中，通过计算获得每个色深像素点所在的位置和编号，基于图像坐标系、像素点位置、像素点编号等来计算色深像素点的地址信息。例如，在图像坐标系中，色深像素点的地址可以用(x，y)来表示，其中x表示像素所在的列数，y表示像素所在的行数；在像素点编号中，可以将像素点按照行序号或列序号一维化，然后给每个像素点一个唯一的编号，用于标识其在图像中的位置，生成色深像素点地址。

本发明实施例中，通过使用对比度算法对色深像素点定义5x5的邻域范围，对邻域范围内的像素点进行颜色获取，使用的对比度算法包括Sobel、Prewitt等，对颜色获取到的邻域像素点进行归类和统计，生成色深邻域像素点。根据获取到的颜色值和颜色深度值来对邻域像素点进行分类和统计，例如，可以根据颜色深度值的相差程度，筛选出深度相似的像素点，作为一个独立的色深邻域像素点。

本发明实施例中，通过获取已完成邻域颜色获取处理的色深邻域像素点和已完成色深地址计算处理的色深像素点地址，通过匹配邻域像素点和色深像素点地址，确定其在专家履职色深图像中的位置。然后，根据预设的颜色标准值，比较与基准像素点的色差异，并剔除生成色差大于颜色标准值的像素点，这些色差较大或与大多数邻域像素点不相似的像素点都不适合用作最终的色深描述，从而生成标准的色深定位像素点。通过对邻域的标准色深定位像素点进行聚合，按照一定的比例进行加权平均，以保留更多原始色深特征，然后再将这些加权平均值绘制成像素点形式，生成专家履职色深图像。

优选地，步骤S5包括以下步骤：

步骤S51：获取历史专家数据；

本发明实施例中，通过获取历史专家数据，包括专家的基本信息、履职记录、成果列表、社交媒体行为等，利用卷积神经网络模型对专家履职色深图像数据进行深度训练，生成专家画像分析模型。卷积神经网络模型可以自动地从数据中提取专家的特征信息，并建立有效的关系模型，将获取的专家数据转化成专家履职色深图像数据，并将其作为输入数据导入到生成的专家画像分析模型中进行分析预测处理，将模型预测结果进行组合和分析，并根据所需的报告格式和要求，生成专家履职报告，报告的内容可以包括专家的基本信息、履职记录、成果评价、排名分析、预警提醒和社交行为分析等。

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在申请文件的等同要件的含义和范围内的所有变化涵括在本发明内。

以上所述仅是本发明的具体实施方式，使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于K-means的专家画像分析方法，其特征在于，所述方法包括以下步骤：

步骤S2，包括：

步骤S24：对专家特征画像进行边缘去噪处理，生成专家核心区域特征画像；利用画像核心区域标记分区公式对专家核心区域特征画像进行画像标记处理，生成专家履职画像；

其中，画像核心区域标记分区公式如下所示：

;

式中，表示为画像标记分区函数，表示为画像闭圆上的像素点系数，表示为画像核心区域第个特征权重，表示为画像核心区域中所有特征灰度值的平均值，表示为画像核心区域参数控制特征点分布的范围，表示为画像核心区域圆心横坐标，表示为画像核心区域圆心第个特征横坐标，表示为画像核心区域圆心纵坐标，表示为画像核心区域圆心第个特征纵坐标，表示为画像核心区域特征点的数量，表示为画像核心区域特征标记异常调整值；

2.根据权利要求1所述的基于K-means的专家画像分析方法，其特征在于，步骤S1包括以下步骤：

3.根据权利要求1所述的基于K-means的专家画像分析方法，其特征在于，步骤S3包括以下步骤：

4.根据权利要求1所述的基于K-means的专家画像分析方法，其特征在于，步骤S4包括以下步骤：

5.根据权利要求4所述的基于K-means的专家画像分析方法，其特征在于，步骤S42中的深度色彩检测公式如下所示：

6.根据权利要求4所述的基于K-means的专家画像分析方法，其特征在于，步骤S43包括以下步骤：

7.根据权利要求1所述的基于K-means的专家画像分析方法，其特征在于，步骤S5包括以下步骤：

步骤S51：获取历史专家数据；

8.一种基于K-means的专家画像分析系统，其特征在于，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的基于K-means的专家画像分析方法。