CN115293131B

CN115293131B - 数据匹配方法、装置、设备及存储介质

Info

Publication number: CN115293131B
Application number: CN202211194848.3A
Authority: CN
Inventors: 冯俊华; 李伟昌; 陈兴军; 徐跃飞
Original assignee: Guangzhou Wanwei Vision Technology Co ltd
Current assignee: Guangzhou Wanwei Vision Technology Co ltd
Priority date: 2022-09-29
Filing date: 2022-09-29
Publication date: 2023-01-06
Anticipated expiration: 2042-09-29
Also published as: CN115293131A

Abstract

本发明涉及信息匹配技术领域，公开了一种数据匹配方法、装置、设备及存储介质，该方法包括：解析待评估人员的简历文件中各文本区域上的简历字段，并进行结构化处理，得到结构化数据；根据各文本区域在简历文件中排版关系，对各结构化数据进行重组，得到结构化标准数据；根据结构化标准数据对应的信息区域类型确定对应的知识库，并基于知识库对待评估人员进行评估，得到对应的技能分值；计算结构化标准数据以及对应的技能分值，与各项目岗位的匹配度，得到待评估人员与各项目岗位的评估分值并选择满足条件的岗位，并推送给待评估人员。本方法通过将简历转化成标准化的信息区域，得到提供可阅读的标准化数据，进而实现岗位匹配机制和人才评价机制。

Description

数据匹配方法、装置、设备及存储介质

技术领域

本发明涉及信息匹配技术领域，尤其涉及一种数据匹配方法、装置、设备及存储介质。

背景技术

随着互联网技术的不断发展，越来越多的企业或公司通过互联网发布工作岗位，而对工作岗位有求职需求的求职者，同样通过网络将其简历文件上传，以对工作岗位进行求职，企业或公司的招聘人员通过对接收到的各个简历文件进行查看筛选，来确定与所发布的工作岗位匹配的简历文件。为了提高招聘人员的审查效率，出现了利用算法对求职者的简历进行初步筛选，确定出与招聘人员需求匹配度较高的求职者，但仅根据简历进行筛选，由于匹配关系或匹配条件过于单一，导致匹配准确率较低且出的结果不具有参考价值。

发明内容

本发明的主要目的在于解决现有的人才与岗位之间的匹配不准确的技术问题。

本发明第一方面提供了一种数据匹配方法，包括：解析待评估人员的简历文件中各文本区域上的简历字段，并对解析到的简历字段进行结构化处理，得到对应的结构化数据，其中每个文本区域与待评估人员的一项能力信息对应；根据各文本区域在所述简历文件中排版关系，对各所述结构化数据进行重组，得到结构化标准数据，其中，所述结构化标准数据携带有标签，所述标签用于表征所述结构化标准数据的对应的信息区域类型；根据所述结构化标准数据对应的信息区域类型确定对应的知识库，并基于所述知识库对所述待评估人员的能力信息进行评估，得到对应的技能分值；计算所述结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到所述待评估人员与各项目岗位的评估分值；基于所述评估分值从各项目岗位中选择满足预设条件的岗位，并推送给所述待评估人员。

可选的，在本发明第一方面的第一种实现方式中，所述解析待评估人员的简历文件中各文本区域上的简历字段，并对解析到的简历字段进行结构化处理，得到对应的结构化数据包括：将所述简历文件中的简历内容转换为统一的文本格式；根据预设的指定字符对转换成所述文本格式的简历文件进行字段分割，得到简历字段以及所述简历字段所在的文本区域；对所述简历字段进行语义和语序的特征提取，并与预设的信息描述库进行匹配，将所述信息描述库中匹配成功的描述信息与特征提取后的简历字段进行替换，整理得到所述简历文件的结构化数据。

可选的，在本发明第一方面的第二种实现方式中，所述根据各文本区域在所述简历文件中排版关系，对各所述结构化数据进行重组，得到结构化标准数据包括：将所述简历字段所在的文本区域作为对应的结构化数据的文本区域；对所述结构化数据的文本区域进行关键字识别，并基于文本区域中的关键字确定各文本区域在所述简历文件中的排版关系；根据所述排版关系对所述文本区域进行分类，得到所述结构化数据的信息区域类型；将所述信息区域类型作为标签标注在所述结构化数据上，得到结构化标准数据。

可选的，在本发明第一方面的第三种实现方式中，所述根据所述结构化标准数据对应的信息区域类型确定对应的知识库，并基于所述知识库对所述待评估人员的能力信息进行评估，得到对应的技能分值包括：根据所述结构化标准数据对应的信息区域类型确定对应的知识库，其中，所述知识库包括技能知识库和综合描述库；根据所述综合描述库识别所述结构化标准数据对应的描述信息；基于所述描述信息从所述技能知识库中确定对应的技能信息；根据所述描述信息和所述技能信息计算所述待评估人员的能力信息对应的技能分值。

可选的，在本发明第一方面的第四种实现方式中，所述计算所述结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到所述待评估人员与各项目岗位的评估分值包括：获取所述项目岗位信息库中各项目岗位的岗位参数；基于所述结构化标准数据对应的描述信息将所述结构化标准数据与所述项目岗位信息库中的各项目岗位进行匹配；根据匹配成功的项目岗位的岗位参数和所述结构化数据的技能分值，计算所述待评估人员与匹配成功的各项目岗位的评估分值。

可选的，在本发明第一方面的第五种实现方式中，在所述计算所述结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到所述待评估人员与各项目岗位的评估分值之后，还包括：根据所述信息区域类型从各所述结构化标准数据中提取产品项目经历信息；将所述产品项目经历信息与预设的项目管理实施信息库中的企业产品的产品信息匹配，并基于匹配结果计算所述产品项目经历信息的合理性值；基于所述匹配结果和所述合理性值对所述企业产品对应的项目岗位的评估分值进行调整；将所述待评估人员以及待评估人员与各项目岗位的评估分值存储在预设的人才信息库中。

可选的，在本发明第一方面的第六种实现方式中，在所述计算所述结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到所述待评估人员与各项目岗位的评估分值之前还包括：获取待招聘项目岗位和所述待招聘项目岗位的岗位描述；将所述待招聘项目岗位的岗位描述与预设的标准岗位描述比对，提取出所述岗位描述中的岗位参数；将所述待招聘项目岗位和对应的岗位参数添加至所述项目岗位信息库中。

本发明第二方面提供了一种数据匹配装置，所述数据匹配装置包括：解析模块，用于解析待评估人员的简历文件中各文本区域上的简历字段，并对解析到的简历字段进行结构化处理，得到对应的结构化数据，其中每个文本区域与待评估人员的一项能力信息对应；重组模块，用于根据各文本区域在所述简历文件中排版关系，对各所述结构化数据进行重组，得到结构化标准数据，其中，所述结构化标准数据携带有标签，所述标签用于表征所述结构化标准数据的对应的信息区域类型；技能评价模块，用于根据所述结构化标准数据对应的信息区域类型确定对应的知识库，并基于所述知识库对所述待评估人员的能力信息进行评估，得到对应的技能分值；岗位评价模块，用于计算所述结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到所述待评估人员与各项目岗位的评估分值；推送模块，用于基于所述评估分值从各项目岗位中选择满足预设条件的岗位，并推送给所述待评估人员。

可选的，在本发明第二方面的第一种实现方式中，所述解析模块具体用于：将所述简历文件中的简历内容转换为统一的文本格式；根据预设的指定字符对转换成所述文本格式的简历文件进行字段分割，得到简历字段以及所述简历字段所在的文本区域；对所述简历字段进行语义和语序的特征提取，并与预设的信息描述库进行匹配，将所述信息描述库中匹配成功的描述信息与特征提取后的简历字段进行替换，整理得到所述简历文件的结构化数据。

可选的，在本发明第二方面的第二种实现方式中，所述重组模块具体用于：将所述简历字段所在的文本区域作为对应的结构化数据的文本区域；对所述结构化数据的文本区域进行关键字识别，并基于文本区域中的关键字确定各文本区域在所述简历文件中的排版关系；根据所述排版关系对所述文本区域进行分类，得到所述结构化数据的信息区域类型；将所述信息区域类型作为标签标注在所述结构化数据上，得到结构化标准数据。

可选的，在本发明第二方面的第三种实现方式中，所述技能评价模块具体用于：根据所述结构化标准数据对应的信息区域类型确定对应的知识库，其中，所述知识库包括技能知识库和综合描述库；根据所述综合描述库识别所述结构化标准数据对应的描述信息；基于所述描述信息从所述技能知识库中确定对应的技能信息；根据所述描述信息和所述技能信息计算所述待评估人员的能力信息对应的技能分值。

可选的，在本发明第二方面的第四种实现方式中，所述岗位评价模块具体用于：获取所述项目岗位信息库中各项目岗位的岗位参数；基于所述结构化标准数据对应的描述信息将所述结构化标准数据与所述项目岗位信息库中的各项目岗位进行匹配；根据匹配成功的项目岗位的岗位参数和所述结构化数据的技能分值，计算所述待评估人员与匹配成功的各项目岗位的评估分值。

可选的，在本发明第二方面的第五种实现方式中，所述数据匹配装置还包括存储模块，所述存储模块具体用于：根据所述信息区域类型从各所述结构化标准数据中提取产品项目经历信息；将所述产品项目经历信息与预设的项目管理实施信息库中的企业产品的产品信息匹配，并基于匹配结果计算所述产品项目经历信息的合理性值；基于所述匹配结果和所述合理性值对所述企业产品对应的项目岗位的评估分值进行调整；将所述待评估人员以及待评估人员与各项目岗位的评估分值存储在预设的人才信息库中。

可选的，在本发明第二方面的第六种实现方式中，所述数据匹配装置还包括库添加模块，所述库添加模块具体用于：获取待招聘项目岗位和所述待招聘项目岗位的岗位描述；将所述待招聘项目岗位的岗位描述与预设的标准岗位描述比对，提取出所述岗位描述中的岗位参数；将所述待招聘项目岗位和对应的岗位参数添加至所述项目岗位信息库中。

本发明第三方面提供了一种计算机设备，包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；所述至少一个处理器调用所述存储器中的所述指令，以使得所述计算机设备执行上述的数据匹配方法的步骤。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的数据匹配方法的步骤。

本发明的技术方案通过解析待评估人员的简历文件中各文本区域上的简历字段，并对解析到的简历字段进行结构化处理，得到对应的结构化数据，其中每个文本区域与待评估人员的一项能力信息对应；根据各文本区域在简历文件中排版关系，对各结构化数据进行重组，得到结构化标准数据，其中，结构化标准数据携带有标签，标签用于表征结构化标准数据的对应的信息区域类型；根据结构化标准数据对应的信息区域类型确定对应的知识库，并基于知识库对待评估人员的能力信息进行评估，得到对应的技能分值；计算结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到待评估人员与各项目岗位的评估分值；基于评估分值从各项目岗位中选择满足预设条件的岗位，并推送给待评估人员。本方法通过将简历转化成标准化的信息区域，得到提供可阅读的标准化数据，进而实现岗位匹配机制和人才评价机制，解决企业在岗位用人需求上人岗匹配，打造统一的跨领域、多维度的岗位需求及用人需求标准。

附图说明

图1为本发明实施例中数据匹配方法的第一个实施例示意图；

图2为本发明实施例中数据匹配方法的第二个实施例示意图；

图3为本发明实施例中数据匹配方法的第三个实施例示意图；

图4为本发明实施例中数据匹配装置的一个实施例示意图；

图5为本发明实施例中数据匹配装置的另一个实施例示意图；

图6为本发明实施例中计算机设备的一个实施例示意图。

具体实施方式

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等（如果存在）是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中数据匹配方法，所述数据匹配方法应用于微服务系统，所述微服务系统包括一个网关层和至少一个微服务模块，所述数据匹配方法的第一个实施例包括：

101、解析待评估人员的简历文件中各文本区域上的简历字段，并对解析到的简历字段进行结构化处理，得到对应的结构化数据，其中每个文本区域与待评估人员的一项能力信息对应；

可以理解的是，本发明的执行主体可以为数据匹配装置，还可以是终端或者服务器，具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

在本实施例中，服务器可收集各招聘渠道接收的求职简历信息，并将求职简历信息整理成为文档集合，从而获得简历文件，并将所述简历文件保存至简历库中。其中，简历文件可包括人才基本信息、学历、工作经历(包括工作时间、岗位名称、项目经历及工作内容等)、期望薪资、期望工作地点等信息。

在本实施例中，服务器会从简历库中获取待评估人员的简历文件，将简历库中的简历文件的文件格式转换成预设的文本格式，其中，简历文件的文件格式一般包括pdf格式、image格式、document格式和txt格式，服务器会将前面提到的前三种格式统一转换成txt格式，便于系统识别，在转换成txt格式后，根据预设的指定字符将简历文件进行字段分割，得到多个简历字段，并通过自然语言理解技术将分割好的字段进行语义和语序特征提取以及去噪，得到简历文件的结构化数据。

102、根据各文本区域在简历文件中排版关系，对各结构化数据进行重组，得到结构化标准数据，其中，结构化标准数据携带有标签，标签用于表征结构化标准数据的对应的信息区域类型；

在本实施例中，字段结构化系统可以将文本中的结构化数据根据排版关系进行结构化重组，将结构化数据重组成能被机器阅读的结构化标准数据形成信息区域，例如，简历文件的文本中部分字段如下：

工作经历

20xx年xx月~20xx年xx月

Xx职位

Xx公司

Xx公司类型

正式职位

Xxx工作内容描述1

Xxx工作内容描述2

Xxx工作内容描述3

Xxx任职期间成就1

Xxx任职期间成就2

20xx年xx月~20xx年xx月A

Xx职位A

Xx公司A

Xx公司类型A

正式职位A

Xxx工作内容描述1A

Xxx工作内容描述2A

Xxx工作内容描述3A

Xxx任职期间成就1A

Xxx任职期间成就2A

结构化后字段将被整合成一个完整的字段：

工作经历：20xx年xx月~20xx年xx月；Xx职位；Xx公司；Xx公司类型；正式职位。Xxx工作内容描述1；Xxx工作内容描述2；Xxx工作内容描述3。Xxx任职期间成就1；Xxx任职期间成就2。

工作经历：20xx年xx月~20xx年xx月A；Xx职位A；Xx公司A；Xx公司类型A。正式职位A；Xxx工作内容描述1A；Xxx工作内容描述2A；Xxx工作内容描述3A。Xxx任职期间成就1A；Xxx任职期间成就2A。

在本实施例中，在进行结构化数据的重组的过程中，会将完成结构化组合的文本内容的简历进行区域化分类和熟练度识别与标记，形成简历区域化信息，并将简历区域信息作为标签，具体的结构化数据会被评价并基于标签分类成基本信息区域、学历信息区域、技能信息区域、企业信息区域、产项信息区域、学校组织信息区域、特殊经历信息区域、其他信息区域、期望岗位信息区域划分为不同的信息区域。

103、根据结构化标准数据对应的信息区域类型确定对应的知识库，并基于知识库对待评估人员的能力信息进行评估，得到对应的技能分值；

在本实施例中，信息区域数据中除了有简历中的对应信息之外还有基于技能知识库和综合描述库中对应描述以及对应技能知识的分值，也即是技能分值，这将把对应信息区域的信息进行分数标记。

在本实施例中，还会根据不同的信息区域类型获取对应的信息区域数据，例如对于期望岗位信息区域，会获取期望岗位的名称、薪资等级、技能权重、年限权重、证书权重和行业权重等，其中期望岗位的名称为这个岗位的所有岗位名称，薪资等级为这个岗位不同等级、不同薪资对应的分值，其中的salary为浮点型，以千（k）为单位，技能权重为这个岗位所需技能以及对应等级分值，年限权重为这个岗位工作年限不同所对应的分值，证书权重为这个岗位相关证书对应的分值，行业权重为这个岗位在不同行业的分值，各个信息区域的格式以一个结构化字段为主体，以数组的形式存在。

104、计算结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到待评估人员与各项目岗位的评估分值；

105、基于评估分值从各项目岗位中选择满足预设条件的岗位，并推送给待评估人员。

在本实施例中，通过使用推荐算法对区域化的简历信息和简历关键信息库进行比较，获取简历区域信息分数；对比企业岗位需求信息库信息获取简历区域信息匹配度，根据简历区域信息匹配度计算简历对于企业需求岗位的匹配度。推荐算法会将对应企业岗位需求信息库中对应的已经标准化的信息和人才简历中对应的标准化信息进行比较，按照对应匹配程度进行划分。基于标签分类的推荐系统评价主观性强，能够对模糊意义的标签有一定差异化的解析，能更加规范每一个标签的使用规则和提高匹配精准度。可以让推荐算法在比较的过程有更加精准的判断依据和配对标准，根据待评估人员与不同岗位之间的评估分值，可以从中选择评估分值最高的项目岗位作为待评估人员的岗位并推送给待评估人员。

在本实施例通过解析待评估人员的简历文件中各文本区域上的简历字段，并对解析到的简历字段进行结构化处理，得到对应的结构化数据，其中每个文本区域与待评估人员的一项能力信息对应；根据各文本区域在简历文件中排版关系，对各结构化数据进行重组，得到结构化标准数据，其中，结构化标准数据携带有标签，标签用于表征结构化标准数据的对应的信息区域类型；根据结构化标准数据对应的信息区域类型确定对应的知识库，并基于知识库对待评估人员的能力信息进行评估，得到对应的技能分值；计算结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到待评估人员与各项目岗位的评估分值；基于评估分值从各项目岗位中选择满足预设条件的岗位，并推送给待评估人员。本方法通过将简历转化成标准化的信息区域，得到提供可阅读的标准化数据，进而实现岗位匹配机制和人才评价机制，解决企业在岗位用人需求上人岗匹配，打造统一的跨领域、多维度的岗位需求及用人需求标准。

请参阅图2，本发明实施例中数据匹配方法的第二个实施例包括：

201、将简历文件中的简历内容转换为统一的文本格式；

在本实施例中，历文件中的简历内容pdf格式、image格式、document格式和txt格式，服务器会将前面提到的前三种格式统一转换成txt格式，便于系统识别，其中image格式的简历内容为图片，可以通过ocr技术识别出其中的字符，并转换成txt格式。

202、根据预设的指定字符对转换成文本格式的简历文件进行字段分割，得到简历字段以及简历字段所在的文本区域；

在本实施例中，根据预设的指定字符进行字段分割，例如简历文件中包括“工作经历20xx年xx月~20xx年xx月Xx职位Xx公司Xx公司”，在识别到日期对应的字符时，则将该处进行分割，在识别到指定字符为公司时，将该处进行分割，得到“工作经历20xx年xx月~20xx年xx月”“Xx职位”“Xx公司”“Xx公司”，并根据不同字段在简历文件中的位置得到简历字段所在的文本区域。

203、对简历字段进行语义和语序的特征提取，并与预设的信息描述库进行匹配，将信息描述库中匹配成功的描述信息与特征提取后的简历字段进行替换，整理得到简历文件的结构化数据；

在本实施例中，通过自然语言理解技术将分割好的字段进行语义和语序特征提取以及去噪。其中语序是汉语句法结构中的一个重要的表达手段，其按照主语、谓语和宾语的不同，可分为六种类型。针对内容表述的不同、用词排序的不同、句法结构关系和排列组合的不同，可以将一句话以不同的方式进行表达。因此，通过利用语序进行的字段去噪，可以让为字段标准话提供更加理想的内容，在本实施例中，主要是基于将简历对应字段内容与各个信息库信息进行匹配，并将匹配度最高的对应信息库描述信息与简历对应字段进行替换，得到简历文件的结构化数据。

204、将简历字段所在的文本区域作为对应的结构化数据的文本区域；

205、对结构化数据的文本区域进行关键字识别，并基于文本区域中的关键字确定各文本区域在简历文件中的排版关系；

206、根据排版关系对文本区域进行分类，得到结构化数据的信息区域类型；

在本实施例中，结构化数据会被评价并基于标签分类成基本信息区域、学历信息区域、技能信息区域、企业信息区域、产项信息区域、学校组织信息区域、特殊经历信息区域、其他信息区域、期望岗位信息区域划分为不同的信息区域数据，根据不同的信息区域对结构化数据进行重新整合，得到结构化标准数据，并且给结构化标准数据打上标签。

207、将信息区域类型作为标签标注在结构化数据上，得到结构化标准数据；

208、根据结构化标准数据对应的信息区域类型确定对应的知识库，并基于知识库对待评估人员的能力信息进行评估，得到对应的技能分值；

209、计算结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到待评估人员与各项目岗位的评估分值；

210、基于评估分值从各项目岗位中选择满足预设条件的岗位，并推送给待评估人员。

本实施例在上一实施例的基础上，详细描述了结构化数据和结构化标准数据的生成过程，其中，结构化数据通过将所述简历文件中的简历内容转换为统一的文本格式；根据预设的指定字符对转换成所述文本格式的简历文件进行字段分割，得到简历字段以及所述简历字段所在的文本区域；对所述简历字段进行语义和语序的特征提取，并与预设的信息描述库进行匹配，将所述信息描述库中匹配成功的描述信息与特征提取后的简历字段进行替换，整理得到所述简历文件的结构化数据。本方法通过将简历转化成标准化的信息区域，得到提供可阅读的标准化数据，进而实现岗位匹配机制和人才评价机制，解决企业在岗位用人需求上人岗匹配，打造统一的跨领域、多维度的岗位需求及用人需求标准。

请参阅图3，本发明实施例中数据匹配方法的第三个实施例包括：

301、解析待评估人员的简历文件中各文本区域上的简历字段，并对解析到的简历字段进行结构化处理，得到对应的结构化数据，其中每个文本区域与待评估人员的一项能力信息对应；

302、根据各文本区域在简历文件中排版关系，对各结构化数据进行重组，得到结构化标准数据，其中，结构化标准数据携带有标签，标签用于表征结构化标准数据的对应的信息区域类型；

303、根据结构化标准数据对应的信息区域类型确定对应的知识库，其中，知识库包括技能知识库和综合描述库；

304、根据综合描述库识别结构化标准数据对应的描述信息；

305、基于描述信息从技能知识库中确定对应的技能信息；

306、根据描述信息和技能信息计算待评估人员的能力信息对应的技能分值；

在本实施例中，根据结构化标准数据对应的信息区域类型从结构化标准数据中提取关键职业技能，确定对应的知识库，基于描述信息从技能知识库中确定对应的技能信息，根据描述信息和技能信息计算结构化标准数据对应的技能分值，并根据不同技能分值判断不同技能的熟悉程度，包括

了解、理解：知道这个技能的存在，也知道它是用来做什么的，甚至偶尔会去简单的使用以一下。【30~60】

熟悉：经常性使用，但没有很多的了解，也没进行过系统化或者深入学习。【60~70】

掌握、擅长：能完成一些功能，解决一些问题，但是还不熟练，频繁需要外部资源的支持。【70~80】

熟练：能够独立快速的搞定功能模块，业务需求。甚至有自己的知识库和工具集合，很多时候能够利用自己的知识库和工具集合实现自动化完成。【80~90】

精通：有一定的影响力，对这种技术的优缺点，适用场景有非常深刻的理解。能够回答别人对这项技术相关的问题，一般不会在这项技术中被难倒，能够进行人才的培养。【90~100】

比较过程如下表所述：

描述信息	技能信息	比较结果
			熟悉HTML/CSS/JavaScript熟练使用VUE/Jquery/Bootstrap等前端框架理解js新技术、响应式布局、前端性能熟练使用VScode，DreamWeaver，WebStorms工具熟练掌握Photoshop CDR等制图软件	Web/H5开发-HTML编程语言 Web/H5开发-CSS编程语言 Web/H5/PC开发-JavaScript编程语言Web/H5/PC开发-Vue前端框架 Web开发-Jquery前端技术库 Web/PC/移动开发技术-响应式布局前端开发技术-前端性能开发软件-VSCode 开发软件-DreamWeaver 开发软件-WebStorms 设计软件-PhotoShop 设计软件-CorelDRAW	Web/H5开发-HTML编程语言:(60,70)Web/H5开发-CSS编程语言:(60,70)Web/H5/PC开发-JavaScript编程语言:(60,70) Web/H5/PC开发-Vue前端框架:(80,90) Web开发-Jquery前端技术库:(80,90) Web开发-Bootstrap:(80,90) Web/PC/移动开发技术-响应式布局:(30,60) 前端开发技术-前端性能:(30,60) 开发软件-VSCode:(80,90) 开发软件-DreamWeaver:(80,90) 开发软件-WebStorms:(80,90) 设计软件-PhotoShop:(80,90) 设计软件-CorelDRAW:(80,90)

307、获取项目岗位信息库中各项目岗位的岗位参数；

308、基于结构化标准数据对应的描述信息将结构化标准数据与项目岗位信息库中的各项目岗位进行匹配；

309、根据匹配成功的项目岗位的岗位参数和结构化数据的技能分值，计算待评估人员与匹配成功的各项目岗位的评估分值；

310、基于评估分值从各项目岗位中选择满足预设条件的岗位，并推送给待评估人员。

在本实施例中，在所述将各所述结构化标准数据以及对应的技能分值与预设的项目岗位信息库中的各项目岗位进行匹配计算，得到所述待评估人员与各项目岗位的评估分值之后，还包括：根据所述信息区域类型从各所述结构化标准数据中提取产品项目经历信息；将所述产品项目经历信息与预设的项目管理实施信息库中的企业产品的产品信息匹配，并基于匹配结果计算所述产品项目经历信息的合理性值；基于所述匹配结果和所述合理性值对所述企业产品对应的项目岗位的评估分值进行调整；将所述待评估人员以及待评估人员与各项目岗位的评估分值存储在预设的人才信息库中。

具体的，从简历区域信息中提取产品、项目实施经历，将产品、项目关键信息与组织化企业产品与项目管理实施信息库进行匹配。一方面校验简历区域信息中的产品、项目实施经历合理性；另一方面校对简历区域信息中的产品、项目实施数据与组织化企业产品与项目管理实施信息库的数据的信息匹配度，计算简历对应产品、项目实时数据的标准化结构评价以及标准化贡献度。

在本实施例中，在所述将各所述结构化标准数据以及对应的技能分值与预设的项目岗位信息库中的各项目岗位进行匹配计算，得到所述待评估人员与各项目岗位的评估分值之前还包括：获取待招聘项目岗位和所述待招聘项目岗位的岗位描述；将所述待招聘项目岗位的岗位描述与预设的标准岗位描述比对，提取出所述岗位描述中的岗位参数；将所述待招聘项目岗位和对应的岗位参数添加至所述项目岗位信息库中。

具体的，比较过程如下表所示：

原招聘需求	需求解析结果	匹配机制反馈结果	反馈匹配机制计算依赖
				精通python编程语言，具备良好的代码书写规范和文档编写能力；熟悉常用特征提取及分类算法；人工智能相关专业，三年以上算法项目开发实践经验；良好的沟通能力，积极进取的工作态度，乐于接受挑战，思路清晰，善于钻研思考。	精通python编程语言良好的代码书写规范良好的文档编写能力熟悉常用特征提取算法熟悉常用分类算法人工智能相关专业算法项目开发实践经验三年及以上良好的沟通能力优秀的研究能力良好的分析能力	AI/BigData开发-python编程语言:(90,100)开发软技能-代码编写规范:(70,80) 开发软技能-技术文档编写:(70,80) [以下常用，即热度高的算法] 算法使用-HOG:(60,70) 算法使用-LBP:(60,70).....	1. 要求信息对应数据中存在python编程语言分值90及以上 2. 要求信息对应数据中存在类似描述文档或代码编写能力，视为额外加分项目3. 要求信息对应数据中存在累计三年以上的有关于人工智能为次要、算法为主要的项目、产品经历 4. 要求信息对应数据中存在特征提取算法及分类算法且分值在60及以上 5. 要求信息对应数据中存在突显分析、沟通能力相关内容，有则视为额外加分项目

其中，“原招聘需求”是岗位招聘需求企业根据自己企业招聘需求所撰写的内容；“需求解析结果”是系统根据企业招聘自行撰写的原招聘需求所进行结构化后的结果；“匹配机制反馈结果”是系统根据技能知识库和综合描述库等进行信息匹配后的结果；系统则是根据匹配机制反馈结果对简历库的简历进行筛选，其筛选的基本要求则是达到“反馈匹配机制计算依赖”的几项标准，按照完美、优秀、良好、合格、不合格进行投稿简历和推荐简历的匹配标签标注。

在本实施例中，根据上述分析和反馈结果，原招聘需求需要招聘方进行对应的内容细化，如具体特征提取算法具体哪些算法，人工智能相关专业具体哪几类专业等信息优化后，匹配结果将更加精确。

本实施例在前实施例的基础上，详细描述了根据所述结构化标准数据对应的信息区域类型确定对应的知识库，并基于所述知识库对所述结构化标准数据进行评估，得到对应的技能分值的过程，通过根据所述结构化标准数据对应的信息区域类型确定对应的知识库，其中，所述知识库包括技能知识库和综合描述库；根据所述综合描述库识别所述结构化标准数据对应的描述信息；基于所述描述信息从所述技能知识库中确定对应的技能信息；根据所述描述信息和所述技能信息计算所述结构化标准数据对应的技能分值。本方法通过将简历转化成标准化的信息区域，得到提供可阅读的标准化数据，进而实现岗位匹配机制和人才评价机制，解决企业在岗位用人需求上人岗匹配，打造统一的跨领域、多维度的岗位需求及用人需求标准。

上面对本发明实施例中数据匹配方法进行了描述，下面对本发明实施例中数据匹配装置进行描述，请参阅图4，本发明实施例中数据匹配装置一个实施例中，所述数据匹配装置包括：

解析模块401，用于解析待评估人员的简历文件中各文本区域上的简历字段，并对解析到的简历字段进行结构化处理，得到对应的结构化数据，其中每个文本区域与待评估人员的一项能力信息对应；

重组模块402，用于根据各文本区域在所述简历文件中排版关系，对各所述结构化数据进行重组，得到结构化标准数据，其中，所述结构化标准数据携带有标签，所述标签用于表征所述结构化标准数据的对应的信息区域类型；

技能评价模块403，用于根据所述结构化标准数据对应的信息区域类型确定对应的知识库，并基于所述知识库对所述待评估人员的能力信息进行评估，得到对应的技能分值；

岗位评价模块404，用于计算所述结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到所述待评估人员与各项目岗位的评估分值；

推送模块405，用于基于所述评估分值从各项目岗位中选择满足预设条件的岗位，并推送给所述待评估人员。

本发明实施例中，所述数据匹配装置运行上述数据匹配方法，通过获取待评估人员的简历文件，并对所述简历文件进行字段解析和结构化处理，得到所述简历文件的结构化数据；将所述结构化数据根据在所述简历文件中的文本区域进行重组，得到结构化标准数据，其中，所述结构化标准数据携带有标签，所述标签用于表征所述结构化标准数据的对应的信息区域类型；根据所述结构化标准数据对应的信息区域类型确定对应的知识库，并基于所述知识库对所述结构化标准数据进行评估，得到对应的技能分值；将各所述结构化标准数据以及对应的技能分值与预设的项目岗位信息库中的各项目岗位进行匹配计算，得到所述待评估人员与各项目岗位的评估分值。本方法通过将简历转化成标准化的信息区域，得到提供可阅读的标准化数据，进而实现岗位匹配机制和人才评价机制，解决企业在岗位用人需求上人岗匹配，打造统一的跨领域、多维度的岗位需求及用人需求标准。

请参阅图5，本发明实施例中数据匹配装置的第二个实施例包括：

在本实施例中，所述解析模块401具体用于：将所述简历文件中的简历内容转换为统一的文本格式；根据预设的指定字符对转换成所述文本格式的简历文件进行字段分割，得到简历字段以及所述简历字段所在的文本区域；对所述简历字段进行语义和语序的特征提取，并与预设的信息描述库进行匹配，将所述信息描述库中匹配成功的描述信息与特征提取后的简历字段进行替换，整理得到所述简历文件的结构化数据。

在本实施例中，所述重组模块402具体用于：将所述简历字段所在的文本区域作为对应的结构化数据的文本区域；对所述结构化数据的文本区域进行关键字识别，并基于文本区域中的关键字确定各文本区域在所述简历文件中的排版关系；根据所述排版关系对所述文本区域进行分类，得到所述结构化数据的信息区域类型；将所述信息区域类型作为标签标注在所述结构化数据上，得到结构化标准数据。

在本实施例中，所述技能评价模块403具体用于：根据所述结构化标准数据对应的信息区域类型确定对应的知识库，其中，所述知识库包括技能知识库和综合描述库；根据所述综合描述库识别所述结构化标准数据对应的描述信息；基于所述描述信息从所述技能知识库中确定对应的技能信息；根据所述描述信息和所述技能信息计算所述待评估人员的能力信息对应的技能分值。

在本实施例中，所述岗位评价模块404具体用于：获取所述项目岗位信息库中各项目岗位的岗位参数；基于所述结构化标准数据对应的描述信息将所述结构化标准数据与所述项目岗位信息库中的各项目岗位进行匹配；根据匹配成功的项目岗位的岗位参数和所述结构化数据的技能分值，计算所述待评估人员与匹配成功的各项目岗位的评估分值。

在本实施例中，所述数据匹配装置还包括存储模块406，所述存储模块406具体用于：根据所述信息区域类型从各所述结构化标准数据中提取产品项目经历信息；将所述产品项目经历信息与预设的项目管理实施信息库中的企业产品的产品信息匹配，并基于匹配结果计算所述产品项目经历信息的合理性值；基于所述匹配结果和所述合理性值对所述企业产品对应的项目岗位的评估分值进行调整；将所述待评估人员以及待评估人员与各项目岗位的评估分值存储在预设的人才信息库中。

在本实施例中，所述数据匹配装置还包括库添加模块407，所述库添加模块407具体用于：获取待招聘项目岗位和所述待招聘项目岗位的岗位描述；将所述待招聘项目岗位的岗位描述与预设的标准岗位描述比对，提取出所述岗位描述中的岗位参数；将所述待招聘项目岗位和对应的岗位参数添加至所述项目岗位信息库中。

本实施例在上一实施例的基础上，详细描述了各个模块的具体功能，应用于微服务系统，微服务系统包括网关层和至少一个微服务模块，通过网关层获取请求方发出的业务请求，并根据业务请求确定需调用的至少一个微服务模块和对应的接口；通过接口依次调用对应的微服务模块，并在每次调用微服务模块时判断是否满足业务请求对应的业务需求；当不满足时，则通过当前微服务模块的上层调用者对当前微服务模块抛出的异常依次上抛，并对异常进行处理，得到异常处理结果集；当满足时，则通过网关层向请求方返回调用成功的消息。本装置通过每个微服务模块对上抛的异常数据处理的方式，确保在每个环节都能明确得知异常所在，提升研发人员的效率。

上面图4和图5从模块化功能实体的角度对本发明实施例中的中数据匹配装置进行详细描述，下面从硬件处理的角度对本发明实施例中计算机设备进行详细描述。

图6是本发明实施例提供的一种计算机设备的结构示意图，该计算机设备600可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器（centralprocessing units，CPU）610（例如，一个或一个以上处理器）和存储器620，一个或一个以上存储应用程序633或数据632的存储介质630（例如一个或一个以上海量存储设备）。其中，存储器620和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块（图示没标出），每个模块可以包括对计算机设备600中的一系列指令操作。更进一步地，处理器610可以设置为与存储介质630通信，在计算机设备600上执行存储介质630中的一系列指令操作，以实现上述数据匹配方法的步骤。

计算机设备600还可以包括一个或一个以上电源640，一个或一个以上有线或无线网络接口650，一个或一个以上输入输出接口660，和/或，一个或一个以上操作系统631，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图6示出的计算机设备结构并不构成对本申请提供的计算机设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在计算机上运行时，使得计算机执行所述数据匹配方法的步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统或装置、单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（read-only memory，ROM）、随机存取存储器（random access memory，RAM）、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种数据匹配方法，其特征在于，所述数据匹配方法包括：

解析待评估人员的简历文件中各文本区域上的简历字段，并对解析到的简历字段进行结构化处理，得到对应的结构化数据，其中每个文本区域与待评估人员的一项能力信息对应；

将所述简历字段所在的文本区域作为对应的结构化数据的文本区域；对所述结构化数据的文本区域进行关键字识别，并基于文本区域中的关键字确定各文本区域在所述简历文件中的排版关系；根据所述排版关系对所述文本区域进行分类，得到所述结构化数据的信息区域类型；将所述信息区域类型作为标签标注在所述结构化数据上，得到结构化标准数据，其中，所述结构化标准数据携带有标签，所述标签用于表征所述结构化标准数据的对应的信息区域类型；

根据所述结构化标准数据对应的信息区域类型确定对应的知识库，其中，所述知识库包括技能知识库和综合描述库；根据所述综合描述库识别所述结构化标准数据对应的描述信息；基于所述描述信息从所述技能知识库中确定对应的技能信息；根据所述描述信息和所述技能信息计算所述待评估人员的能力信息对应的技能分值，并将所述技能分值标注在所述结构化标准数据上；

计算所述结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到所述待评估人员与各项目岗位的评估分值，其中，所述计算所述结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到所述待评估人员与各项目岗位的评估分值包括以下步骤：获取所述项目岗位信息库中各项目岗位的岗位参数；基于所述结构化标准数据对应的描述信息将所述结构化标准数据与所述项目岗位信息库中的各项目岗位进行匹配；根据匹配成功的项目岗位的岗位参数和所述结构化数据的技能分值，计算所述待评估人员与匹配成功的各项目岗位的评估分值；

基于所述评估分值从各项目岗位中选择满足预设条件的岗位，并推送给所述待评估人员。

2.根据权利要求1所述的数据匹配方法，其特征在于，所述解析待评估人员的简历文件中各文本区域上的简历字段，并对解析到的简历字段进行结构化处理，得到对应的结构化数据包括：

将所述简历文件中的简历内容转换为统一的文本格式；

根据预设的指定字符对转换成所述文本格式的简历文件进行字段分割，得到简历字段以及所述简历字段所在的文本区域；

对所述简历字段进行语义和语序的特征提取，并与预设的信息描述库进行匹配，将所述信息描述库中匹配成功的描述信息与特征提取后的简历字段进行替换，整理得到所述简历文件的结构化数据。

3.根据权利要求1所述的数据匹配方法，其特征在于，在所述计算所述结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到所述待评估人员与各项目岗位的评估分值之后，还包括：

根据所述信息区域类型从各所述结构化标准数据中提取产品项目经历信息；

将所述产品项目经历信息与预设的项目管理实施信息库中的企业产品的产品信息匹配，并基于匹配结果计算所述产品项目经历信息的合理性值；

基于所述匹配结果和所述合理性值对所述企业产品对应的项目岗位的评估分值进行调整；

将所述待评估人员以及待评估人员与各项目岗位的评估分值存储在预设的人才信息库中。

4.根据权利要求1所述的数据匹配方法，其特征在于，在所述计算所述结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到所述待评估人员与各项目岗位的评估分值之前还包括：

获取待招聘项目岗位和所述待招聘项目岗位的岗位描述；

将所述待招聘项目岗位的岗位描述与预设的标准岗位描述比对，提取出所述岗位描述中的岗位参数；

将所述待招聘项目岗位和对应的岗位参数添加至所述项目岗位信息库中。

5.一种数据匹配装置，其特征在于，所述数据匹配装置包括：

解析模块，用于解析待评估人员的简历文件中各文本区域上的简历字段，并对解析到的简历字段进行结构化处理，得到对应的结构化数据，其中每个文本区域与待评估人员的一项能力信息对应；

重组模块，用于将所述简历字段所在的文本区域作为对应的结构化数据的文本区域；对所述结构化数据的文本区域进行关键字识别，并基于文本区域中的关键字确定各文本区域在所述简历文件中的排版关系；根据所述排版关系对所述文本区域进行分类，得到所述结构化数据的信息区域类型；将所述信息区域类型作为标签标注在所述结构化数据上，得到结构化标准数据，其中，所述结构化标准数据携带有标签，所述标签用于表征所述结构化标准数据的对应的信息区域类型；

技能评价模块，用于根据所述结构化标准数据对应的信息区域类型确定对应的知识库，其中，所述知识库包括技能知识库和综合描述库；根据所述综合描述库识别所述结构化标准数据对应的描述信息；基于所述描述信息从所述技能知识库中确定对应的技能信息；根据所述描述信息和所述技能信息计算所述待评估人员的能力信息对应的技能分值，并将所述技能分值标注在所述结构化标准数据上；

岗位评价模块，用于计算所述结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到所述待评估人员与各项目岗位的评估分值，其中，所述计算所述结构化标准数据以及对应的技能分值，与预设的项目岗位信息库中的各项目岗位的匹配度，得到所述待评估人员与各项目岗位的评估分值包括以下步骤：获取所述项目岗位信息库中各项目岗位的岗位参数；基于所述结构化标准数据对应的描述信息将所述结构化标准数据与所述项目岗位信息库中的各项目岗位进行匹配；根据匹配成功的项目岗位的岗位参数和所述结构化数据的技能分值，计算所述待评估人员与匹配成功的各项目岗位的评估分值；

推送模块，用于基于所述评估分值从各项目岗位中选择满足预设条件的岗位，并推送给所述待评估人员。

6.一种计算机设备，其特征在于，所述计算机设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述计算机设备执行如权利要求1-4任一项所述的数据匹配方法的步骤。

7.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-4任一项所述的数据匹配方法的步骤。