CN112632227A

CN112632227A - 简历匹配方法、装置、电子设备、存储介质和程序产品

Info

Publication number: CN112632227A
Application number: CN202011606348.7A
Authority: CN
Inventors: 冯博豪; 韩光耀
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-12-30
Filing date: 2020-12-30
Publication date: 2021-04-09
Anticipated expiration: 2040-12-30
Also published as: CN112632227B

Abstract

本申请公开了简历匹配方法、装置、电子设备、存储介质和程序产品，涉及简历管理技术领域。具体实现方案为：将简历进行划分，得到多个分区；对每个分区进行关键信息提取，获得每个分区的关键信息；对每个分区的关键信息进行编码，得到多个简历编码信息，以及对岗位信息包括的多个需求信息进行编码，得到多个岗位编码信息；将所述多个分区与所述多个需求信息进行匹配，对于匹配的分区和需求信息，计算简历编码信息与岗位编码信息的相关性；依据所述相关性，确定所述简历与所述岗位信息的第一匹配结果。本公开可以提高简历管理效率。

Description

简历匹配方法、装置、电子设备、存储介质和程序产品

技术领域

本公开涉及数据处理技术领域，尤其涉及简历管理技术。

背景技术

目前一些大型企业每天收到的简历数量是非常巨大的，例如：一些企业每天能收到成千上万份简历。但目前简历管理主要还是传统人员管理方式，即通过人员筛选简历，以确定收到的简历是否与企业的岗位信息匹配。

发明内容

本公开提供了一种简历匹配方法、装置、电子设备、存储介质和程序产品。

根据本公开的一方面，提供了一种简历匹配方法，包括：

将简历进行划分，得到多个分区；

对每个分区进行关键信息提取，获得每个分区的关键信息；

对每个分区的关键信息进行编码，得到多个简历编码信息，以及对岗位信息包括的多个需求信息进行编码，得到多个岗位编码信息；

将所述多个分区与所述多个需求信息进行匹配，对于匹配的分区和需求信息，计算简历编码信息与岗位编码信息的相关性；

依据所述相关性，确定所述简历与所述岗位信息的第一匹配结果。

根据本公开的另一方面，提供了一种简历匹配装置，包括：

划分模块，用于将简历进行划分，得到多个分区；

提取模块，用于对每个分区进行关键信息提取，获得每个分区的关键信息；

编码模块，用于对每个分区的关键信息进行编码，得到多个简历编码信息，以及对岗位信息包括的多个需求信息进行编码，得到多个岗位编码信息；

计算模块，用于将所述多个分区与所述多个需求信息进行匹配，对于匹配的分区和需求信息，计算简历编码信息与岗位编码信息的相关性；

确定模块，用于依据所述相关性，确定所述简历与所述岗位信息的第一匹配结果。

根据本公开的另一方面，提供了电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本公开提供的简历匹配方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本公开提供的简历匹配方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现本公开提供的简历匹配方法。

根据本公开的技术方案，由于将简历的多个分区与岗位信息的多个需求信息进行匹配，对于匹配的分区和需求信息，计算简历编码信息与岗位编码信息的相关性，并依据该相关性，确定简历与岗位信息的第一匹配结果，从而提高简历管理效率。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是本公开提供的一种简历匹配方法的流程图；

图2是本公开提供的另一种简历匹配方法的流程图；

图3是本公开提供的一种简历的分区示意图；

图4是本公开提供的一种简历的关键信息提取示意图；

图5是本公开提供的一种简历匹配系统的示意图；

图6是本公开提供的另一种简历匹配装置的结构图；

图7是本公开提供的另一种简历匹配装置的结构图；

图8是本公开提供的另一种简历匹配装置的结构图；

图9是本公开提供的另一种简历匹配装置的结构图；

图10是本公开提供的另一种简历匹配装置的结构图；

图11是本公开提供的另一种简历匹配装置的结构图；

图12是用来实现本公开实施例的简历匹配方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

请参见图1，图1是本公开提供的一种简历匹配方法的流程图，如图1所示，包括以下步骤：

步骤S101、将简历进行划分，得到多个分区。

上述简历可以是接收到的任一简历，上述将简历进行划分可以是，依据简历包括的文本信息对简历进行划分，得到多个分区，例如：得到基本信息区、教育背景区、工作经历区、项目经历区、技巧能力区等分区。

步骤S102、对每个分区进行关键信息提取，获得每个分区的关键信息。

上述对每个分区进行关键信息提取可以是，分别提取每个分区的关键信息，例如：对于基础信息区可以提取姓名、性别、年龄、邮箱、手机号等关键信息，而对于教育背景区可以提取时间、学历、专业等关键信息，而对于工作经历区可以提取工作时间、工作公司、所在职位等关键信息，而对于项目经历区可以提取项目时间、项目名称、角色等关键信息，而对于技巧能力区可以提取计算机、外语等关键信息。

步骤S103、对每个分区的关键信息进行编码，得到多个简历编码信息，以及对岗位信息包括的多个需求信息进行编码，得到多个岗位编码信息。

上述岗位信息可以是企业对于每个岗位的相关信息，例如：该岗位信息包括对学历的需求信息、对工作经历的需求信息、对工作能力的需求信息、对技能的需求信息等。

上述对每个分区的关键信息进行编码可以是对每个分区的关键信息的每个字或者词进行编码，上述对岗位信息包括的多个需求信息进行编码可以是，对每个需求信息的每个字或者词进行编码。

步骤S104、将所述多个分区与所述多个需求信息进行匹配，对于匹配的分区和需求信息，计算简历编码信息与岗位编码信息的相关性。

上述将所述多个分区与所述多个需求信息进行匹配可以是，为简历的每个分区查找与其匹配的需求信息，例如：对学历的需求信息匹配教育背景区，对工作经历的需求信息匹配工作经历区等。

需要说明的是，上述分区和需求信息的匹配并不限定为一一匹配的，例如：对工作能力的需求信息可以匹配项目经历区、技巧能力区和工作经历区中的至少一项。

上述计算简历编码信息与岗位编码信息的相关性可以是计算简历编码信息与岗位编码信息的词相关性，例如：计算简历编码信息是否存在与岗位编码信息中相关的词，或者计算简历编码信息中每个词与岗位编码信息中每个词之间的相关性。

步骤S105、依据所述相关性，确定所述简历与所述岗位信息的第一匹配结果。

上述依据所述相关性，确定所述简历与所述岗位信息的第一匹配结果可以是，依据上述相关性判断上述简历是否满足上述岗位信息的需求，例如：岗位信息包括要求本科学历、要求3年工作经历、要求熟悉风控，而上述简历的教育背景、工作经历和项目信息满足这些要求，则上述第一匹配结果表示上述简历满足该岗位信息，若上述简历的教育背景、工作经历和项目信息中至少一项不满足这些要求，则上述第一匹配结果表示上述简历不满足该岗位信息。

请参见图2，图2是本公开提供的另一种简历匹配方法的流程图，如图2所示，包括以下步骤：

步骤S201、将简历进行划分，得到多个分区。

作为一种可选的实施方式，所述将简历进行划分，得到多个分区，包括：

识别简历的文本区域；

检测所述简历中的区域线，并依据所述区域线将所述文本区域划分为多个文字区域；

识别每个文字区域的字体特征，依据每个文字区域的字体特征，将所述多个文字区域划分为多个分区。

上述识别简历的文本区域可以是，对简历进行文本区域与非文本区域识别，例如：先识别简历边界，再应用使用卷积神经网络，对图像进行非文本区域和非文本区域的分类，以及还可以对卷积神经网划分的文本区域和非文本区域进行滤波修正。其中，识别简历边界可以是通过Sobel算子、Prewitt算子、Laplacian算子、高斯-拉普拉斯算子等应用的算子识别简历边界。而上述应用使用卷积神经网络，对图像进行非文本区域和文本区域的分类可以是，利用卷积神经网络能够将简历图像中的像素点进行分类，如果是非文本区域，输出1，如果是文本区域，输出值为0。例如：利用包含有9个卷积层和一个全连接层的积神经网络进行分类，且该卷积神经网还可以用于识别文字区域内的文字检测。而上述滤波修正可以是通过像素点相连的单位矩形来判断是否为文字区域，如像素点四周的点都是文字，此像素点更改为文字像素点。

另外，本公开还可以进行件照检测，例如：利用卷积神经网络提取图像特征，然后进行图像检测。

上述检测所述简历中的区域线可以是检测简历中的直线，以检测出简历中的区域线，这样得到区域线后，可以将文本区域划分为多个文字区域。

上述识别每个文字区域的字体特征，依据每个文字区域的字体特征，将所述多个文字区域划分为多个分区可以是，依据文字区域的字体特征识别标题、子标题和正文，在实际应用中简历的每个区域都存在相应的标题，且标题的字体与正文的字体是存在区别的，因此，通过字体特征可以识别标题、子标题和正文，如果某一文字区域包括多个子标题，因此，将该文字区域划分为多个分区。

例如：先将简历中的文字的大小和字体进行特征抽取，并完成字体特征的特征编码，以区分出区域中的标题和正文。在文字区域划分为标题和正文内容后，利用识别文字内容和文字坐标，并对文字内容和文字坐标进行特征编码，再进行文本分类，其中，文本分类可以包括大标题分类和大标题内的子标题(如项目一、项目二、项目三等)，从而实现将所述多个文字区域划分为多个分区。其中，上述对文字内容和文字坐标进行特征编码可以是利用预先训练的来自变换器的双向编码器表征量(Bidirectional EncoderRepresentations from Transformers，BERT)模型对光学字符识别(Optical CharacterRecognition，OCR)的识别内容和文字的坐标进行嵌入(embedding)编码。需要说明的是，由于进行文本分类，这样对于简历内容不整齐，内容篇幅长，段落分界不清的简历可以提高分区的准确性。

该实施方式中，通过上述方式可以提高多个分区划分的准确性，例如：可以实现划分如图3所示的多个分区。

需要说明的是，本公开中并不限定通过上述方式进行划分，例如：对于一些简历可以直接识别文字内容，并根据文本内容进行分区，例如：基于简历中识别的教育背景、工作经历、项目等关键词进行划分，得到多个分区。

步骤S202、对每个分区进行关键信息提取，获得每个分区的关键信息。

作为一种可选的实施方式，所述对每个分区进行关键信息提取，获得每个分区的关键信息，包括：

将第一分区包括的文字转换为字向量，得到所述第一分区的字向量序列；

识别字向量序列包括的词向量，得到所述第一分区的词向量；

对所述第一分区的词向量进行标注，并基于标注结果识别所述第一分区的关键信息；

其中，所述第一分区为所述多个分区的分区。

上述将第一分区包括的文字转换为字向量可以是，通过预先训练的神经网络模型将第一分区包括的文字转换为字向量，例如：将第一分区的数据处理成字序列，并输入到大规模语料库预先训练的双向长短期记忆(bidirectional long short-term memory，BLSTM)模型，通过BLSTM模型的Embedding层将字映射成字向量。

上述识别字向量序列包括的词向量，得到所述第一分区的词向量可以是，通过基于注意力机制的BLSTM模型对字序列进行建模，对前向长短期记忆(bidirectional longshort-term memory，LSTM)的输出结果和后向LSTM的输出结果进行分配权重，进而获得包含字序列信息的词向量，且该词向量包括权重信息。

上述对所述第一分区的词向量进行标注可以是，将第一分区的词向量输入至条件随机场(conditional random fields，CRF)模型中，得到相应的序列标注，从而根据词向量的序列标注，提取关键信息。

需要说明的是，上述字向量和词向量的生成并不限定通过BLSTM模型生成，例如：还可以是基于注意力机制的语言模型生成。另外，本公开中的神经网络模型在训练时可以采用随机梯度下降算法(Stochastic Gradient Descent，SGD)更新神经网络模型中的权重参数，使得神经网络模型效果达到更优。

该实施方式中，由于基于标注结果识别所述第一分区的关键信息，这样可以提高关键信息提取的准确性。例如：如图4所示，对于基础信息区可以提取姓名、性别、年龄、邮箱、手机号等关键信息，而对于教育背景区可以提取时间、学历、专业等关键信息，而对于工作经历区可以提取工作时间、工作公司、所在职位等关键信息，而对于项目经历区可以提取项目时间、项目名称、角色等关键信息，而对于技巧能力区可以提取计算机、外语等关键信息。

需要说明的是，本公开中并不限定通过上述标注的方式提取分区的关键信息，还可以通过关键字的匹配获得每个分区对应的key值，然后利用自然语言处理(NaturalLanguage Processing，NLP)技术来判断key值对应的values值，这些values值即为关键信息。例如：利用关键字相似度匹配的方式确定各分区的key值，再利用key值采用OCR识别文字坐标，在key值右侧和下方检索对应的文字块，之后，利用语言模型模型(例如：Roberta模型)判断哪一个文字块为key值对应的value值。

还需要说明的是，上述第一分区可以是如图4所示的复杂信息集合对应的分区，如教育背景区、工作经历区、项目经历区或者技巧能力区，或者可以是基本信息区。另外，针对不同的分区可以采用不同的关键信息提取方式，例如：教育背景区、工作经历区、项目经历区、技巧能力区采用上述标注的方式提取，而基本信息区可以采用上述key值匹配的方式提取。

另外，在提取各分区的关键信息后，还可以在交互界面中展示各分区的关键信息，供系统用户进行查看。

步骤S203、对每个分区的关键信息进行编码，得到多个简历编码信息，以及对岗位信息包括的多个需求信息进行编码，得到多个岗位编码信息。

上述对每个分区的关键信息进行编码可以是，将每个分区的关键信息进行Embedding操作，之后使用GRU模型对该操作后的文本信息进行编码，得到多个简历编码信息。上述对岗位信息包括的多个需求信息进行编码也可以采用上述编码方式。

对于月薪、学历、工作时间等岗位需求信息可以进行离散化处理。例如：月薪被划分为多个离散区间，分别是2000元以下、2000-4000元、4000-6000元、6000-8000元、8000-10000元、10000-15000元、15000-25000元及25000元以上；学历分为大专以下、大专、本科、硕士及博士等5个区间；工作时间分为无工作经验、1-3年、3-5年、5-10年及10年以上等5个区间。这样对于这些岗位需求信息可以进行One-hot编码。而对于文本形式的详细描述如岗位职责，利用来自变换器的双向编码器表征量(Bidirectional Encoder Representationsfrom Transformers，BERT)模型进行文本内容的Embedding，转化为特征向量。

另外，对于简历中各分区的关键信息可以进行One-hot编码，例如：对于基本信息区的关键信息可以进行One-hot编码。对于文本形式的详细描述如项目经历区，利用BERT模型进行文本内容的Embedding，转化为特征向量。

需要说明的是，本公开中并不限定关键信息和需求信息的编码方式。

步骤S204、将所述多个分区与所述多个需求信息进行匹配，对于匹配的分区和需求信息，计算简历编码信息与岗位编码信息的相关性。

步骤S205、依据所述相关性，确定所述简历与所述岗位信息的第一匹配结果。

作为一种可选的实施方式，所述将所述多个分区与所述多个需求信息进行匹配，对于匹配的分区和需求信息，计算简历编码信息与岗位编码信息的相关性，包括：

在所述多个需求信息中查找每个分区匹配的需求信息，得到至少一个匹配对，每个匹配对包括匹配的分区和需求信息；

计算目标匹配对的简历编码信息中每个词相对于岗位编码信息的相关性信息，其中，目标词相对于岗位编码信息的相关性信息包括所述目标词相对于所述目标匹配对的岗位编码信息每个词的词相关性，所述目标词为所述目标匹配对的简历信息中任一词，所述目标匹配对为所述至少一个匹配对中任一匹配对。

上述在所述多个需求信息中查找每个分区匹配的需求信息，得到至少一个匹配对可以是，为简历的每个分区查找与其匹配的需求信息，例如：对学历的需求信息匹配教育背景区，对工作经历的需求信息匹配工作经历区等。

上述匹配还可以是建立key值的匹配映射，比如岗位需求信息的学历、工龄等key值，可以分别映射为简历中的最高学历、工作时间等key值，从而形成相应的匹配对。

上述计算目标匹配对的简历编码信息中每个词相对于岗位编码信息的相关性信息可以是，计算简历编码信息中每个词相对于岗位编码信息中每个词的相关性，例如：某简历编码信息对应100个词，而对应的岗位需求信息也对应100词，则对于简历编码信息对应的某个词均计算得到100个相关性，最终得到该简历编码信息的10000个相关性。

该实施方式中，由于目标词为所述目标匹配对的简历信息中每一词，所述目标匹配对为所述至少一个匹配对中任一匹配对，这样可以得到每个匹配对中每个词的相关性，这样基于这些相关性确定所述简历与所述岗位信息的第一匹配结果，从而可以提高第一匹配结果的准确性。

可选的，所述依据所述相关性，确定所述简历与所述岗位信息的第一匹配结果，包括：

为每一匹配对的简历编码信息中的每个词配置对应的第一权重，以及为所述每一匹配对的岗位编码信息中的每个词配置对应的第二权重；

生成多个词向量，并基于所述多个词向量确定所述简历与所述岗位信息的第一匹配结果，其中，所述词向量为词相关性、对应的第一权重和对应的第二权重的内积。

其中，上述第一权重和第二权重可以是通过机器阅读理解(Attentive Read)模型给各词配置相应的权重。或者可以是根据每个词在相应的关键信息中的重要程度配置相应的权重，或者根据每个词在相应的岗位需求信息中的重复程序配置相应的权重，对此不作限定。

上述生成多个词向量可以是，针对每个词相关性，将该词相关性、对应的第一权重和对应的第二权重进行内积操作，得到的内积作为词向量。

上述基于所述多个词向量确定所述简历与所述岗位信息的第一匹配结果可以是，将多个词向量输入至神经网络模型的预测层进行预测，得到上述第一匹配结果，例如：输入至BLSTM模型、LSTM模型、BERT模型等预先训练的神经网络模型的预测层进行预测，得到第一匹配结果。需要说明的是，本公开中并不限定通过神经网络模型来预测上述第一匹配结果，例如：还可以计算上述多个词向量的平均或者和值等，再基于这些值确定上述第一匹配结果。

该实施方式中，由于基于所述多个词向量确定所述简历与所述岗位信息的第一匹配结果，这样可以提高第一匹配结果的准确性。例如：企业在岗位信息中职位描述这一岗位需求信息中明确地描述该职位的工作内容，比如岗位要求是熟悉风控，这样当简历中的工作经历区的关键信息中描述了求职者过去工作的公司名称、工作时间、职位以及工作内容，如果该简历中刚好有风控相关的项目经历，确定简历与岗位信息是匹配的。

需要说明的是，本公开中并不限定通过上述基于所述多个词向量确定所述简历与所述岗位信息的第一匹配结果，例如：在一些实施方式中，可以不配置第一权重和第二权重，或者只配置第一权重或者第二权重，再基于上述词相关性确定上述第一匹配结果。

作为一种可选的实施方式，所述第一匹配结果为所述简历满足所述岗位信息的匹配结果；如图2所示，所述方法还包括：

步骤S206、识别所述岗位信息满足所述简历的第二匹配结果；

步骤S207、依据所述第一匹配结果、第一预设权重、所述第二匹配结果和第二预设权重，对所述简历执行简历推荐操作；

其中，所述第一预设权重是为所述第一匹配结果配置的权重，所述第二预设权重是为所述第二匹配结果配置的权重。

需要说明的是，步骤S206与上述步骤S201至S205的时序不作限定。

上述第一匹配结果可以表示上述简历满足上述岗位信息的匹配程度，具体可以是一个分值，上述第二匹配结果可以表示上述岗位信息满足上述简历的匹配程度，具体可以是一个分值。

上述识别所述岗位信息满足所述简历的第二匹配结果可以是，根据岗位信息中的提供的待遇、工作环境等内容与简历中的期望信息的匹配程度确定的，例如：岗位信息中提供的待遇和工作环境均满足简历中的期望信息，则上述第二匹配结果表示的匹配程序越高，反之越低。

上述依据所述第一匹配结果、第一预设权重、所述第二匹配结果和第二预设权重，对所述简历执行简历推荐操作可以是，依据所述第一匹配结果、第一预设权重、所述第二匹配结果和第二预设权重计算推荐分值，再依据该推荐分值对所述简历执行简历推荐操作。例如：推荐分值等于w1*score1+w2*score2，其中，w1和w2分别表示上述第一权重和第二权重，上述score1和score2分别表示上述第一匹配结果和第二匹配结果。

上述依据该推荐分值对所述简历执行简历推荐操作可以是，上述推荐分值高于或者等于预设阈值时，将上述简历推荐给上述岗位信息对应的企业，若推荐分值低于预设阈值时，则放弃上述简历。

需要说明的是，本公开中并不限定通过上述依据该推荐分值对所述简历执行简历推荐操作，例如：在一些场景中当上述第一匹配结果满足预设条件时，向将上述简历推荐给上述岗位信息对应的企业，如该预设条件可以是简历与上述岗位信息的匹配程度高于预设阈值。

该实施方式中，由于依据所述第一匹配结果、第一预设权重、所述第二匹配结果和第二预设权重，对所述简历执行简历推荐操作，这样可以实现简历与岗位信息的互惠推荐，从而提高简历推荐效果，进而提高企业招聘效率及成功率。

另外，上述实施方式中，若上述第一匹配结果表示上述简历匹配上述岗位信息，上述第二匹配结果表示上述岗位信息匹配上述简历，则可以保存该简历并推荐，如果若上述第一匹配结果表示上述简历不匹配上述岗位信息，或者上述第二匹配结果表示上述岗位信息不匹配上述简历，则可以放弃该简历，并针对另一简历执行上述处理，从而实现简历的批量处理。

作为一种可选的实施方式，本公开中对于简历的文字识别采用OCR技术进行识别，该识别过程包括文字检测和文字识别。

例如：先对简历进行特征提取，如采用主干网络为残差网络(ResNet)+特征图金字塔网络(Feature Pyramid Networks，FPN)的应用进行提取，利用区域生成(RegionProposal Network，RPN)网络生成候选检测框，利用Mask分支网络生成文本实例分割图和字符分割图，再结合实例分割结果和候选框生成最后的文字检测框，最后将文字检测框内的图片区域输入到识别模型进行文字识别，其中，识别模型可以是卷积神经网络(Convolutional Neural Networks,CNN+序列到序列(Seq2Seq)+注意力(Attention)模型。需要说明的是，本公开中对文字识别模型不作限定，对OCR技术识别文字的方式也不作限定，上述仅是一个举例说明。

一种实施方式，如图5简历匹配系统可以包括：OCR、信息提取、智能推荐、交互界面、内容分区、文档上传和结果存储这些模块；其中，OCR主要用于文字检测和文字识别；信息提取主要用于基本信息提取，例如：提取基本信息区的关键信息，信息提取主要还用于复杂信息提取，例如：提取教育背景区、工作经历区、项目经历区、技巧能力区等分区的关键信息；智能推荐主要用于特征向量化，例如：关键信息和需求信息的编码，以及词向量生成，智能推荐还用于简历与岗位匹配结果计算，例如：计算上述第一匹配结果和第二匹配结果；而上述交互界面主要用于展示简历的相关信息，如各分区的关键信息，上述内容分区主要用于对简历进行分区，上述文档上传主要用于上传简历，这样可以实现大量简历的匹配，上述结果存储主要用于存储各简历与岗位信息的匹配结果，或者存储待推荐的简历。

请参见图6，图6是本公开提供的一种简历匹配装置，如图6所示，简历匹配装置600包括：

划分模块601，用于将简历进行划分，得到多个分区；

提取模块602，用于对每个分区进行关键信息提取，获得每个分区的关键信息；

编码模块603，用于对每个分区的关键信息进行编码，得到多个简历编码信息，以及对岗位信息包括的多个需求信息进行编码，得到多个岗位编码信息；

计算模块604，用于将所述多个分区与所述多个需求信息进行匹配，对于匹配的分区和需求信息，计算简历编码信息与岗位编码信息的相关性；

确定模块605，用于依据所述相关性，确定所述简历与所述岗位信息的第一匹配结果。

可选的，如图7所示，所述计算模块604，包括：

查找单元6041，用于在所述多个需求信息中查找每个分区匹配的需求信息，得到至少一个匹配对，每个匹配对包括匹配的分区和需求信息；

计算单元6042，用于计算目标匹配对的简历编码信息中每个词相对于岗位编码信息的相关性信息，其中，目标词相对于岗位编码信息的相关性信息包括所述目标词相对于所述目标匹配对的岗位编码信息每个词的词相关性，所述目标词为所述目标匹配对的简历信息中任一词，所述目标匹配对为所述至少一个匹配对中任一匹配对。

可选的，如图8所示，所述确定模块605，包括：

配置单元6051，用于为每一匹配对的简历编码信息中的每个词配置对应的第一权重，以及为所述每一匹配对的岗位编码信息中的每个词配置对应的第二权重；

确定单元6052，用于生成多个词向量，并基于所述多个词向量确定所述简历与所述岗位信息的第一匹配结果，其中，所述词向量为词相关性、对应的第一权重和对应的第二权重的内积。

可选的，如图9所示，所述划分模块601，包括：

第一识别单元6011，用于识别简历的文本区域；

检测单元6012，用于检测所述简历中的区域线，并依据所述区域线将所述文本区域划分为多个文字区域；

划分单元6013，用于识别每个文字区域的字体特征，依据每个文字区域的字体特征，将所述多个文字区域划分为多个分区。

可选的，如图10所示，所述提取模块602，包括：

转换单元6021，用于将第一分区包括的文字转换为字向量，得到所述第一分区的字向量序列；

第二识别单元6022，用于识别字向量序列包括的词向量，得到所述第一分区的词向量；

第三识别单元6023，用于对所述第一分区的词向量进行标注，并基于标注结果识别所述第一分区的关键信息；

其中，所述第一分区为所述多个分区的分区。

可选的，所述第一匹配结果为所述简历满足所述岗位信息的匹配结果；如图11所示，所述装置还包括：

识别模块606，用于识别所述岗位信息满足所述简历的第二匹配结果；

执行模块607，用于依据所述第一匹配结果、第一预设权重、所述第二匹配结果和第二预设权重，对所述简历执行简历推荐操作；

本实施例提供的装置能够实现图1所示的方法实施例中实现的各个过程，且可以达到相同有益效果，为避免重复，这里不再赘述。

根据本公开的实施例，本公开还提供了一种电子设备、一种存储有计算机指令的非瞬时计算机可读存储介质和一种计算机程序产品。

图12示出了可以用来实施本公开的实施例的示例电子设备1200的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图12所示，设备1200包括计算单元1201，其可以根据存储在只读存储器(ROM)1202中的计算机程序或者从存储单元1208加载到随机访问存储器(RAM)1203中的计算机程序，来执行各种适当的动作和处理。在RAM1203中，还可存储设备1200操作所需的各种程序和数据。计算单元1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(I/O)接口1205也连接至总线1204。

设备1200中的多个部件连接至I/O接口1205，包括：输入单元1206，例如键盘、鼠标等；输出单元1207，例如各种类型的显示器、扬声器等；存储单元1208，例如磁盘、光盘等；以及通信单元1209，例如网卡、调制解调器、无线通信收发机等。通信单元1209允许设备1200通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1201可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1201的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1201执行上文所描述的各个方法和处理，例如图像样本处理方法。例如，在一些实施例中，图像样本处理方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1208。

在一些实施例中，计算机程序的部分或者全部可以经由ROM 1202和/或通信单元1209而被载入和/或安装到设备1200上。当计算机程序加载到RAM1203并由计算单元1201执行时，可以执行上文描述的方法1208的一个或多个步骤。备选地，在其他实施例中，计算单元1201可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行图像样本处理方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读

储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

本公开提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现本公开提供的简历匹配方法。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种简历匹配方法，包括：

将简历进行划分，得到多个分区；

对每个分区进行关键信息提取，获得每个分区的关键信息；

2.根据权利要求1所述的方法，其中，所述将所述多个分区与所述多个需求信息进行匹配，对于匹配的分区和需求信息，计算简历编码信息与岗位编码信息的相关性，包括：

3.根据权利要求2所述的方法，其中，所述依据所述相关性，确定所述简历与所述岗位信息的第一匹配结果，包括：

4.根据权利要求1所述的方法，其中，所述将简历进行划分，得到多个分区，包括：

识别简历的文本区域；

5.根据权利要求1所述的方法，其中，所述对每个分区进行关键信息提取，获得每个分区的关键信息，包括：

其中，所述第一分区为所述多个分区的分区。

6.根据权利要求1所述的方法，其中，所述第一匹配结果为所述简历满足所述岗位信息的匹配结果；

所述方法还包括：

识别所述岗位信息满足所述简历的第二匹配结果；

依据所述第一匹配结果、第一预设权重、所述第二匹配结果和第二预设权重，对所述简历执行简历推荐操作；

7.一种简历匹配装置，包括：

划分模块，用于将简历进行划分，得到多个分区；

8.根据权利要求7所述的装置，其中，所述计算模块，包括：

查找单元，用于在所述多个需求信息中查找每个分区匹配的需求信息，得到至少一个匹配对，每个匹配对包括匹配的分区和需求信息；

计算单元，用于计算目标匹配对的简历编码信息中每个词相对于岗位编码信息的相关性信息，其中，目标词相对于岗位编码信息的相关性信息包括所述目标词相对于所述目标匹配对的岗位编码信息每个词的词相关性，所述目标词为所述目标匹配对的简历信息中任一词，所述目标匹配对为所述至少一个匹配对中任一匹配对。

9.根据权利要求8所述的装置，其中，所述确定模块，包括：

配置单元，用于为每一匹配对的简历编码信息中的每个词配置对应的第一权重，以及为所述每一匹配对的岗位编码信息中的每个词配置对应的第二权重；

确定单元，用于生成多个词向量，并基于所述多个词向量确定所述简历与所述岗位信息的第一匹配结果，其中，所述词向量为词相关性、对应的第一权重和对应的第二权重的内积。

10.根据权利要求7所述的装置，其中，所述划分模块，包括：

第一识别单元，用于识别简历的文本区域；

检测单元，用于检测所述简历中的区域线，并依据所述区域线将所述文本区域划分为多个文字区域；

划分单元，用于识别每个文字区域的字体特征，依据每个文字区域的字体特征，将所述多个文字区域划分为多个分区。

11.根据权利要求7所述的装置，其中，所述提取模块，包括：

转换单元，用于将第一分区包括的文字转换为字向量，得到所述第一分区的字向量序列；

第二识别单元，用于识别字向量序列包括的词向量，得到所述第一分区的词向量；

第三识别单元，用于对所述第一分区的词向量进行标注，并基于标注结果识别所述第一分区的关键信息；

其中，所述第一分区为所述多个分区的分区。

12.根据权利要求7所述的装置，其中，所述第一匹配结果为所述简历满足所述岗位信息的匹配结果；

所述装置还包括：

识别模块，用于识别所述岗位信息满足所述简历的第二匹配结果；

执行模块，用于依据所述第一匹配结果、第一预设权重、所述第二匹配结果和第二预设权重，对所述简历执行简历推荐操作；

13.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的方法。

15.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现权利要求1-6中任一项所述的方法。