CN113627135A

CN113627135A - 一种招聘岗位描述文本的生成方法、装置、设备及介质

Info

Publication number: CN113627135A
Application number: CN202010381686.9A
Authority: CN
Inventors: 秦川; 姚开春; 祝恒书; 马超; 申大忠; 徐童
Original assignee: Baidu Online Network Technology Beijing Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd
Priority date: 2020-05-08
Filing date: 2020-05-08
Publication date: 2021-11-09
Anticipated expiration: 2040-05-08
Also published as: EP3859588A2; EP3859588A3; JP2021177375A; KR102540185B1; US20210216726A1; CN113627135B; KR20210047284A

Abstract

本申请公开了一种招聘岗位描述文本的生成方法、装置、设备及介质，涉及人工智能技术领域。具体实现方案为：获取目标岗位的原始相关文本；基于所述原始相关文本和预先训练出的深度神经网络模型，生成所述目标岗位对应的目标招聘岗位描述文本。实现了通过深度神经网络自动生成目标招聘岗位描述文本，使人员与岗位精准匹配，减少招聘过程的人力和时间，提高招聘效率。

Description

一种招聘岗位描述文本的生成方法、装置、设备及介质

技术领域

本申请实施例涉及计算机技术，尤其涉及人工智能技术领域，特别涉及一种招聘岗位描述文本的生成方法、装置、设备及介质。

背景技术

招聘岗位描述显示了职位的职责和工作技能要求，有效的职位描述将帮助雇主找到适合该职位的人才，并使候选人清楚地了解在特定职位上的职责和资格。

现有的对招聘岗位与职员的匹配，需要基于人力资源专家对招聘市场分析，并人为撰写招聘岗位描述，人为主观性较强，需要大量的人力成本，并且由于人力资源员工对不同岗位的专业技能具有领域间隙，因此经常存在误差，招聘岗位与招聘人员的无法精准匹配，招聘效率较低。

发明内容

本申请实施例提供了一种招聘岗位描述文本的生成方法、装置、设备及介质，以实现对招聘岗位的精准描述，提高岗位描述生成效率。

根据第一方面，提供了一种招聘岗位描述文本的生成方法，包括：

获取目标岗位的原始相关文本；

基于所述原始相关文本和预先训练出的深度神经网络模型，生成所述目标岗位对应的目标招聘岗位描述文本。

根据第二方面，提供了一种招聘岗位描述文本的生成装置，包括：

原始文本获取模块，用于获取目标岗位的原始相关文本；

描述文本生成模块，用于基于所述原始相关文本和预先训练出的深度神经网络模型，生成所述目标岗位对应的目标招聘岗位描述文本。

根据第三方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请任意实施例所述的招聘岗位描述文本的生成方法。

根据第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本申请任意实施例所述的招聘岗位描述文本的生成方法。

根据本申请的技术解决了现有技术中，人工进行招聘岗位文本描述的问题，通过深度神经网络，能够自动快速生成目标招聘岗位描述文本，并且生成的目标招聘岗位描述文本能够与目标岗位的需求相匹配，提高了招聘岗位描述文本的生成效率和精准度，进而可以减少招聘过程的人力和时间，提高招聘效率。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请实施例的一种招聘岗位描述文本的生成方法的流程示意图；

图2是根据本申请实施例的一种深度神经网络模型的结构示意图；

图3是根据本申请实施例的一种深度神经网络模型的结构示意图；

图4是根据本申请实施例的一种深度神经网络模型的结构示意图；

图5是根据本申请实施例的一种深度神经网络模型的训练方法的流程示意图；

图6是根据本申请实施例的深度神经网络模型的结构示意图；

图7是根据本申请实施例的深度神经网络模型的结构示意图；

图8是根据本申请实施例的一种招聘岗位描述文本的生成装置的结构示意图；

图9是用来实现本申请实施例的招聘岗位描述文本的生成方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1是根据本申请实施例提供的一种招聘岗位描述文本的生成方法的流程示意图，本实施例用于自动生成招聘岗位描述文本的情况，该方法可以由一种招聘岗位描述文本的生成装置来执行，该装置可以采用软件和/ 或硬件的方式实现，并可集成于具有计算能力的电子设备中。如图1所示，本实施例提供的一种招聘岗位描述文本的生成方法可以包括：

S110、获取目标岗位的原始相关文本。

其中，获取由工作人员预先收集的目标岗位的原始相关文本。

本实施例中，可选的，原始相关文本包括：已确定符合岗位要求人员的简历文本、包含岗位职责数据的文本、以及包含岗位涉及项目数据的文本中的至少一个。

具体的，已确定符合岗位要求人员的简历文本可以包括入职人员的简历文本和已通过审核即将入职的人员的简历文本。工作人员预先收集入职人员的简历文本和已通过审核即将入职的人员的简历文本，并将不同岗位的职责数据收集为包含岗位职责数据的文本，将不同岗位所涉及的项目或工程数据收集为包含岗位涉及项目数据的文本。例如，入职人员简历中写明的内容可以是某入职人员的专业研究方向为智能机器人，包含岗位涉及项目数据的文本中写明的内容可以是某目标岗位项目为智能机器人避障项目。通过获取原始相关文本，可以提取与目标岗位的职责和技能需求相关的有效信息，有利于生成的目标招聘岗位描述文本与目标岗位的职责和技能需求精准匹配。

S120、基于原始相关文本和预先训练出的深度神经网络模型，生成目标岗位对应的目标招聘岗位描述文本。

其中，深度神经网络模型为预先训练得出，用于生成目标招聘岗位描述文本的模型。目标招聘岗位描述文本包括目标岗位的职责和工作技能等的描述信息，用于向求职者展示。将原始相关文本输入到预先训练出的深度神经网络模型中，由深度神经网络模型从原始相关文本中提取目标岗位的相关数据。例如，从入职人员的简历文本中可以提取入职人员的当前职位、入职人员的研究方向和入职人员的当前项目等数据，从已通过审核即将入职的人员的简历文本中可以提取即将入职的人员的岗位意愿和即将入职的人员的研究方向等数据，从包含岗位职责数据的文本中可以提取该岗位的主要职责、工作任务和专业要求等数据，从包含岗位涉及项目数据的文本中可以提取该岗位的历史项目和当前项目等数据。

深度神经网络模型在获取到原始相关文本后，根据提取的相关数据，生成目标岗位对应的目标招聘岗位描述文本。

上述申请中的一个实施例具有如下优点或有益效果：通过深度神经网络，能够自动快速生成目标招聘岗位描述文本，并且生成的目标招聘岗位描述文本能够与目标岗位的需求相匹配，提高了招聘岗位描述文本的生成效率和精准度，进而可以减少招聘过程的人力和时间，提高招聘效率。

图2是根据本申请实施例提供的一种深度神经网络模型的结构示意图，可执行本申请的一种招聘岗位描述文本的生成方法。如图2所示，本实施例提供的一种深度神经网络模型200可以包括：

文本主题预测子模型210，用于根据原始相关文本，预测出目标技能主题分布向量；

描述文本生成子模型220，用于根据目标技能主题分布向量，生成目标岗位的目标招聘岗位描述文本。

其中，目标技能主题分布向量是目标岗位的技能主题分布向量，技能主题是指岗位所需工作技能的类别名称，例如，技能主题可以有编码类技能主题、机器学习类技能主题和大数据类技能主题等。

文本主题预测子模型210获取到目标岗位的原始相关文本，从原始相关文本中提取出目标岗位的技能主题数据，例如，可以提取出已入职人员在目标岗位上的项目名称，根据项目名称可以得到该项目的技能主题。根据目标岗位的相关数据，预测出目标技能主题分布向量，从而确定目标岗位的技能主题。

在文本主题预测子模型210确定目标技能主题分布向量后，由文本主题预测子模型210将目标技能主题分布向量发送给描述文本生成子模型 220，描述文本生成子模型220根据目标技能主题分布向量，生成目标招聘岗位描述文本，以便于对目标岗位进行文本描述。例如，目标岗位为软件工程师，该岗位的目标技能主题分布向量为编码类技能主题，则最终生成的目标招聘岗位描述文本可以是“软件工程师：要求熟练使用JAVA和 C++，工作经验三年以上”。

上述申请中的一个实施例具有如下优点或有益效果：通过将深度神经网络模型划分为文本主题预测子模型和描述文本生成子模型，减少人工操作步骤，节约人力和时间，实现了对目标岗位的技能主题和描述文本的分步确定，根据技能主题得到描述文本，提高了目标招聘岗位描述文本的精确性和效率。

图3是根据本申请实施例提供的一种深度神经网络模型的结构示意图，以上述实施例为基础进行进一步优化。如图3所示，本实施例提供的深度神经网络模型300可以包括：

文本主题预测子模型310和描述文本生成子模型320。

本实施例中，可选的，文本主题预测子模型包括：词袋特征提取模块，用于提取原始相关文本的词袋特征向量；分布参数计算模块，用于根据词袋特征向量和非线性网络层，计算技能主题向量分布参数；第一主题分布确定模块，用于根据技能主题向量分布参数以及预设主题分布假设参数，获得目标技能主题分布向量。

其中，词袋特征提取模块301在获取到目标岗位的原始相关文本后，从原始相关文本中提取出词袋特征向量。例如，原始相关文本为“软件工程师需要编程基础”和“软件工程师需要认真踏实”，词袋特征向量可以表示为[111100]和[110011]。

词袋特征提取模块301将词袋特征向量发送给分布参数计算模块302，分布参数计算模块302根据词袋特征向量和预先设置的非线性网络层，计算得出技能主题向量分布参数。分布参数计算模块302将技能主题向量分布参数发送给第一主题分布确定模块303，第一主题分布确定模块303根据技能主题向量分布参数和预先设置的预设主题分布假设参数，计算得出目标技能主题分布向量。

通过将文本主题预测子模型310划分为三个子模块，实现了对目标技能主题分布向量的有序计算，提高计算精度，减少人工操作，避免了人工进行技能主题确定的过程，提高目标技能主题分布向量的计算效率。

本实施例中，可选的，词袋特征提取模块包括：词袋生成子模块，用于生成原始相关文本的词袋表征数据；第一全连接网络子模块，用于对词袋表征数据进行特征提取，获得词袋特征向量。

具体的，词袋特征提取模块301可以由词袋生成子模块3011和第一全连接网络子模块3012组成。第一全连接网络子模块3012可以包括一层或多层的全连接网络。深度神经网络模型在接收原始相关文本后，由词袋特征提取模块301中的词袋生成子模块3011获取。词袋生成子模块3011 提取原始相关文本中的词袋表征数据，例如，原始相关文本为“软件工程师需要编程基础”和“软件工程师需要认真踏实”，提取的词袋表征数据为“软件工程师、需要、编程、基础、认真、踏实”，可以用

表示词袋表征数据。词袋生成子模块3011将词袋表征数据发送给第一全连接网络子模块3012，可以由第一全连接网络子模块3012对词袋表征数据进行多次特征提取，生成词袋特征向量，可以由

表示第一全连接网络子模块 3012中的全连接网络。通过由词袋生成子模块3011和第一全连接网络子模块3012生成词袋特征向量，提高了词袋特征向量的计算精度，实现词袋特征提取的自动化，减少人工操作，进一步提高目标技能主题分布向量的计算效率。

本实施例中，可选的，分布参数计算模块包括：第一参数计算子模块，用于根据词袋特征向量和第一非线性网络层，计算第一技能主题向量分布子参数；第二参数计算子模块，用于根据词袋特征向量和第二非线性网络层，计算第二技能主题向量分布子参数。

具体的，分布参数计算模块302可以由第一参数计算子模块3021和第二参数计算子模块3022组成。第一参数计算子模块3021接收第一全连接网络子模块3012的词袋特征向量，根据预先设置的第一非线性网络层，计算得出第一技能主题向量分布子参数。可以由

表示第一非线性网络层，由μ_d表示第一技能主题向量分布子参数。第一技能主题向量分布子参数μ_d的计算公式如下所示：

第二参数计算子模块3022接收第一全连接网络子模块3012的词袋特征向量后，根据预先设置的第二非线性网络层，计算得出第二技能主题向量分布子参数。可以由

表示第二非线性网络层，由σ_d表示第二技能主题向量分布子参数。第二技能主题向量分布子参数σ_d的计算公式如下所示：

技能主题向量分布参数可以包括μ_d和σ_d，通过计算μ_d和σ_d，实现了对技能主题向量分布参数的精确计算，提高目标技能主题分布向量的计算效率。

本实施例中，可选的，第一主题分布确定模块包括：第三参数计算子模块，用于根据第一技能主题向量分布子参数和第一预设主题分布假设子参数，计算第三技能主题向量分布参数；第四参数计算子模块，用于根据第二技能主题向量分布子参数和第二预设主题分布假设子参数，计算第四技能主题向量分布参数；第一主题向量采样子模块，用于根据第三技能主题向量分布参数和第四技能主题向量分布参数，获得第一技能主题向量；第二全连接网络子模块，用于对第一技能主题向量进行特征提取，获得第一主题特征向量；第一主题分布特征计算子模块，用于根据第一主题特征向量和第一激活函数，获得目标技能主题分布向量。

具体的，第一主题分布确定模块303可以由第三参数计算子模块3031、第四参数计算子模块3032、第一主题向量采样子模块3033、第二全连接网络子模块3034和第一主题分布特征子模块3035组成。第三参数计算子模块3031接收第一参数计算子模块3021的第一技能主题向量分布子参数 μ_d，根据预先设置的第一预设主题分布假设子参数，计算得出第三技能主题向量分布参数。第一预设主题分布假设子参数可以由W_μ表示，第三技能主题向量分布参数可以由μ_s表示，μ_s＝W_μμ_d。第四参数计算子模块3032接收第二参数计算子模块3022的第二技能主题向量分布子参数σ_d，根据预先设置的第二预设主题分布假设子参数，计算得出第四技能主题向量分布参数，logσ_s＝W_σ(logσ_d)。第二预设主题分布假设子参数可以由W_σ表示，第四技能主题向量分布参数可以由σ_s表示。

第一主题向量采样子模块3033接收第三参数计算子模块3031的第三技能主题向量分布参数μ_s和第四参数计算子模块3032的第四技能主题向量分布参数σ_s，计算得出第一技能主题向量，可以由z^s表示第一技能主题向量。第二全连接网络子模块3034接收第一主题向量采样子模块3033的第一技能主题向量，对第一技能主题向量进行特征提取，得到第一主题特征向量。例如，对于对应的目标招聘描述，S＝{s_1,s_2,…,s_L}其中s_L为每一条招聘描述语句，可以采样得到主题向量为

第二全连接网络子模块3034可以包括一层或多层的全连接网络，可以由

表示第二全连接网络子模块3034中的全连接网络。

第一主题分布特征计算子模块3035接收第二全连接网络子模块 3034的第一主题特征向量，并根据预设的第一激活函数，得到目标技能主题分布向量。第一激活函数可以由

表示，目标技能主题分布向量可以由θ^s表示，其中，

通过对目标技能主题分布向量进行分步计算，提高了计算效率，保证目标技能主题分布向量的计算精度，实现文本主题预测的自动化。

上述申请中的一个实施例具有如下优点或有益效果：通过将文本主题预测子模型划分为词袋特征提取模块、分布参数计算模块和第一主题分布确定模块，实现目标技能主题分布向量的自动生成。解决了现有技术中，由人力资源员工手动提取岗位信息，减少人为的主观性，节约招聘岗位描述文本的生成时间和成本，避免由于人力资源员工对不同岗位的专业技能具有领域间隙，所造成的误差，便于招聘岗位与招聘人员的精准匹配，提高招聘效率。

图4是根据本申请实施例提供的一种深度神经网络模型的结构示意图，以上述实施例为基础进行进一步优化。如图4所示，本实施例提供的深度神经网络模型400可以包括：

文本主题预测子模型410和描述文本生成子模型420。

本实施例中，可选的，描述文本生成子模型包括：编码器模块，用于生成原始相关文本中当前句子的语义表征向量序列；注意力模块，用于根据目标技能主题分布向量，对语义表征向量序列进行加权变换；解码器模块，用于根据加权变换后的语义表征向量序列，预测当前句子的技能主题标签；并根据技能主题标签预测出目标招聘岗位描述文本的当前词。

具体的，描述文本生成子模型420可以由编码器模块401、注意力模块402和解码器模块403组成。编码器模块401根据原始相关文本，生成原始相关文本中当前句子的语义表征向量序列，语义表征向量序列可以由 H表示，可以使用一个双向循环神经网络，对于输入序列X＝ {x_1,x_2,…,x_M^d}，得到语义表征序列

其中，

表示输入序列中任一词的语义表征向量，M^d表示词数量。注意力模块402获取第一主题分布特征计算子模块3035的目标技能主题分布向量θ^s，根据目标技能主题分布向量θ^s对语义表征序列H进行加权变换。解码器模块 403接收加权变换后的语义表征向量序列，可以采用两个单向循环神经网络，建模当前句子的技能主题标签的预测，根据技能主题标签进一步得到目标招聘岗位描述文本的当前词的预测。技能主题标签可以由t_j表示，目标招聘岗位描述文本的当前词可以由s_j,k表示。通过将描述文本生成子模型 420进行模块划分，可以自动预测出目标招聘岗位的技能主题标签和描述文本的当前词，减少人工操作，提高招聘文案形成的效率。

本实施例中，可选的，编码器模块包括：词向量生成子模块，用于生成原始相关文本中当前句子所包含各个词的词向量；第一循环神经网络子模块，用于根据各词向量生成当前句子的语义表征向量序列。

具体的，编码器模块401可以由词向量生成子模块4011和第一循环神经网络子模块4012组成，词向量生成子模块4011根据原始相关文本，生成当前句子中所包含的各个词的词向量，可以用

表示。第一循环神经网络子模块4012接收词向量生成子模块4011的词向量

生成当前句子的语义表征向量序列H。实现了对语义表征向量序列的精确计算，节约人力和时间，提高了目标招聘岗位描述文本的生成效率。

本实施例中，可选的，注意力模块包括第一注意力子模块和第二注意力子模块；解码器模块包括主题预测子模块和文本生成子模块；其中：第一注意力子模块，用于根据目标技能主题分布向量以及主题预测子模块中的隐层特征状态向量，对语义表征向量序列进行加权变换，获得加权变化后的第一向量序列；第二注意力子模块，用于根据目标技能主题分布向量以及文本生成子模块中的隐层特征状态向量，对语义表征向量序列进行加权变换，获得加权变化后的第二向量序列；主题预测子模块，用于根据目标技能主题分布向量以及第一向量序列，预测出当前句子的技能主题标签；文本生成子模块，用于根据当前句子的技能主题标签以及第二向量序列，预测出目标招聘岗位描述文本中的当前词。

具体的，注意力模块402可以由第一注意力子模块4021和第二注意力子模块4022组成，解码器模块403可以由主题预测子模块4031和文本生成子模块4032组成。第一注意力子模块4021获取第一主题分布特征子模块3035的目标技能主题分布向量θ^s，并根据主题预测子模块4031中的隐层特征状态向量，对语义表征向量序列H进行加权变换，获得加权变化后的第一向量序列。其中，主题预测子模块4031中的隐层特征状态向量可以由

表示，第一向量序列可以由

表示。第二注意力子模块4022获取第一主题分布特征子模块3035的目标技能主题分布向量θ^s，并根据文本生成子模块4032中的隐层特征状态向量，对语义表征向量序列H进行加权变换，获得加权变化后的第二向量序列。其中，文本生成子模块4032 中的隐层特征状态向量可以由

表示，第二向量序列可以由

表示。

主题预测子模块4031根据目标技能主题分布向量θ^s和第一向量序列

预测出当前句子的技能主题标签t_j。文本生成子模块4032获取主题预测子模块4031输出的当前句子的技能主题标签t_j和第二向量序列

预测出目标招聘岗位描述文本中的当前词s_j,k。例如，可以使用如下公式进行技能主题标签和目标招聘岗位描述文本的当前词的预测：

其中，p(t_j|t_＜j,H,θ^s)表示技能主题标签的预测概率， p(y_j,k|y_＜j,y_j,＜k,H,θ^s,t_j)表示目标招聘岗位描述文本的当前词的预测概率，W_t、 W_c、b_t和b_c为预设参数。

第一向量序列

和第二向量序列

可以由如下公式计算：

其中，N是指目标招聘岗位描述文本的句子数量，

是指第j个句子中词的数量，

是指第l个句子中词的语义表征向量，

和

是计算注意力机制中的中间变量，由如下公式计算：

其中，

和

均为网络中间层向量。

和

的计算公式如下：

其中，

和

为预设参数。

与

分别与上述的

和

的计算方法类似，将

公式中的l 替换为P就是

的计算公式，将

中的l替换为p就是

的计算公式。 P和l是累加函数中的自变量，在[1,N]中取值。

对于主题标签t_j，采用如下公式计算：

其中，t_j-1表示为上一句子即第j-1个句子的主题标签，

表示目标招聘岗位描述文本中第j-1个句子中词的数量，k^s表示主题数量，

是通过第一技能主题词分布参数β^s对上一句子的矢量表达。

通过对注意力模块402和解码器模块403的划分，完成了对技能主题标签和描述文本中的当前词的确定，提高了计算精度，实现了目标招聘岗位描述文本的自动生成，减少人工成本，提高招聘效率。

本实施例中，可选的，主题预测子模块，包括：第二循环神经网络子模块，用于根据文本生成子模块中预测上一句子的循环神经网络的隐层特征状态向量、上一句子的技能主题标签对应的嵌入表征向量、以及目标技能主题分布向量，获得第一序列特征向量；主题生成子模块，用于根据第一序列特征向量和第一向量序列，预测出当前句子的技能主题标签。

具体的，主题预测子模块4031可以由第二循环神经网络子模块40311 和主题生成子模块40312组成。第二循环神经网络子模块40311获取文本生成子模块4032中预测上一句子的循环神经网络的隐层特征状态向量、上一句子的技能主题标签所对应的嵌入表征向量、以及目标技能主题分布向量θ^s，计算得到第一序列特征向量。其中，上一句子的循环神经网络的隐层特征状态向量可以由

表示，上一句子的技能主题标签可以由t_j-1表示，上一句子的技能主题标签对应的嵌入表征向量可以由

表示，第一序列特征向量可以由

表示。例如，可以采用LSTM(Long Short-Term Memory，长短期记忆网络)进行计算，公式如下：

其中，

表示上一句子的第一序列特征向量，

表示当前句子的技能主题标签对应的嵌入表征向量，t_j表示当前句子的技能主题标签，

表示预设参数。

主题生成子模块40312获取第二循环神经网络子模块40311的第一序列特征向量

并根据第一注意力子模块4021的第一向量序列

预测出当前句子的技能主题标签t_j。通过计算第一序列特征向量

提高了当前句子的技能主题标签的预测精度，便于目标招聘岗位描述文本的生成。

本实施例中，可选的，文本生成子模块包括：第三循环神经网络子模块，用于根据第一序列特征向量和预测出的上一个词的词嵌入表征向量，获得第二序列特征向量；中间处理子模块，用于根据第二向量序列和第二序列特征向量，获得预生成词概率向量；复制机制子模块，用于基于第一技能主题词分布参数对预生成词概率向量进行处理，获得预测出的目标招聘岗位描述文本中的当前词。

具体的，文本生成子模块4032可以由第三循环神经网络子模块40321、中间处理子模块40322和复制机制子模块40323组成。第三循环神经网络子模块40321获取第一序列特征向量

和预测出的上一个词的词嵌入表征向量，得到第二序列特征向量。其中，预测出的上一个词的词嵌入表征向量可以由

表示，第二序列特征向量可以由

表示。例如，可以采用 LSTM进行计算，公式如下：

其中，

表示上一个词的第二序列特征向量，

表示当前词的词嵌入表征向量，y_j,k表示预生成词概率向量，

表示预设参数。

中间处理子模块40322根据第二向量序列

和第二序列特征向量

得到预生成词概率向量，预生成词概率向量可以由y_j,k表示。复制机制子模块40323基于第一技能主题词分布参数，对预生成词概率向量进行处理，得到预测出的目标招聘岗位描述文本中的当前词s_j,k。第一技能主题词分布参数可以预先设置，由β^s表示。通过将文本生成子模块4032划分为三个子模块，实现了目标招聘岗位的描述文本自动生成，提高了描述文本与目标岗位的匹配精度，进而提高描述文本的生成效率。

上述申请中的一个实施例具有如下优点或有益效果：通过将描述文本生成子模型划分为编码器模块、注意力模块和解码器模块，实现目标招聘岗位描述文本的自动生成。解决了现有技术中，由人力资源员工手动提取岗位信息，减少人为的主观性，节约招聘岗位描述文本的生成时间和成本，避免由于人力资源员工对不同岗位的专业技能具有领域间隙，所造成的误差，便于招聘岗位与招聘人员的精准匹配，提高招聘效率。

图5是根据本申请实施例提供的一种深度神经网络模型的训练方法的流程示意图，以上述实施例为基础进行进一步优化，用于训练深度神经网络，以生成招聘岗位描述文本的情况，该方法可以由一种深度神经网络模型的训练装置来执行，该装置可以采用软件和/或硬件的方式实现，并可集成于具有计算能力的电子设备中。如图5所示，本实施例提供的深度神经网络模型的训练方法可以包括：

S510、获取第一训练样本数据；其中，第一训练样本数据包括：第一样本岗位的第一样本相关文本和第一样本岗位对应的第一标准招聘岗位描述文本；使用第一训练样本数据，对预先构建的文本主题预测子模型进行初步训练，获得初步训练出的文本主题预测子模型。

其中，采集至少两类训练样本数据，可以分为第一训练样本数据和第二训练样本数据。第一训练样本数据中可以包括第一样本岗位的第一样本相关文本和第一样本岗位对应的第一标准招聘岗位描述文本，第一样本相关文本可以包括第一样本岗位的已确定符合岗位要求人员的简历文本、包含岗位职责数据的文本、以及包含岗位涉及项目数据的文本中的至少一个，第一标准招聘岗位描述文本为已经编辑好的第一样本岗位对应的标准招聘岗位描述文本。

图6为深度神经网络模型的结构示意图，其中，文本主题预测子模型 610和描述文本生成子模型620为预先构建。通过第一训练样本数据，对文本主题预测子模型610进行初步训练，根据第一标准招聘岗位描述文本对第一样本相关文本的训练结果进行修正，得到初步训练出的文本主题预测子模型610。

本实施例中，可选的，文本主题预测子模型在前述实施例的基础上还包括：第二主题分布确定模块，用于根据技能主题向量分布参数，获得原始技能主题分布向量；第一文本重构子模块，用于根据第二技能主题词分布参数和原始技能主题分布向量，生成重构后的原始相关文本的预测词袋表征数据；第二文本重构子模块，用于根据第一技能主题词分布参数和目标技能主题分布向量，生成重构后的标准招聘岗位描述文本的预测词袋表征数据。

具体的，文本主题预测子模型610可以由词袋特征提取模块601、分布参数计算模块602、第一主题分布确定模块603、第二主题分布确定模块604、第一文本重构子模块605和第二文本重构子模块606组成。第二主题分布确定模块604接收分布参数计算模块602的技能主题向量分布参数μ_d和σ_d，计算得出原始技能主题分布向量，原始技能主题分布向量可以由θ^d表示。

第二主题分布确定模块604可以包括第二主题向量采样子模块6041、第三全连接网络子模块6042和第二主题分布特征计算子模块6043。第二主题向量采样子模块6041用于对第一技能主题向量分布子参数和第二技能主题向量分布子参数，获得第二技能主题向量。可以根据μ_d和σ_d，计算得出第二技能主题向量，第二技能主题向量可以由z^d表示。第三全连接网络子模块6042用于对第二技能主题向量进行特征提取，获得第二主题特征向量。例如，可以采样得到主题向量为

第三全连接网络子模块6042可以包括一层或多层的全连接网络。可以由

表示第三全连接网络子模块6042中的全连接网络。

第二主题分布特征计算子模块6043接收第三全连接网络子模块6042 的第二主题特征向量，并根据预设的第二激活函数，得到原始技能主题分布向量。第二激活函数可以由

表示，原始技能主题分布向量可以由θ^d表示，其中，

第一文本重构子模块605获取原始技能主题分布向量θ^d，并根据预先设置的第二技能主题词分布参数，得到重构后的原始相关文本的预测词袋表征数据，第二技能主题词分布参数可以由β^d表示。第一文本重构子模块 605的词袋表征数据预测概率由如下公式计算：

p(x,l)＝θ^d·β^d；

其中，p(x,l)表示原始相关文本的词袋表征数据预测概率。

第二文本重构子模块606根据第一技能主题词分布参数和目标技能主题分布向量θ^s，得到重构后的标准招聘岗位描述文本的预测词袋表征数据，第一技能主题词分布参数可以由β^s表示。第二文本重构子模块606的词袋表征数据预测概率由如下公式计算：

其中，p(s_j|θ^s,β^s)表示标准招聘岗位描述文本的词袋表征数据预测概率，

表示经过词袋特征选取后的第j个句子中词的数量，

表示通过第一技能主题词分布参数β^s对当前句子的矢量表达。

通过将文本主题预测子模型610划分为第二主题分布确定模块604、第一文本重构子模块605和第二文本重构子模块606，实现了对文本主题预测子模型610的精确训练，提高文本主题预测的准确度，进而提高目标岗位招聘文本的生成效率。

本实施例中，可选的，使用第一训练样本数据，对预先构建的文本主题预测子模型进行初步训练，获得初步训练出的文本主题预测子模型，包括：将第一样本相关文本输入预先构建的文本主题预测子模型；根据第一差距信息和第二差距信息，采用神经变分方法计算第一损失函数值；其中第一差距信息为第一文本重构子模块输出的第一预测词袋表征数据，与词袋特征提取模块输出的第一样本相关文本的词袋表征数据之间的差距信息，第二差距信息为第二文本重构子模块输出的第二预测词袋表征数据与第一标准招聘岗位描述文本的词袋表征数据之间的差距信息；根据计算的第一损失函数值，对预先构建的文本主题预测子模型中的网络参数进行调整，直至达到迭代次数阈值或损失函数值收敛。

具体的，将第一样本相关文本输入预先构建的文本主题预测子模型 610中，由词袋特征提取模块601输出第一样本相关文本的词袋表征数据

由第一文本重构子模块605输出第一预测词袋表征数据

将

与

之间的差距信息作为第一差距信息。由第二文本重构子模块606输出第二预测词袋表征数据，将第二预测词袋表征数据与第一标准招聘岗位描述文本的词袋表征数据之间的差距信息作为第二差距信息。在得到第一差距信息和第二差距信息后，采用神经变分方法计算第一损失函数值，根据第一损失函数值调整文本主题预测子模型610中的网络参数，直至达到迭代次数阈值或损失函数值收敛，使文本主题预测子模型610输出的词袋表征数据达到第一标准招聘岗位描述文本的词袋表征数据的要求。

第一损失函数值的计算公式如下所示：

其中，D_KL表示Kullback-Leiblerdivergence距离(相对熵距离)，

表示通过第二技能主题词分布参数β^d对当前句子即第k个词的矢量表达，

表示通过第一技能主题词分布参数β^s对第j个句子的矢量表达，p(θ^d) 和p(θ^s)表示数据真实概率分布，q(θ^d)和q(θ^s)表示神经变分近似的估计概率分布函数。

通过计算差距信息和第一损失函数值，完成对文本主题预测子模型 610的初步训练，实现对文本主题预测的精确性。

S520、获取第二训练样本数据；其中，第二训练样本数据包括：第二样本岗位的第二样本相关文本和第二样本岗位对应的第二标准招聘岗位描述文本。

其中，在得到初步训练出的文本主题预测子模型610后，获取采集的第二训练样本数据。第二样本相关文本包括第二样本岗位的已确定符合岗位要求人员的简历文本、包含岗位职责数据的文本、以及包含岗位涉及项目数据的文本中的至少一个，第二标准招聘岗位描述文本为已经编辑好的第二样本岗位对应的标准招聘岗位描述文本。

S530、使用第二训练样本数据，对包括初步训练出的文本主题预测子模型和预先构建的描述文本生成子模型的深度神经网络模型，进行训练，获得训练出的深度神经网络模型。

其中，通过第二训练样本数据，对初步训练出的文本主题预测子模型 610和预先构建的描述文本生成子模型620进行训练，根据第二标准招聘岗位描述文本对深度神经网络模型的输出结果进行修正，得到训练出的深度神经网络模型。

本实施例中，可选的，使用第二训练样本数据，对包括初步训练出的文本主题预测子模型和预先构建的描述文本生成子模型的深度神经网络模型，进行训练，获得训练出的深度神经网络模型，包括：将第二样本相关文本输入包括初步训练出的文本主题预测子模型和预先构建的描述文本生成子模型的深度神经网络模型；根据第三差距信息和第四差距信息计算第二损失函数值；其中第三差距信息为第一文本重构子模块输出的第一预测词袋表征数据，与词袋特征提取模块输出的第二样本相关文本的词袋表征数据之间的差距，第四差距信息为第二文本重构子模块输出的第二预测词袋表征数据与第二标准招聘岗位描述文本的词袋表征数据之间的差距信息；根据第五差距信息计算第三损失函数值；其中第五差距信息为第二标准招聘岗位描述文本与描述文本生成子模型输出的文本之间的差距信息；根据计算的第二损失函数值和第三损失函数值确定总体损失函数值，根据该总体损失函数值对文本主题预测子模型和描述文本生成子模型中的网络参数进行调整，直至达到迭代次数阈值或总体损失函数值收敛。

具体的，得到初步训练的文本主题预测子模型610后，将第二样本相关文本输入文本主题预测子模型610和描述文本生成子模型620。由文本主题预测子模型610中的第一文本重构子模块605输出第一预测词袋表征数据，由文本主题预测子模型610中的词袋特征提取模块601输出第二样本相关文本的词袋表征数据，将第一预测词袋表征数据与第二样本相关文本的词袋表征数据之间的差距信息作为第三差距信息。由第二文本重构子模块606输出第二预测词袋表征数据，将第二预测词袋表征数据与第二标准招聘岗位描述文本的词袋表征数据之间的差距信息作为第四差距信息。在得到第三差距信息和第四差距信息后，可以采用神经变分方法计算第二损失函数值。

由描述文本生成子模型620输出描述文本，将第二标准招聘岗位描述文本与输出的描述文本之间的差距信息作为第五差距信息，根据第五差距信息计算第三损失函数值。根据计算的第二损失函数值、第三损失函数值以及对应的权重，确定总体损失函数值。根据该总体损失函数值对文本主题预测子模型和所述描述文本生成子模型中的网络参数进行调整，直至达到迭代次数阈值或总体损失函数值收敛，使深度神经网络模型600可以输出满足要求的招聘岗位描述文本。对文本主题预测子模型610和描述文本生成子模型620进行总损失函数的计算，提高了深度神经网络模型600的描述文本生成精度，避免主观性和领域差异导致的描述文本不准确，提高描述文本生成效率。

图7是根据本申请实施例提供的一种深度神经网络模型结构示意图，深度神经网络模型700包括文本主题预测子模型710和描述文本生成子模型720。

文本主题预测子模型710包括词袋特征提取模块701、分布参数计算模块702和第一主题分布确定模块703、第二主题分布确定模块704、第一文本重构子模块705和第二文本重构子模块706。词袋特征提取模块701 包括词袋生成子模块7011和第一全连接网络子模块7012，分布参数计算模块702包括第一参数计算子模块7021和第二参数计算子模块7022，第一主题分布确定模块703包括第三参数计算子模块7031、第四参数计算子模块7032、第一主题向量采样子模块7033、第二全连接网络子模块7034 和第一主题分布特征计算子模块7035，第二主题分布确定模块704包括第二主题向量采样子模块7041、第三全连接网络子模块7042和第二主题分布特征计算子模块7043。其中，

表示重构后的标准招聘岗位描述文本的预测词袋表征数据。

描述文本生成子模型720包括编码器模块707、注意力模块708和解码器模块709。编码器模块707包括词向量生成子模块7071和第一循环神经网络子模块7072，注意力模块708包括第一注意力子模块7081和第二注意力子模块7082，解码器模块709包括主题预测子模块7091和文本生成子模块7092。主题预测子模块7091包括第二循环神经网络子模块70911 和主题生成子模块70912，文本生成子模块7092包括第三循环神经网络子模块70921、中间处理子模块70922和复制机制子模块70923。其中，x_k表示原始相关文本或样本相关文本中的第k个词。

上述申请中的一个实施例具有如下优点或有益效果：通过获取第一训练样本数据，实现对文本主题预测子模型的初步训练；通过获取第二训练样本数据，完成对深度神经网络模型经一部训练，使深度神经网络模型输出的描述文本符合标准文本的要求，提高描述文本的准确性，进而提高目标岗位描述文本的输出效率。

图8是根据本申请实施例提供的一种招聘岗位描述文本的生成装置的结构示意图，可执行本申请实施例所提供的招聘岗位描述文本的生成方法，具备执行方法相应的功能模块和有益效果。如图8所示，该装置800可以包括：

原始文本获取模块801，用于获取目标岗位的原始相关文本；

描述文本生成模块802，用于基于原始相关文本和预先训练出的深度神经网络模型，生成目标岗位对应的目标招聘岗位描述文本。

可选的，原始相关文本包括：已确定符合岗位要求人员的简历文本、包含岗位职责数据的文本、以及包含岗位涉及项目数据的文本中的至少一个。

可选的，深度神经网络模型包括：

文本主题预测子模型，用于根据原始相关文本，预测出目标技能主题分布向量；

描述文本生成子模型，用于根据目标技能主题分布向量，生成目标岗位的目标招聘岗位描述文本。

可选的，文本主题预测子模型包括：

词袋特征提取模块，用于提取原始相关文本的词袋特征向量；

分布参数计算模块，用于根据词袋特征向量和非线性网络层，计算技能主题向量分布参数；

第一主题分布确定模块，用于根据技能主题向量分布参数以及预设主题分布假设参数，获得目标技能主题分布向量。

可选的，词袋特征提取模块包括：

词袋生成子模块，用于生成原始相关文本的词袋表征数据；

第一全连接网络子模块，用于对词袋表征数据进行特征提取，获得词袋特征向量。

可选的，分布参数计算模块包括：

第一参数计算子模块，用于根据词袋特征向量和第一非线性网络层，计算第一技能主题向量分布子参数；

第二参数计算子模块，用于根据词袋特征向量和第二非线性网络层，计算第二技能主题向量分布子参数。

可选的，第一主题分布确定模块包括：

第三参数计算子模块，用于根据第一技能主题向量分布子参数和第一预设主题分布假设子参数，计算第三技能主题向量分布参数；

第四参数计算子模块，用于根据第二技能主题向量分布子参数和第二预设主题分布假设子参数，计算第四技能主题向量分布参数；

第一主题向量采样子模块，用于根据第三技能主题向量分布参数和第四技能主题向量分布参数，获得第一技能主题向量；

第二全连接网络子模块，用于对第一技能主题向量进行特征提取，获得第一主题特征向量；

第一主题分布特征计算子模块，用于根据第一主题特征向量和第一激活函数，获得目标技能主题分布向量。

可选的，描述文本生成子模型包括：

编码器模块，用于生成原始相关文本中当前句子的语义表征向量序列；

注意力模块，用于根据目标技能主题分布向量，对语义表征向量序列进行加权变换；

解码器模块，用于根据加权变换后的语义表征向量序列，预测当前句子的技能主题标签；并根据技能主题标签预测出目标招聘岗位描述文本的当前词。

可选的，编码器模块包括：

词向量生成子模块，用于生成原始相关文本中当前句子所包含各个词的词向量；

第一循环神经网络子模块，用于根据各词向量生成所述当前句子的语义表征向量序列。

可选的，注意力模块包括第一注意力子模块和第二注意力子模块；解码器模块包括主题预测子模块和文本生成子模块；其中：

第一注意力子模块，用于根据目标技能主题分布向量以及主题预测子模块中的隐层特征状态向量，对语义表征向量序列进行加权变换，获得加权变化后的第一向量序列；

第二注意力子模块，用于根据目标技能主题分布向量以及文本生成子模块中的隐层特征状态向量，对语义表征向量序列进行加权变换，获得加权变化后的第二向量序列；

主题预测子模块，用于根据目标技能主题分布向量以及第一向量序列，预测出当前句子的技能主题标签；

文本生成子模块，用于根据当前句子的技能主题标签以及第二向量序列，预测出目标招聘岗位描述文本中的当前词。

可选的，主题预测子模块，包括：

第二循环神经网络子模块，用于根据文本生成子模块中预测上一句子的循环神经网络的隐层特征状态向量、上一句子的技能主题标签对应的嵌入表征向量、以及目标技能主题分布向量，获得第一序列特征向量；

主题生成子模块，用于根据第一序列特征向量和第一向量序列，预测出当前句子的技能主题标签。

可选的，文本生成子模块包括：

第三循环神经网络子模块，用于根据第一序列特征向量和预测出的上一个词的词嵌入表征向量，获得第二序列特征向量；

中间处理子模块，用于根据第二向量序列和第二序列特征向量，获得预生成词概率向量；

复制机制子模块，用于基于第一技能主题词分布参数对预生成词概率向量进行处理，获得预测出的目标招聘岗位描述文本中的当前词。

可选的，深度神经网络模型的训练过程包括：

获取第一训练样本数据；其中，第一训练样本数据包括：第一样本岗位的第一样本相关文本和第一样本岗位对应的第一标准招聘岗位描述文本；使用第一训练样本数据，对预先构建的文本主题预测子模型进行初步训练，获得初步训练出的文本主题预测子模型；

获取第二训练样本数据；其中，第二训练样本数据包括：第二样本岗位的第二样本相关文本和第二样本岗位对应的第二标准招聘岗位描述文本；

使用第二训练样本数据，对包括初步训练出的文本主题预测子模型和预先构建的描述文本生成子模型的深度神经网络模型，进行训练，获得训练出的深度神经网络模型。

可选的，文本主题预测子模型还包括：

第二主题分布确定模块，用于根据技能主题向量分布参数，获得原始技能主题分布向量；

第一文本重构子模块，用于根据第二技能主题词分布参数和原始技能主题分布向量，生成重构后的原始相关文本的预测词袋表征数据；

第二文本重构子模块，用于根据第一技能主题词分布参数和目标技能主题分布向量，生成重构后的标准招聘岗位描述文本的预测词袋表征数据。

可选的，使用第一训练样本数据，对预先构建的文本主题预测子模型进行初步训练，获得初步训练出的文本主题预测子模型，包括：

将第一样本相关文本输入预先构建的文本主题预测子模型；

根据第一差距信息和第二差距信息，采用神经变分方法计算第一损失函数值；其中第一差距信息为第一文本重构子模块输出的第一预测词袋表征数据，与词袋特征提取模块输出的第一样本相关文本的词袋表征数据之间的差距信息，第二差距信息为第二文本重构子模块输出的第二预测词袋表征数据与第一标准招聘岗位描述文本的词袋表征数据之间的差距信息；

根据计算的第一损失函数值，对预先构建的文本主题预测子模型中的网络参数进行调整，直至达到迭代次数阈值或损失函数值收敛。

可选的，使用第二训练样本数据，对包括初步训练出的文本主题预测子模型和预先构建的描述文本生成子模型的深度神经网络模型，进行训练，获得训练出的深度神经网络模型，包括：

将第二样本相关文本输入包括初步训练出的文本主题预测子模型和预先构建的描述文本生成子模型的深度神经网络模型；

根据第三差距信息和第四差距信息计算第二损失函数值；其中第三差距信息为第一文本重构子模块输出的第一预测词袋表征数据，与词袋特征提取模块输出的第二样本相关文本的词袋表征数据之间的差距，第四差距信息为第二文本重构子模块输出的第二预测词袋表征数据与第二标准招聘岗位描述文本的词袋表征数据之间的差距信息；

根据第五差距信息计算第三损失函数值；其中第五差距信息为第二标准招聘岗位描述文本与所述描述文本生成子模型输出的文本之间的差距信息；

根据计算的第二损失函数值和第三损失函数值确定总体损失函数值，根据该总体损失函数值对所述文本主题预测子模型和所述描述文本生成子模型中的网络参数进行调整，直至达到迭代次数阈值或总体损失函数值收敛。

上述申请中的一个实施例具有如下优点或有益效果：通过深度神经网络模型，自动提取原始相关文本中的数据，得到目标岗位对应的目标招聘岗位描述文本。解决了现有技术中，由人力资源员工手动提取岗位信息，并人为撰写招聘岗位描述文本的问题，减少人为的主观性，节约招聘岗位描述文本的生成时间和成本，避免由于人力资源员工对不同岗位的专业技能具有领域间隙，所造成的误差，实现招聘岗位与招聘人员的精准匹配，提高招聘岗位描述文本的生成效率以及招聘效率。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图9所示，是根据本申请实施例的招聘岗位描述文本的生成方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图9所示，该电子设备包括：一个或多个处理器901、存储器902，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901 为例。

存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的招聘岗位描述文本的生成方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的招聘岗位描述文本的生成方法。

存储器902作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的招聘岗位描述文本的生成方法对应的程序指令/模块。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的招聘岗位描述文本的生成方法。

存储器902可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据招聘岗位描述文本的生成方法的电子设备的使用所创建的数据等。此外，存储器902可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器902可选包括相对于处理器901远程设置的存储器，这些远程存储器可以通过网络连接至招聘岗位描述文本的生成方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

招聘岗位描述文本的生成方法的电子设备还可以包括：输入装置903 和输出装置904。处理器901、存储器902、输入装置903和输出装置904 可以通过总线或者其他方式连接，图9中以通过总线连接为例。

输入装置903可接收输入的数字或字符信息，以及产生与招聘岗位描述文本的生成方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED) 显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入) 来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案，通过深度神经网络模型，自动提取原始相关文本中的数据，得到目标岗位对应的目标招聘岗位描述文本。解决了现有技术中，由人力资源员工手动提取岗位信息，并人为撰写招聘岗位描述文本的问题，减少人为的主观性，节约招聘岗位描述文本的生成时间和成本，避免由于人力资源员工对不同岗位的专业技能具有领域间隙，所造成的误差，实现招聘岗位与招聘人员的精准匹配，提高招聘岗位描述文本的生成效率以及招聘效率。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种招聘岗位描述文本的生成方法，其特征在于，包括：

获取目标岗位的原始相关文本；

2.根据权利要求1所述的方法，其特征在于，所述原始相关文本包括：已确定符合岗位要求人员的简历文本、包含岗位职责数据的文本、以及包含岗位涉及项目数据的文本中的至少一个。

3.根据权利要求1或2所述的方法，其特征在于，所述深度神经网络模型包括：

文本主题预测子模型，用于根据所述原始相关文本，预测出目标技能主题分布向量；

描述文本生成子模型，用于根据所述目标技能主题分布向量，生成所述目标岗位的目标招聘岗位描述文本。

4.根据权利要求3所述的方法，其特征在于，所述文本主题预测子模型包括：

词袋特征提取模块，用于提取所述原始相关文本的词袋特征向量；

分布参数计算模块，用于根据所述词袋特征向量和非线性网络层，计算技能主题向量分布参数；

第一主题分布确定模块，用于根据所述技能主题向量分布参数以及预设主题分布假设参数，获得目标技能主题分布向量。

5.根据权利要求4所述的方法，其特征在于，所述词袋特征提取模块包括：

词袋生成子模块，用于生成所述原始相关文本的词袋表征数据；

第一全连接网络子模块，用于对所述词袋表征数据进行特征提取，获得词袋特征向量。

6.根据权利要求4所述的方法，其特征在于，所述分布参数计算模块包括：

第一参数计算子模块，用于根据所述词袋特征向量和第一非线性网络层，计算第一技能主题向量分布子参数；

第二参数计算子模块，用于根据所述词袋特征向量和第二非线性网络层，计算第二技能主题向量分布子参数。

7.根据权利要求6所述的方法，其特征在于，所述第一主题分布确定模块包括：

8.根据权利要求3所述的方法，其特征在于，所述描述文本生成子模型包括：

编码器模块，用于生成所述原始相关文本中当前句子的语义表征向量序列；

注意力模块，用于根据所述目标技能主题分布向量，对所述语义表征向量序列进行加权变换；

解码器模块，用于根据加权变换后的语义表征向量序列，预测所述当前句子的技能主题标签；并根据所述技能主题标签预测出目标招聘岗位描述文本的当前词。

9.根据权利要求8所述的方法，其特征在于，所述编码器模块包括：

词向量生成子模块，用于生成所述原始相关文本中当前句子所包含各个词的词向量；

第一循环神经网络子模块，用于根据各所述词向量生成所述当前句子的语义表征向量序列。

10.根据权利要求8所述的方法，其特征在于，所述注意力模块包括第一注意力子模块和第二注意力子模块；所述解码器模块包括主题预测子模块和文本生成子模块；其中：

所述第一注意力子模块，用于根据所述目标技能主题分布向量以及所述主题预测子模块中的隐层特征状态向量，对所述语义表征向量序列进行加权变换，获得加权变化后的第一向量序列；

所述第二注意力子模块，用于根据所述目标技能主题分布向量以及所述文本生成子模块中的隐层特征状态向量，对所述语义表征向量序列进行加权变换，获得加权变化后的第二向量序列；

所述主题预测子模块，用于根据所述目标技能主题分布向量以及第一向量序列，预测出所述当前句子的技能主题标签；

所述文本生成子模块，用于根据所述当前句子的技能主题标签以及第二向量序列，预测出目标招聘岗位描述文本中的当前词。

11.根据权利要求10所述的方法，其特征在于，所述主题预测子模块，包括：

第二循环神经网络子模块，用于根据所述文本生成子模块中预测上一句子的循环神经网络的隐层特征状态向量、上一句子的技能主题标签对应的嵌入表征向量、以及所述目标技能主题分布向量，获得第一序列特征向量；

主题生成子模块，用于根据第一序列特征向量和第一向量序列，预测出所述当前句子的技能主题标签。

12.根据权利要求11所述的方法，其特征在于，所述文本生成子模块包括：

复制机制子模块，用于基于第一技能主题词分布参数对所述预生成词概率向量进行处理，获得预测出的目标招聘岗位描述文本中的当前词。

13.根据权利要求4所述的方法，其特征在于，所述深度神经网络模型的训练过程包括：

14.根据权利要求13所述的方法，其特征在于，所述文本主题预测子模型还包括：

第二主题分布确定模块，用于根据所述技能主题向量分布参数，获得原始技能主题分布向量；

15.根据权利要求14所述的方法，其特征在于，使用第一训练样本数据，对预先构建的文本主题预测子模型进行初步训练，获得初步训练出的文本主题预测子模型，包括：

将第一样本相关文本输入预先构建的文本主题预测子模型；

根据第一差距信息和第二差距信息，采用神经变分方法计算第一损失函数值；其中第一差距信息为第一文本重构子模块输出的第一预测词袋表征数据，与所述词袋特征提取模块输出的第一样本相关文本的词袋表征数据之间的差距信息，第二差距信息为第二文本重构子模块输出的第二预测词袋表征数据与第一标准招聘岗位描述文本的词袋表征数据之间的差距信息；

16.根据权利要求14所述的方法，其特征在于，使用第二训练样本数据，对包括初步训练出的文本主题预测子模型和预先构建的描述文本生成子模型的深度神经网络模型，进行训练，获得训练出的深度神经网络模型，包括：

17.一种招聘岗位描述文本的生成装置，其特征在于，包括：

原始文本获取模块，用于获取目标岗位的原始相关文本；

18.根据权利要求17所述的装置，其特征在于，所述深度神经网络模型包括：

19.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-16中任一项所述的招聘岗位描述文本的生成方法。

20.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-16中任一项所述的招聘岗位描述文本的生成方法。