CN111814958B

CN111814958B - 公共文化服务个体映射到公共文化服务场景的方法及装置

Info

Publication number: CN111814958B
Application number: CN202010607739.4A
Authority: CN
Inventors: 王亚珅; 张欢欢; 黎宏河
Original assignee: China Academy of Electronic and Information Technology of CETC
Current assignee: China Academy of Electronic and Information Technology of CETC
Priority date: 2020-06-30
Filing date: 2020-06-30
Publication date: 2023-06-20
Anticipated expiration: 2040-06-30
Also published as: CN111814958A

Abstract

本发明公开了一种公共文化服务个体映射到公共文化服务场景的方法及装置，本发明仅需要接收公共文化服务个体的槽值对序列，并将接收到的公共文化服务个体的槽值对序列带入预设的智体模型，并通过智能体模型按照预设映射规则，将公共文化服务个体映射到对应的公共文化服务场景，即，本发明可简洁且准确地将公共文化服务个体映射到对应的公共文化服务场景中，从而满足公共文化服务资源的推荐、公共文化服务关联分析等诸多场景的需求，继而有效解决了现有技术中将公共文化服务个体映射到对应的公共文化服务场景的效率低的问题。

Description

公共文化服务个体映射到公共文化服务场景的方法及装置

技术领域

本发明涉及计算机技术领域，特别是涉及一种公共文化服务个体映射到公共文化服务场景的方法及装置。

背景技术

在公共文化服务领域，将文旅专家、文旅作品、文旅群团等公共文化服务个体根据其特征推荐至不同的公共文化服务场景，有着重要实践意义和应用价值，能够打通公共文化服务个体与公共文化服务场景之间以及公共文化服务个体之间的通联，提供跨域的公共文化服务调配和互动。例如，将声乐专家推荐到中秋晚会参演场景、老年大学声乐课程教学场景、声乐类群团辅导场景等，可以便于公共文化服务资源充分关联调配，实现价值最大化。但是目前都是通过人工来建立公共文化服务个体与公共文化服务场景之间的关系，从而大大制约了跨域的公共文化服务调配和互动。

发明内容

本发明提供了一种公共文化服务个体映射到公共文化服务场景的方法及装置，用以解决现有技术中人工建立公共文化服务个体与公共文化服务场景之间的关联关系效率低的问题。

第一方面，本发明提供了一种公共文化服务个体映射到公共文化服务场景的方法，该方法包括：接收公共文化服务个体的槽值对序列SV_x＝{(S₁，V₁)，…，(S_n，V_n)}；其中，所述槽值对序列内包括多组槽向量S_n和槽值向量V_n，n为自然数，且所述槽值对序列内的槽向量S_n和槽值向量V_n相互唯一对应；

将所述槽值对序列带入预设的智能体模型，并通过所述智能体模型按照预设映射规则，将所述公共文化服务个体映射到对应的公共文化服务场景Scenario_j，其中，j为自然数。

可选地，该方法还包括：根据预设的公共文化服务个体的特征与公共文化服务场景之间的关联关系，生成公共文化服务个体到公共文化服务场景之间的预设映射规则；其中，所述公共文化服务个体的特征包括所述公共文化服务个体的槽值对序列。

可选地，该方法还包括：训练所述智能体模型。

可选地，所述训练所述智能体模型，包括：将预设公共文化服务个体的槽值对序列输入到所述智能体模型，通过所述智能体模型为所述槽值对序列中每个槽值对输出一个映射置信度ρ_i，并选择大于设置映射置信度阈值的映射置信度ρ_i作为合格的映射置信度ρ_i；

将合格的映射置信度ρ_i的槽值对序列输入到槽值对子序列分类模型，通过所述槽值对子序列分类模型对该槽值对序列进行二分类，基于分类结果对每个槽值对生成一个奖励值R(ρ_i)，将奖励值R(ρ_i)输入给所述智能体模型，以使所述智能体模型根据该奖励值R(ρ_i)进一步根据所述预设公共文化服务个体的槽值对序列进行训练；

重复执行上述步骤，直到得到收敛的智能体模型和槽值对子序列分类模型。

可选地，所述槽值对子序列分类模型的第一目标函数为：

其中，/>

的值由槽值对子序列分类模型生成；

p_k为当前公共文化服务个体属于第k个公共文化服务场景的概率，p_k的值由槽值对子序列分类模型生成；Scenario表示所有场景的集合，Scenario＝{Scenario₁,Scenario₂,…，Scenario_j，…}，|Scenario|表示该集合的大小，即所有场景的数量。

可选地，该方法还包括：通过随机梯度下降方式训练所述槽值对子序列分类模型的参数。

可选地，所述智能体模型的第二目标函数为：

其中，ρ_i是当前时间步智能体模型所输出的槽值对的权重，即子序列中槽值对对应的动作，由所述智能体模型生成；R(ρ_i)表示该动作对应的奖励值，即子序列中槽值对对应的奖励值，由所述智能体模型生成，

表示当前槽值对对应的奖励值的概率值，由所述智能体模型生成。

可选地，该方法还包括：通过随机梯度下降方式训练所述智能体模型的参数。

第二方面，本发明提供了一种公共文化服务个体映射到公共文化服务场景的装置，该装置包括：接收单元，用于接收公共文化服务个体的槽值对序列SV_x＝{(S₁，V₁)，…，(S_n，V_n)}；其中，所述槽值对序列内包括多组槽向量S_n和槽值向量V_n，n为自然数，且所述槽值对序列内的槽向量S_n和槽值向量V_n相互唯一对应；处理单元，用于将所述槽值对序列带入预设的智能体模型，并通过所述智能体模型按照预设映射规则，将所述公共文化服务个体映射到对应的公共文化服务场景。

第三方面，本发明提供了一种计算机可读存储介质，所述计算机可读存储介质存储有信号映射的计算机程序，所述计算机程序被至少一个处理器执行时，以实现上述任一种所述的公共文化服务个体映射到公共文化服务场景的方法。

本发明有益效果如下：

本发明仅需要接收公共文化服务个体的槽值对序列，并将接收到的公共文化服务个体的槽值对序列带入预设的智体模型，并通过智能体模型按照预设映射规则，将公共文化服务个体映射到对应的公共文化服务场景，即，本发明可简洁且准确地将公共文化服务个体映射到对应的公共文化服务场景中，从而满足公共文化服务资源的推荐、公共文化服务关联分析等诸多场景的需求，继而有效解决了现有技术中将公共文化服务个体映射到对应的公共文化服务场景的效率低的问题。

附图说明

图1是本发明第一实施例提供的公共文化服务个体映射到公共文化服务场景的方法的流程示意图；

图2是本发明第一实施例提供的公共文化服务个体特征与公共文化服务场景之间的映射推荐示意图；

图3是本发明第一实施例提供的公共文化服务特征与场景映射推荐规则自动生成模型结构图；

图4是本发明第二实施例提供的公共文化服务个体映射到公共文化服务场景的装置的结构示意图。

具体实施方式

本发明实施例通过智能体模型按照预设映射规则，自动将公共文化服务个体映射到对应的公共文化服务场景，从而大大提高了公共文化服务个体与公共文化服务场景之间的映射效率。以下结合附图以及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不限定本发明。

在公共文化服务领域，将文旅专家、文旅作品、文旅群团等公共文化服务个体根据其特征推荐至不同的公共文化服务场景，有着重要实践意义和应用价值，能够打通公共文化服务个体与公共文化服务场景之间以及公共文化服务个体之间的通联，提供跨域的公共文化服务调配和互动。例如，将声乐专家推荐到中秋晚会参演场景、老年大学声乐课程教学场景、声乐类群团辅导场景等，可以便于公共文化服务资源充分关联调配，实现价值最大化。因此，需要制定和生成相关规则来实现公共文化服务个体的特征(例如某声乐艺术家的“专长”属性为“声乐”、其“社会任职”属性为“上海市音乐家协会声乐专业委员会委员”等)到公共文化服务场景的映射推荐。以往研究通常通过业务专家制定规则模板库，或者通过关联规则挖掘算法生成规则模板库，但是这些传统种方法存在如下弊端：

对于基于专家人工编制规则模板库的方法，其过度依赖专家经验，所制定的模板无法有效适用于新的公共文化服务场景，而且规则模板的制定过程过于耗费人力；对于关联规则挖掘算法，该类算法通过挖掘大规模数据集中频繁共现的数据项的集合来生成规则，并且该类方法通常适合于数据项之间差异较小的数据集，然而在公共文化服务领域中常常需要面临挖掘不同类型数据项之间的规则的现实问题，例如同一公共文化服务个体的不同特征可能可以映射对应到不同的公共文化服务场景中，另外关联规则挖掘算法的时间复杂度较高，计算开销较大，导致时效性和可扩展性较差。

因此，如何研究基于深度学习技术的自动化规则生成策略，是一个亟待解决的关键应用问题。

针对上述问题，本发明第一实施例提供了一种公共文化服务个体映射到公共文化服务场景的方法，参见图1，该方法包括：

S101、接收公共文化服务个体的槽值对序列SV_x＝{(S₁，V₁)，…，(S_n，V_n)}；其中，所述槽值对序列内包括多组槽向量S_n和槽值向量V_n，n为自然数，且所述槽值对序列内的槽向量S_n和槽值向量V_n相互唯一对应；

S102、将所述槽值对序列带入预设的智能体模型，并通过所述智能体模型按照预设映射规则，将所述公共文化服务个体映射到对应的公共文化服务场景Scenario_j，其中，j为自然数。

总体来说，本发明实施例通过智能体模型按照预设映射规则，自动将公共文化服务个体映射到对应的公共文化服务场景，从而大大提高了公共文化服务个体与公共文化服务场景之间的映射效率以及映射的准确率。

需要说明的是，本发明实施例是需要根据预设的公共文化服务个体的特征与公共文化服务场景之间的关联关系，生成公共文化服务个体到公共文化服务场景之间的预设映射规则；其中，所述公共文化服务个体的特征包括所述公共文化服务个体的槽值对序列。

通常，公共文化服务个体的特征可以用由槽位(Slot)和槽值(Value)构成的“槽-值”对来表示。例如，某声乐艺术家的“专长”槽位的槽值为“声乐”、其“社会任职”槽位的槽值为“上海市音乐家协会声乐专业委员会委员”等，这是一种结构化的数据建模与表征方式。公共文化服务个体的特征与公共文化服务场景之间的映射推荐具体如图2所示。

本发明实施例将公共文化服务特征到公共文化服务场景的映射规则模板形式定义如下：[(S₁，V₁，ρ₁)，…，(S_n，V_n，ρ_n)]→Scenario_j

其中，(S_i，V_i，ρ_i)表示槽值三元组，S_i表示槽位，V_i表示槽位值，ρ_i表示槽值对(S_i，V_i)映射到场景Scenario_j的置信度。在传统人工编制规则模板的策略下，ρ_i＝1，或者在对规则模板进行形式化定义的时候直接忽略置信度ρ_i。存在一个槽值对(S_i，V_i)映射到多个公共文化服务场景，而其针对不同公共文化服务场景下的置信度ρ_i不同。也就是说，一个公共文化服务个体(如一位文旅专家等)会拥有多个槽值对，而每个槽值对可以映射到多个公共文化服务场景，因此一个公共文化服务个体可以映射到多个公共文化服务场景中。

本发明旨在探索在无监督训练条件下，自动生成上述公共文化服务个体特征到公共文化服务场景映射规则的方法，以求在实际应用中降低人力成本和提高规则模板的可扩展性。公共文化服务特征与公共文化服务场景映射规则的示例如表1所示。

表1公共文化服务特征与公共文化服务场景映射推荐规则的示例表

槽值对序列	公共文化服务场景
		(身份，歌唱家)，(专长，声乐)，(社会任职，上海市音乐家协会声乐专业委员会)，(职称，副教授)，…	声乐类群团辅导
(类型，舞蹈)，(荣誉，“大地芳菲”浦东新区群众文艺创作节目汇演舞蹈专场)，(头衔，2015年上海市百强歌舞队)，…	中秋晚会参演
		(类型，文化馆)，(容量，50)，(隔音性能，强)，(开放时间，全天)，…	器乐排练
(年龄段，6065)，(专长，管乐)，…	老年大学管乐课程报名
		……	……

给定：公共文化服务个体x，其槽值对序列表示为：SV_x＝{(S₁，V₁)，…，(S_n，V_n)}；公共文化服务场景Scenario_j。已知该公共文化服务个体x能够映射到该公共文化服务场景Scenario_j。

本发明实施例所设计的公共文化服务特征与公共文化服务场景映射规则自动生成模型，旨在从槽值对序列SV_x＝{(S₁，V₁)，…，(S_n，V_n)}中，自动选择能够映射到公共文化服务场景Scenario_j的槽值对子序列SV′_x＝{(S_i，V_i)|ρ_i＞0.5，(S_i，V_i)∈SV_x}，即生成公共文化服务特征与公共文化服务场景映射规则：{(S_i，V_i)|ρ_i＞0.5}→Scenario_j。需要解决两个关键问题：

首先需要设计一个神经网络模型为槽值对(S_i，V_i)生成非离散的权重ρ_i，当ρ_i＞0.5时保留该槽值对，该槽值对应该加入到当前公共文化服务场景的规则中，否则舍弃该槽值对。把公共文化服务个体x的所包含的所有槽值对视为序列，为每个槽值对生成权重的过程可以建模成序列标注(Sequence Labeling)任务，但是由于没有训练数据，所以无法使用监督学习技术来训练模型；然而，整个槽值对序列是具有标签的，即当前公共文化服务个体x是否可以映射到当前公共文化服务场景Scenario_j是已知的，因此整个问题可以建模成一个强化学习问题从而训练一个智能体(Agent)来完成上述为每个槽值对(S_i，V_i)赋予权重ρ_i的工作，权重ρ_i的生成即为该智能体的动作(Action)。最终，智能体会选择ρ_i＞0.5的槽值对(S_i，V_i)组成槽值对子序列作为输出。

其次，在强化学习策略中，需要为智能体返回奖励(Reward)值来引导智能体实现自学习，所以奖励值的生成也是需要解决的关键问题。本发明将判断智能体生成的ρ_i＞0.5的槽值对子序列是否可以映射到当前公共文化服务场景，视为一个序列分类(SequenceClassification)问题。因此，可以训练一个基于卷积神经网络的分类器(例如TextCNN分类器等)。将智能体生成的槽值对子序列SV′_x作为该分类器的输入，该分类器的输出为该槽值对子序列SV′_x中每个槽值对是否能够映射到当前公共文化服务场景。

综上，本发明所设计的公共文化服务特征与公共文化服务场景映射规则自动生成模型，主要包括如下两个模块(如图3所示)，这两个模块交替迭代进行，模型收敛时，智能体模块所生成的槽值对子序列SV′_x＝{(S_i，V_i)|ρ_i＞0.5，(S_i，V_i)∈SV_x}，即可构成规则{(S_i，V_i)|ρ_i＞0.5}→Scenario_j。两个模块的详情，如下所述：

本发明实施例的智能体模块包括三层，分别是输入层、记忆层、动作层。其中，输入层所接受的输入，分别是槽向量和槽值向量，槽向量和槽值向量通过拼接作为输入层的输入(在模型初始化阶段，模型为每个槽和槽值均生成一个随机向量，随着模型不断自学习和自训练，槽向量和槽值向量均会变得有意义)。记忆层的每个单元均是一个双向LSTM网络，利用LSTM网络的记忆能力和隐状态双向传递能力，使每个时间步输出的隐状态都能够包含较长距离之外的信息和上下文信息，有效克服“梯度消失”问题。动作层的每一个单元是一个单向LSTM网络，每个LSTM网络的输入包含如下：记忆层当前时间步的输出、动作层前一个单向LSTM网络的输出、当前公共文化服务个体x所对应的公共文化服务场景Scenario_j的向量(在模型初始化阶段，模型为每个公共文化服务场景均生成一个随机向量，随着模型不断自学习和自训练，公共文化服务场景向量会变得有意义)。

本发明实施例在智能体模型对当前公共文化服务个体x的所有槽值对{(S₁，V₁)，…，(S_n，V_n)}完成分析决策后，会为每个槽值对(S_i，V_i)出一个权重作ρ_i为动作(Action)。最终，选择选择ρ_i＞0.5的槽值对(S_i，V_i)组成槽值对子序列SV′_x＝{(S_i，V_i)|ρ_i＞0.5，(S_i，V_i)∈SV_x}作为智能体模块的输出，同时作为槽值对子序列分类模型的输入。

由于强化学习模型中没有标签，因此使用奖励值视为标签引入到智能体模块的损失函数中，构建基于交叉熵的目标函数，如下所示：

其中，Θ₁表示智能体模型所有需要训练的参数；|SV′_x|表示槽值对子序列的规模；ρ_i表示当前时间步智能体模型所输出的动作，即子序列中槽值对(S_i，V_i)∈SV′_x对应的动作(即槽值对(S_i，V_i)的权重)，R(ρ_i)表示该动作对应的奖励值，即子序列中槽值对(S_i，V_i)∈SV′_x对应的奖励值；

表示当前槽值对(S_i，V_i)对应的奖励值的概率值，通过softmax方式计算得到。

本发明实施例中，可以使用多种模型来构建槽值对子序列分类模型，以基于卷积神经网络的TextCNN模型为例。槽值对子序列分类模型以槽值对子序列SV′_x作为输入，如果分类正确则为槽值对子序列中每个槽值(S_i，V_i)∈SV′_x＝{(S_i，V_i)|ρ_i＞0.5，(S_i，V_i)∈SV_x}对生成一个奖励值R(ρ_i)，反馈给智能体模型用于训练参数。

槽值对子序列分类模型的训练过程包括：将公共文化服务个体到公共文化服务场景映射任务建模成一个分类任务，由于一个公共文化服务个体可以映射到多个公共文化服务场景，因此该分类任务是一个多标签分类任务。给定某公共文化服务个体x，本发明使用文本分类研究中常用的交叉熵损失函数作为目标函数：

其中，Θ₂表示槽值对子序列分类模型所有需要训练的参数；|Scenario|表示标签个数(即公共文化服务场景个数)；

表示当前公共文化服务个体是否属于当前标签(即当前公共文化服务个体是否属于公共文化服务场景)；/>

表示当前公共文化服务个体可以映射到当前标签的概率值(即当前公共文化服务个体属于当前公共文化服务场景的概率分布)，通过sigmoid方式计算得到。

下面将通过一个具体的例子对本发明所述的方法进行详细的解释和说明：

本发明实施种的训练阶段具体包括：

训练数据包括若干公共文化服务个体槽值对序列表和公共文化服务场景的组合：

(1)公共文化服务个体x，其槽值对序列表示为：SV_x＝{(S₁，V₁)，…，(S_n，V_n)}；

(2)公共文化服务场景Scenario_j。

已知该公共文化服务个体x能够映射到该公共文化服务场景Scenario_j。

步骤1：智能体模型和槽值对子序列分类模型的参数随机初始化。

步骤2：将个体x的所有槽值对{(S₁，V₁)，…，(S_n，V_n)}输入到智能体模型，依次经过输入层、记忆层、动作层，为每个槽值对(S_i，V_i)输出一个权重作ρ_i为动作(Action)。选择选择ρ_i＞0.5的槽值对(S_i，V_i)组成槽值对子序列SV′_x＝{(S_l，V_l)|ρ_l＞0.5，(S_l，V_l)∈SV_x}作为智能体模块的输出。

步骤3：使用TextCNN模型作为槽值对子序列分类模型的具体实现。将步骤2生成的SV′_x＝{(S_l，V_l)|ρ_l＞0.5，(S_l，V_l)∈SV_x}输入到槽值对子序列分类模型。槽值对子序列分类模型对SV′_x＝{(S_l，V_l)|ρ_l＞0.5，(S_l，V_l)∈SV_x}进行二分类：{Scenario_j，非Scenario_j}。槽值对子序列分类模型基于分类结果，为每个槽值(S_l，V_l)∈SV′_x＝{(S_l，V_l)|ρ_l＞0.5，(S_l，V_l)∈SV_x}对生成一个奖励值R(ρ_l)，将奖励值R(ρ_l)输入给智能体模型。使用如下公式作为目标函数，使用随机梯度下降方式训练槽值对子序列分类模型的参数：

步骤4：使用如下公式作为目标函数，使用随机梯度下降方式训练智能体模型的参数：

步骤5：重复步骤2、步骤3、步骤4，直至智能体模型和槽值对子序列分类模型的目标函数均达到收敛状态，训练结束。

也就是说，本发明实施例是将公共文化服务特征与公共文化服务场景映射推荐任务建模成序列标注和序列分类任务，构建了基于强化学习的公共文化服务特征与公共文化服务场景映射推荐规则自动生成模型，并且本发明实施例所提出的模型能够实现从无训练数据或者少训练数据的环境中，自动感知和建模感知公共文化服务特征与公共文化服务场景之间的关联关系。实践表明，本发明的适用范围广，可在公共文化服务资源推荐、公共文化服务关联分析等诸多任务中使用。

具体实施时，本发明实施例中的测试阶段具体包括：

测试数据包括若干公共文化服务个体槽值对序列表和公共文化服务场景的组合：

(2)公共文化服务场景Scenario_j。

通过将个体x的所有槽值对{(S₁，V₁)，…，(S_n，V_n)}输入到智能体模型，依次经过输入层、记忆层、动作层，为每个槽值对(S_i，V_i)输出一个权重作ρ_i为动作(Action)。选择选择ρ_i＞0.5的槽值对(S_i，V_i)组成槽值对子序列SV′_x＝{(S_l，V_l)|ρ_l＞0.5，(S_l，V_l)∈SV_x}作为能够映射到公共文化服务场景Scenario_j的槽值对子序列，即生成公共文化服务特征与公共文化服务场景映射规则：{(S_i，V_i)|ρ_i＞0.5}→Scenario_j。预测过程结束。

综上可知，本发明实施例提供的公共文化服务特征与场景映射推荐规则自动生成方法，至少具有以下有益效果：

本发明是基于强化学习原理，可利用无监督策略自动感知公共文化服务特征与公共文化服务场景之间的关联关系并生成规则。另外，本发明具备自动化和扩展性强的优点，能够应用于无训练数据或者训练数据较少的情况，克服了以往研究对专家经验的依赖，也避免了以往模型对数据集中数据项之间差异的限制要求。

本发明第二实施例提供了一种公共文化服务个体映射到公共文化服务场景的装置，参见图4，包括：接收单元，用于接收公共文化服务个体的槽值对序列SV_x＝{(S₁，V₁)，…，(S_n，V_n)}；其中，所述槽值对序列内包括多组槽向量S_n和槽值向量V_n，n为自然数，且所述槽值对序列内的槽向量S_n和槽值向量V_n相互唯一对应；处理单元，用于将所述槽值对序列带入预设的智能体模型，并通过所述智能体模型按照预设映射规则，将所述公共文化服务个体映射到对应的公共文化服务场景。

进一步地，本发明实施例是通过处理单元来根据预设的公共文化服务个体的特征与公共文化服务场景之间的关联关系，生成公共文化服务个体到公共文化服务场景之间的预设映射规则，并训练所述智能体模型。

本发明实施例的相关内容可参见本发明第一实施例进行理解，在此不做详细论述。

本发明第三实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有信号映射的计算机程序，所述计算机程序被至少一个处理器执行时，以实现本发明第一实施例中任一种所述的公共文化服务个体映射到公共文化服务场景的方法。

本发明实施例的相关内容可参见本发明第一实施例和第二实施例进行理解，在此不做详细论述。

尽管为示例目的，已经公开了本发明的优选实施例，本领域的技术人员将意识到各种改进、增加和取代也是可能的，因此，本发明的范围应当不限于上述实施例。

Claims

1.一种公共文化服务个体映射到公共文化服务场景的方法，其特征在于，包括：

接收公共文化服务个体的槽值对序列SV_x＝{(S₁,V₁),…,(S_n,V_n)}；其中，所述槽值对序列内包括多组槽向量S_n和槽值向量V_n，n为自然数，且所述槽值对序列内的槽向量S_n和槽值向量V_n相互唯一对应；

将所述槽值对序列带入预设的智能体模型，并通过所述智能体模型按照预设映射规则，将所述公共文化服务个体映射到对应的公共文化服务场景Scenario_j，其中，j为自然数；

该方法还包括：训练所述智能体模型；

所述训练所述智能体模型，包括：将预设公共文化服务个体的槽值对序列输入到所述智能体模型，通过所述智能体模型为所述槽值对序列中每个槽值对输出一个映射置信度ρ_i，并选择大于设置映射置信度阈值的映射置信度ρ_i作为合格的映射置信度ρ_i；

重复执行上述步骤，直到得到收敛的智能体模型和槽值对子序列分类模型；

所述槽值对子序列分类模型的第一目标函数为：

其中，

的值由槽值对子序列分类模型生成；

p_k为当前公共文化服务个体属于第k个公共文化服务场景的概率，p_k的值

由槽值对子序列分类模型生成；Scenario表示所有场景的集合，Scenario＝{Scenario₁,Scenario₂,…，Scenario_j，…}，|Scenario|表示该集合的大小，即所有场景的数量。

2.根据权利要求1所述的方法，其特征在于，该方法还包括：

根据预设的公共文化服务个体的特征与公共文化服务场景之间的关联关系，生成公共文化服务个体到公共文化服务场景之间的预设映射规则；

其中，所述公共文化服务个体的特征包括所述公共文化服务个体的槽值对序列。

3.根据权利要求1所述的方法，其特征在于，该方法还包括：

通过随机梯度下降方式训练所述槽值对子序列分类模型的参数。

4.根据权利要求1所述的方法，其特征在于，

所述智能体模型的第二目标函数为：

5.根据权利要求4所述的方法，其特征在于，该方法还包括：

通过随机梯度下降方式训练所述智能体模型的参数。

6.一种公共文化服务个体映射到公共文化服务场景的装置，其特征在于，包括：

接收单元，用于接收公共文化服务个体的槽值对序列SV_x＝{(S₁,V₁),…,(S_n,V_n)}；其中，所述槽值对序列内包括多组槽向量S_n和槽值向量V_n，n为自然数，且所述槽值对序列内的槽向量S_n和槽值向量V_n相互唯一对应；

处理单元，用于将所述槽值对序列带入预设的智能体模型，并通过所述智能体模型按照预设映射规则，将所述公共文化服务个体映射到对应的公共文化服务场景；

所述处理单元还用于，训练所述智能体模型；所述训练所述智能体模型，包括：将预设公共文化服务个体的槽值对序列输入到所述智能体模型，通过所述智能体模型为所述槽值对序列中每个槽值对输出一个映射置信度ρ_i，并选择大于设置映射置信度阈值的映射置信度ρ_i作为合格的映射置信度ρ_i；将合格的映射置信度ρ_i的槽值对序列输入到槽值对子序列分类模型，通过所述槽值对子序列分类模型对该槽值对序列进行二分类，基于分类结果对每个槽值对生成一个奖励值R(ρ_i)，将奖励值R(ρ_i)输入给所述智能体模型，以使所述智能体模型根据该奖励值R(ρ_i)进一步根据所述预设公共文化服务个体的槽值对序列进行训练；重复执行上述步骤，直到得到收敛的智能体模型和槽值对子序列分类模型；

所述槽值对子序列分类模型的第一目标函数为：

其中，/>

的值由槽值对子序列分类模型生成；

7.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有信号映射的计算机程序，所述计算机程序被至少一个处理器执行时，以实现权利要求1-5中任意一项所述的公共文化服务个体映射到公共文化服务场景的方法。