CN111814958B - 公共文化服务个体映射到公共文化服务场景的方法及装置 - Google Patents
公共文化服务个体映射到公共文化服务场景的方法及装置 Download PDFInfo
- Publication number
- CN111814958B CN111814958B CN202010607739.4A CN202010607739A CN111814958B CN 111814958 B CN111814958 B CN 111814958B CN 202010607739 A CN202010607739 A CN 202010607739A CN 111814958 B CN111814958 B CN 111814958B
- Authority
- CN
- China
- Prior art keywords
- public culture
- culture service
- sequence
- value
- slot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013507 mapping Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 38
- 239000003795 chemical substances by application Substances 0.000 claims description 59
- 239000013598 vector Substances 0.000 claims description 33
- 238000013145 classification model Methods 0.000 claims description 30
- 238000012549 training Methods 0.000 claims description 26
- 230000009471 action Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012797 qualification Methods 0.000 claims description 3
- 239000000758 substrate Substances 0.000 claims 1
- 238000012098 association analyses Methods 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 23
- 230000001755 vocal effect Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 9
- 238000005065 mining Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000002787 reinforcement Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种公共文化服务个体映射到公共文化服务场景的方法及装置,本发明仅需要接收公共文化服务个体的槽值对序列,并将接收到的公共文化服务个体的槽值对序列带入预设的智体模型,并通过智能体模型按照预设映射规则,将公共文化服务个体映射到对应的公共文化服务场景,即,本发明可简洁且准确地将公共文化服务个体映射到对应的公共文化服务场景中,从而满足公共文化服务资源的推荐、公共文化服务关联分析等诸多场景的需求,继而有效解决了现有技术中将公共文化服务个体映射到对应的公共文化服务场景的效率低的问题。
Description
技术领域
本发明涉及计算机技术领域,特别是涉及一种公共文化服务个体映射到公共文化服务场景的方法及装置。
背景技术
在公共文化服务领域,将文旅专家、文旅作品、文旅群团等公共文化服务个体根据其特征推荐至不同的公共文化服务场景,有着重要实践意义和应用价值,能够打通公共文化服务个体与公共文化服务场景之间以及公共文化服务个体之间的通联,提供跨域的公共文化服务调配和互动。例如,将声乐专家推荐到中秋晚会参演场景、老年大学声乐课程教学场景、声乐类群团辅导场景等,可以便于公共文化服务资源充分关联调配,实现价值最大化。但是目前都是通过人工来建立公共文化服务个体与公共文化服务场景之间的关系,从而大大制约了跨域的公共文化服务调配和互动。
发明内容
本发明提供了一种公共文化服务个体映射到公共文化服务场景的方法及装置,用以解决现有技术中人工建立公共文化服务个体与公共文化服务场景之间的关联关系效率低的问题。
第一方面,本发明提供了一种公共文化服务个体映射到公共文化服务场景的方法,该方法包括:接收公共文化服务个体的槽值对序列SVx={(S1,V1),…,(Sn,Vn)};其中,所述槽值对序列内包括多组槽向量Sn和槽值向量Vn,n为自然数,且所述槽值对序列内的槽向量Sn和槽值向量Vn相互唯一对应;
将所述槽值对序列带入预设的智能体模型,并通过所述智能体模型按照预设映射规则,将所述公共文化服务个体映射到对应的公共文化服务场景Scenarioj,其中,j为自然数。
可选地,该方法还包括:根据预设的公共文化服务个体的特征与公共文化服务场景之间的关联关系,生成公共文化服务个体到公共文化服务场景之间的预设映射规则;其中,所述公共文化服务个体的特征包括所述公共文化服务个体的槽值对序列。
可选地,该方法还包括:训练所述智能体模型。
可选地,所述训练所述智能体模型,包括:将预设公共文化服务个体的槽值对序列输入到所述智能体模型,通过所述智能体模型为所述槽值对序列中每个槽值对输出一个映射置信度ρi,并选择大于设置映射置信度阈值的映射置信度ρi作为合格的映射置信度ρi;
将合格的映射置信度ρi的槽值对序列输入到槽值对子序列分类模型,通过所述槽值对子序列分类模型对该槽值对序列进行二分类,基于分类结果对每个槽值对生成一个奖励值R(ρi),将奖励值R(ρi)输入给所述智能体模型,以使所述智能体模型根据该奖励值R(ρi)进一步根据所述预设公共文化服务个体的槽值对序列进行训练;
重复执行上述步骤,直到得到收敛的智能体模型和槽值对子序列分类模型。
可选地,所述槽值对子序列分类模型的第一目标函数为:
pk为当前公共文化服务个体属于第k个公共文化服务场景的概率,pk的值由槽值对子序列分类模型生成;Scenario表示所有场景的集合,Scenario={Scenario1,Scenario2,…,Scenarioj,…},|Scenario|表示该集合的大小,即所有场景的数量。
可选地,该方法还包括:通过随机梯度下降方式训练所述槽值对子序列分类模型的参数。
可选地,所述智能体模型的第二目标函数为:
其中,ρi是当前时间步智能体模型所输出的槽值对的权重,即子序列中槽值对对应的动作,由所述智能体模型生成;R(ρi)表示该动作对应的奖励值,即子序列中槽值对对应的奖励值,由所述智能体模型生成,表示当前槽值对对应的奖励值的概率值,由所述智能体模型生成。
可选地,该方法还包括:通过随机梯度下降方式训练所述智能体模型的参数。
第二方面,本发明提供了一种公共文化服务个体映射到公共文化服务场景的装置,该装置包括:接收单元,用于接收公共文化服务个体的槽值对序列SVx={(S1,V1),…,(Sn,Vn)};其中,所述槽值对序列内包括多组槽向量Sn和槽值向量Vn,n为自然数,且所述槽值对序列内的槽向量Sn和槽值向量Vn相互唯一对应;处理单元,用于将所述槽值对序列带入预设的智能体模型,并通过所述智能体模型按照预设映射规则,将所述公共文化服务个体映射到对应的公共文化服务场景。
第三方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有信号映射的计算机程序,所述计算机程序被至少一个处理器执行时,以实现上述任一种所述的公共文化服务个体映射到公共文化服务场景的方法。
本发明有益效果如下:
本发明仅需要接收公共文化服务个体的槽值对序列,并将接收到的公共文化服务个体的槽值对序列带入预设的智体模型,并通过智能体模型按照预设映射规则,将公共文化服务个体映射到对应的公共文化服务场景,即,本发明可简洁且准确地将公共文化服务个体映射到对应的公共文化服务场景中,从而满足公共文化服务资源的推荐、公共文化服务关联分析等诸多场景的需求,继而有效解决了现有技术中将公共文化服务个体映射到对应的公共文化服务场景的效率低的问题。
附图说明
图1是本发明第一实施例提供的公共文化服务个体映射到公共文化服务场景的方法的流程示意图;
图2是本发明第一实施例提供的公共文化服务个体特征与公共文化服务场景之间的映射推荐示意图;
图3是本发明第一实施例提供的公共文化服务特征与场景映射推荐规则自动生成模型结构图;
图4是本发明第二实施例提供的公共文化服务个体映射到公共文化服务场景的装置的结构示意图。
具体实施方式
本发明实施例通过智能体模型按照预设映射规则,自动将公共文化服务个体映射到对应的公共文化服务场景,从而大大提高了公共文化服务个体与公共文化服务场景之间的映射效率。以下结合附图以及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不限定本发明。
在公共文化服务领域,将文旅专家、文旅作品、文旅群团等公共文化服务个体根据其特征推荐至不同的公共文化服务场景,有着重要实践意义和应用价值,能够打通公共文化服务个体与公共文化服务场景之间以及公共文化服务个体之间的通联,提供跨域的公共文化服务调配和互动。例如,将声乐专家推荐到中秋晚会参演场景、老年大学声乐课程教学场景、声乐类群团辅导场景等,可以便于公共文化服务资源充分关联调配,实现价值最大化。因此,需要制定和生成相关规则来实现公共文化服务个体的特征(例如某声乐艺术家的“专长”属性为“声乐”、其“社会任职”属性为“上海市音乐家协会声乐专业委员会委员”等)到公共文化服务场景的映射推荐。以往研究通常通过业务专家制定规则模板库,或者通过关联规则挖掘算法生成规则模板库,但是这些传统种方法存在如下弊端:
对于基于专家人工编制规则模板库的方法,其过度依赖专家经验,所制定的模板无法有效适用于新的公共文化服务场景,而且规则模板的制定过程过于耗费人力;对于关联规则挖掘算法,该类算法通过挖掘大规模数据集中频繁共现的数据项的集合来生成规则,并且该类方法通常适合于数据项之间差异较小的数据集,然而在公共文化服务领域中常常需要面临挖掘不同类型数据项之间的规则的现实问题,例如同一公共文化服务个体的不同特征可能可以映射对应到不同的公共文化服务场景中,另外关联规则挖掘算法的时间复杂度较高,计算开销较大,导致时效性和可扩展性较差。
因此,如何研究基于深度学习技术的自动化规则生成策略,是一个亟待解决的关键应用问题。
针对上述问题,本发明第一实施例提供了一种公共文化服务个体映射到公共文化服务场景的方法,参见图1,该方法包括:
S101、接收公共文化服务个体的槽值对序列SVx={(S1,V1),…,(Sn,Vn)};其中,所述槽值对序列内包括多组槽向量Sn和槽值向量Vn,n为自然数,且所述槽值对序列内的槽向量Sn和槽值向量Vn相互唯一对应;
S102、将所述槽值对序列带入预设的智能体模型,并通过所述智能体模型按照预设映射规则,将所述公共文化服务个体映射到对应的公共文化服务场景Scenarioj,其中,j为自然数。
总体来说,本发明实施例通过智能体模型按照预设映射规则,自动将公共文化服务个体映射到对应的公共文化服务场景,从而大大提高了公共文化服务个体与公共文化服务场景之间的映射效率以及映射的准确率。
需要说明的是,本发明实施例是需要根据预设的公共文化服务个体的特征与公共文化服务场景之间的关联关系,生成公共文化服务个体到公共文化服务场景之间的预设映射规则;其中,所述公共文化服务个体的特征包括所述公共文化服务个体的槽值对序列。
通常,公共文化服务个体的特征可以用由槽位(Slot)和槽值(Value)构成的“槽-值”对来表示。例如,某声乐艺术家的“专长”槽位的槽值为“声乐”、其“社会任职”槽位的槽值为“上海市音乐家协会声乐专业委员会委员”等,这是一种结构化的数据建模与表征方式。公共文化服务个体的特征与公共文化服务场景之间的映射推荐具体如图2所示。
本发明实施例将公共文化服务特征到公共文化服务场景的映射规则模板形式定义如下:[(S1,V1,ρ1),…,(Sn,Vn,ρn)]→Scenarioj
其中,(Si,Vi,ρi)表示槽值三元组,Si表示槽位,Vi表示槽位值,ρi表示槽值对(Si,Vi)映射到场景Scenarioj的置信度。在传统人工编制规则模板的策略下,ρi=1,或者在对规则模板进行形式化定义的时候直接忽略置信度ρi。存在一个槽值对(Si,Vi)映射到多个公共文化服务场景,而其针对不同公共文化服务场景下的置信度ρi不同。也就是说,一个公共文化服务个体(如一位文旅专家等)会拥有多个槽值对,而每个槽值对可以映射到多个公共文化服务场景,因此一个公共文化服务个体可以映射到多个公共文化服务场景中。
本发明旨在探索在无监督训练条件下,自动生成上述公共文化服务个体特征到公共文化服务场景映射规则的方法,以求在实际应用中降低人力成本和提高规则模板的可扩展性。公共文化服务特征与公共文化服务场景映射规则的示例如表1所示。
表1公共文化服务特征与公共文化服务场景映射推荐规则的示例表
槽值对序列 | 公共文化服务场景 |
(身份,歌唱家),(专长,声乐),(社会任职,上海市音乐家协会声乐专业委员会),(职称,副教授),… | 声乐类群团辅导 |
(类型,舞蹈),(荣誉,“大地芳菲”浦东新区群众文艺创作节目汇演舞蹈专场),(头衔,2015年上海市百强歌舞队),… | 中秋晚会参演 |
(类型,文化馆),(容量,50),(隔音性能,强),(开放时间,全天),… | 器乐排练 |
(年龄段,6065),(专长,管乐),… | 老年大学管乐课程报名 |
…… | …… |
给定:公共文化服务个体x,其槽值对序列表示为:SVx={(S1,V1),…,(Sn,Vn)};公共文化服务场景Scenarioj。已知该公共文化服务个体x能够映射到该公共文化服务场景Scenarioj。
本发明实施例所设计的公共文化服务特征与公共文化服务场景映射规则自动生成模型,旨在从槽值对序列SVx={(S1,V1),…,(Sn,Vn)}中,自动选择能够映射到公共文化服务场景Scenarioj的槽值对子序列SV′x={(Si,Vi)|ρi>0.5,(Si,Vi)∈SVx},即生成公共文化服务特征与公共文化服务场景映射规则:{(Si,Vi)|ρi>0.5}→Scenarioj。需要解决两个关键问题:
首先需要设计一个神经网络模型为槽值对(Si,Vi)生成非离散的权重ρi,当ρi>0.5时保留该槽值对,该槽值对应该加入到当前公共文化服务场景的规则中,否则舍弃该槽值对。把公共文化服务个体x的所包含的所有槽值对视为序列,为每个槽值对生成权重的过程可以建模成序列标注(Sequence Labeling)任务,但是由于没有训练数据,所以无法使用监督学习技术来训练模型;然而,整个槽值对序列是具有标签的,即当前公共文化服务个体x是否可以映射到当前公共文化服务场景Scenarioj是已知的,因此整个问题可以建模成一个强化学习问题从而训练一个智能体(Agent)来完成上述为每个槽值对(Si,Vi)赋予权重ρi的工作,权重ρi的生成即为该智能体的动作(Action)。最终,智能体会选择ρi>0.5的槽值对(Si,Vi)组成槽值对子序列作为输出。
其次,在强化学习策略中,需要为智能体返回奖励(Reward)值来引导智能体实现自学习,所以奖励值的生成也是需要解决的关键问题。本发明将判断智能体生成的ρi>0.5的槽值对子序列是否可以映射到当前公共文化服务场景,视为一个序列分类(SequenceClassification)问题。因此,可以训练一个基于卷积神经网络的分类器(例如TextCNN分类器等)。将智能体生成的槽值对子序列SV′x作为该分类器的输入,该分类器的输出为该槽值对子序列SV′x中每个槽值对是否能够映射到当前公共文化服务场景。
综上,本发明所设计的公共文化服务特征与公共文化服务场景映射规则自动生成模型,主要包括如下两个模块(如图3所示),这两个模块交替迭代进行,模型收敛时,智能体模块所生成的槽值对子序列SV′x={(Si,Vi)|ρi>0.5,(Si,Vi)∈SVx},即可构成规则{(Si,Vi)|ρi>0.5}→Scenarioj。两个模块的详情,如下所述:
本发明实施例的智能体模块包括三层,分别是输入层、记忆层、动作层。其中,输入层所接受的输入,分别是槽向量和槽值向量,槽向量和槽值向量通过拼接作为输入层的输入(在模型初始化阶段,模型为每个槽和槽值均生成一个随机向量,随着模型不断自学习和自训练,槽向量和槽值向量均会变得有意义)。记忆层的每个单元均是一个双向LSTM网络,利用LSTM网络的记忆能力和隐状态双向传递能力,使每个时间步输出的隐状态都能够包含较长距离之外的信息和上下文信息,有效克服“梯度消失”问题。动作层的每一个单元是一个单向LSTM网络,每个LSTM网络的输入包含如下:记忆层当前时间步的输出、动作层前一个单向LSTM网络的输出、当前公共文化服务个体x所对应的公共文化服务场景Scenarioj的向量(在模型初始化阶段,模型为每个公共文化服务场景均生成一个随机向量,随着模型不断自学习和自训练,公共文化服务场景向量会变得有意义)。
本发明实施例在智能体模型对当前公共文化服务个体x的所有槽值对{(S1,V1),…,(Sn,Vn)}完成分析决策后,会为每个槽值对(Si,Vi)出一个权重作ρi为动作(Action)。最终,选择选择ρi>0.5的槽值对(Si,Vi)组成槽值对子序列SV′x={(Si,Vi)|ρi>0.5,(Si,Vi)∈SVx}作为智能体模块的输出,同时作为槽值对子序列分类模型的输入。
由于强化学习模型中没有标签,因此使用奖励值视为标签引入到智能体模块的损失函数中,构建基于交叉熵的目标函数,如下所示:
其中,Θ1表示智能体模型所有需要训练的参数;|SV′x|表示槽值对子序列的规模;ρi表示当前时间步智能体模型所输出的动作,即子序列中槽值对(Si,Vi)∈SV′x对应的动作(即槽值对(Si,Vi)的权重),R(ρi)表示该动作对应的奖励值,即子序列中槽值对(Si,Vi)∈SV′x对应的奖励值;表示当前槽值对(Si,Vi)对应的奖励值的概率值,通过softmax方式计算得到。
本发明实施例中,可以使用多种模型来构建槽值对子序列分类模型,以基于卷积神经网络的TextCNN模型为例。槽值对子序列分类模型以槽值对子序列SV′x作为输入,如果分类正确则为槽值对子序列中每个槽值(Si,Vi)∈SV′x={(Si,Vi)|ρi>0.5,(Si,Vi)∈SVx}对生成一个奖励值R(ρi),反馈给智能体模型用于训练参数。
槽值对子序列分类模型的训练过程包括:将公共文化服务个体到公共文化服务场景映射任务建模成一个分类任务,由于一个公共文化服务个体可以映射到多个公共文化服务场景,因此该分类任务是一个多标签分类任务。给定某公共文化服务个体x,本发明使用文本分类研究中常用的交叉熵损失函数作为目标函数:
其中,Θ2表示槽值对子序列分类模型所有需要训练的参数;|Scenario|表示标签个数(即公共文化服务场景个数);表示当前公共文化服务个体是否属于当前标签(即当前公共文化服务个体是否属于公共文化服务场景);/>表示当前公共文化服务个体可以映射到当前标签的概率值(即当前公共文化服务个体属于当前公共文化服务场景的概率分布),通过sigmoid方式计算得到。
下面将通过一个具体的例子对本发明所述的方法进行详细的解释和说明:
本发明实施种的训练阶段具体包括:
训练数据包括若干公共文化服务个体槽值对序列表和公共文化服务场景的组合:
(1)公共文化服务个体x,其槽值对序列表示为:SVx={(S1,V1),…,(Sn,Vn)};
(2)公共文化服务场景Scenarioj。
已知该公共文化服务个体x能够映射到该公共文化服务场景Scenarioj。
步骤1:智能体模型和槽值对子序列分类模型的参数随机初始化。
步骤2:将个体x的所有槽值对{(S1,V1),…,(Sn,Vn)}输入到智能体模型,依次经过输入层、记忆层、动作层,为每个槽值对(Si,Vi)输出一个权重作ρi为动作(Action)。选择选择ρi>0.5的槽值对(Si,Vi)组成槽值对子序列SV′x={(Sl,Vl)|ρl>0.5,(Sl,Vl)∈SVx}作为智能体模块的输出。
步骤3:使用TextCNN模型作为槽值对子序列分类模型的具体实现。将步骤2生成的SV′x={(Sl,Vl)|ρl>0.5,(Sl,Vl)∈SVx}输入到槽值对子序列分类模型。槽值对子序列分类模型对SV′x={(Sl,Vl)|ρl>0.5,(Sl,Vl)∈SVx}进行二分类:{Scenarioj,非Scenarioj}。槽值对子序列分类模型基于分类结果,为每个槽值(Sl,Vl)∈SV′x={(Sl,Vl)|ρl>0.5,(Sl,Vl)∈SVx}对生成一个奖励值R(ρl),将奖励值R(ρl)输入给智能体模型。使用如下公式作为目标函数,使用随机梯度下降方式训练槽值对子序列分类模型的参数:
步骤4:使用如下公式作为目标函数,使用随机梯度下降方式训练智能体模型的参数:
步骤5:重复步骤2、步骤3、步骤4,直至智能体模型和槽值对子序列分类模型的目标函数均达到收敛状态,训练结束。
也就是说,本发明实施例是将公共文化服务特征与公共文化服务场景映射推荐任务建模成序列标注和序列分类任务,构建了基于强化学习的公共文化服务特征与公共文化服务场景映射推荐规则自动生成模型,并且本发明实施例所提出的模型能够实现从无训练数据或者少训练数据的环境中,自动感知和建模感知公共文化服务特征与公共文化服务场景之间的关联关系。实践表明,本发明的适用范围广,可在公共文化服务资源推荐、公共文化服务关联分析等诸多任务中使用。
具体实施时,本发明实施例中的测试阶段具体包括:
测试数据包括若干公共文化服务个体槽值对序列表和公共文化服务场景的组合:
(1)公共文化服务个体x,其槽值对序列表示为:SVx={(S1,V1),…,(Sn,Vn)};
(2)公共文化服务场景Scenarioj。
已知该公共文化服务个体x能够映射到该公共文化服务场景Scenarioj。
通过将个体x的所有槽值对{(S1,V1),…,(Sn,Vn)}输入到智能体模型,依次经过输入层、记忆层、动作层,为每个槽值对(Si,Vi)输出一个权重作ρi为动作(Action)。选择选择ρi>0.5的槽值对(Si,Vi)组成槽值对子序列SV′x={(Sl,Vl)|ρl>0.5,(Sl,Vl)∈SVx}作为能够映射到公共文化服务场景Scenarioj的槽值对子序列,即生成公共文化服务特征与公共文化服务场景映射规则:{(Si,Vi)|ρi>0.5}→Scenarioj。预测过程结束。
综上可知,本发明实施例提供的公共文化服务特征与场景映射推荐规则自动生成方法,至少具有以下有益效果:
本发明是基于强化学习原理,可利用无监督策略自动感知公共文化服务特征与公共文化服务场景之间的关联关系并生成规则。另外,本发明具备自动化和扩展性强的优点,能够应用于无训练数据或者训练数据较少的情况,克服了以往研究对专家经验的依赖,也避免了以往模型对数据集中数据项之间差异的限制要求。
本发明第二实施例提供了一种公共文化服务个体映射到公共文化服务场景的装置,参见图4,包括:接收单元,用于接收公共文化服务个体的槽值对序列SVx={(S1,V1),…,(Sn,Vn)};其中,所述槽值对序列内包括多组槽向量Sn和槽值向量Vn,n为自然数,且所述槽值对序列内的槽向量Sn和槽值向量Vn相互唯一对应;处理单元,用于将所述槽值对序列带入预设的智能体模型,并通过所述智能体模型按照预设映射规则,将所述公共文化服务个体映射到对应的公共文化服务场景。
总体来说,本发明实施例通过智能体模型按照预设映射规则,自动将公共文化服务个体映射到对应的公共文化服务场景,从而大大提高了公共文化服务个体与公共文化服务场景之间的映射效率以及映射的准确率。
进一步地,本发明实施例是通过处理单元来根据预设的公共文化服务个体的特征与公共文化服务场景之间的关联关系,生成公共文化服务个体到公共文化服务场景之间的预设映射规则,并训练所述智能体模型。
本发明实施例的相关内容可参见本发明第一实施例进行理解,在此不做详细论述。
本发明第三实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有信号映射的计算机程序,所述计算机程序被至少一个处理器执行时,以实现本发明第一实施例中任一种所述的公共文化服务个体映射到公共文化服务场景的方法。
本发明实施例的相关内容可参见本发明第一实施例和第二实施例进行理解,在此不做详细论述。
尽管为示例目的,已经公开了本发明的优选实施例,本领域的技术人员将意识到各种改进、增加和取代也是可能的,因此,本发明的范围应当不限于上述实施例。
Claims (7)
1.一种公共文化服务个体映射到公共文化服务场景的方法,其特征在于,包括:
接收公共文化服务个体的槽值对序列SVx={(S1,V1),…,(Sn,Vn)};其中,所述槽值对序列内包括多组槽向量Sn和槽值向量Vn,n为自然数,且所述槽值对序列内的槽向量Sn和槽值向量Vn相互唯一对应;
将所述槽值对序列带入预设的智能体模型,并通过所述智能体模型按照预设映射规则,将所述公共文化服务个体映射到对应的公共文化服务场景Scenarioj,其中,j为自然数;
该方法还包括:训练所述智能体模型;
所述训练所述智能体模型,包括:将预设公共文化服务个体的槽值对序列输入到所述智能体模型,通过所述智能体模型为所述槽值对序列中每个槽值对输出一个映射置信度ρi,并选择大于设置映射置信度阈值的映射置信度ρi作为合格的映射置信度ρi;
将合格的映射置信度ρi的槽值对序列输入到槽值对子序列分类模型,通过所述槽值对子序列分类模型对该槽值对序列进行二分类,基于分类结果对每个槽值对生成一个奖励值R(ρi),将奖励值R(ρi)输入给所述智能体模型,以使所述智能体模型根据该奖励值R(ρi)进一步根据所述预设公共文化服务个体的槽值对序列进行训练;
重复执行上述步骤,直到得到收敛的智能体模型和槽值对子序列分类模型;
所述槽值对子序列分类模型的第一目标函数为:
pk为当前公共文化服务个体属于第k个公共文化服务场景的概率,pk的值
由槽值对子序列分类模型生成;Scenario表示所有场景的集合,Scenario={Scenario1,Scenario2,…,Scenarioj,…},|Scenario|表示该集合的大小,即所有场景的数量。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:
根据预设的公共文化服务个体的特征与公共文化服务场景之间的关联关系,生成公共文化服务个体到公共文化服务场景之间的预设映射规则;
其中,所述公共文化服务个体的特征包括所述公共文化服务个体的槽值对序列。
3.根据权利要求1所述的方法,其特征在于,该方法还包括:
通过随机梯度下降方式训练所述槽值对子序列分类模型的参数。
5.根据权利要求4所述的方法,其特征在于,该方法还包括:
通过随机梯度下降方式训练所述智能体模型的参数。
6.一种公共文化服务个体映射到公共文化服务场景的装置,其特征在于,包括:
接收单元,用于接收公共文化服务个体的槽值对序列SVx={(S1,V1),…,(Sn,Vn)};其中,所述槽值对序列内包括多组槽向量Sn和槽值向量Vn,n为自然数,且所述槽值对序列内的槽向量Sn和槽值向量Vn相互唯一对应;
处理单元,用于将所述槽值对序列带入预设的智能体模型,并通过所述智能体模型按照预设映射规则,将所述公共文化服务个体映射到对应的公共文化服务场景;
所述处理单元还用于,训练所述智能体模型;所述训练所述智能体模型,包括:将预设公共文化服务个体的槽值对序列输入到所述智能体模型,通过所述智能体模型为所述槽值对序列中每个槽值对输出一个映射置信度ρi,并选择大于设置映射置信度阈值的映射置信度ρi作为合格的映射置信度ρi;将合格的映射置信度ρi的槽值对序列输入到槽值对子序列分类模型,通过所述槽值对子序列分类模型对该槽值对序列进行二分类,基于分类结果对每个槽值对生成一个奖励值R(ρi),将奖励值R(ρi)输入给所述智能体模型,以使所述智能体模型根据该奖励值R(ρi)进一步根据所述预设公共文化服务个体的槽值对序列进行训练;重复执行上述步骤,直到得到收敛的智能体模型和槽值对子序列分类模型;
pk为当前公共文化服务个体属于第k个公共文化服务场景的概率,pk的值由槽值对子序列分类模型生成;Scenario表示所有场景的集合,Scenario={Scenario1,Scenario2,…,Scenarioj,…},|Scenario|表示该集合的大小,即所有场景的数量。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有信号映射的计算机程序,所述计算机程序被至少一个处理器执行时,以实现权利要求1-5中任意一项所述的公共文化服务个体映射到公共文化服务场景的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010607739.4A CN111814958B (zh) | 2020-06-30 | 2020-06-30 | 公共文化服务个体映射到公共文化服务场景的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010607739.4A CN111814958B (zh) | 2020-06-30 | 2020-06-30 | 公共文化服务个体映射到公共文化服务场景的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111814958A CN111814958A (zh) | 2020-10-23 |
CN111814958B true CN111814958B (zh) | 2023-06-20 |
Family
ID=72855633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010607739.4A Active CN111814958B (zh) | 2020-06-30 | 2020-06-30 | 公共文化服务个体映射到公共文化服务场景的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111814958B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109739965A (zh) * | 2018-12-29 | 2019-05-10 | 深圳前海微众银行股份有限公司 | 跨领域对话策略的迁移方法及装置、设备、可读存储介质 |
CN110427560A (zh) * | 2019-08-08 | 2019-11-08 | 腾讯科技(深圳)有限公司 | 一种应用于推荐系统的模型训练方法以及相关装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10540967B2 (en) * | 2016-11-14 | 2020-01-21 | Xerox Corporation | Machine reading method for dialog state tracking |
-
2020
- 2020-06-30 CN CN202010607739.4A patent/CN111814958B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109739965A (zh) * | 2018-12-29 | 2019-05-10 | 深圳前海微众银行股份有限公司 | 跨领域对话策略的迁移方法及装置、设备、可读存储介质 |
CN110427560A (zh) * | 2019-08-08 | 2019-11-08 | 腾讯科技(深圳)有限公司 | 一种应用于推荐系统的模型训练方法以及相关装置 |
Non-Patent Citations (2)
Title |
---|
Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset;Abhinav Rastogi等;《arxiv》;20190912;第1-11页 * |
强化学习在智能对话上的应用;腾讯技术工程;《https://www.sohu.com/a/304325398_100093134》;20190328;第1-7页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111814958A (zh) | 2020-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Luo et al. | Tourism attraction selection with sentiment analysis of online reviews based on probabilistic linguistic term sets and the IDOCRIW-COCOSO model | |
US20220398486A1 (en) | Learning content recommendation system based on artificial intelligence learning and operating method thereof | |
Hu | Teaching evaluation system by use of machine learning and artificial intelligence methods | |
CN111488734A (zh) | 基于全局交互和句法依赖的情感特征表示学习系统及方法 | |
CN111737535B (zh) | 一种基于元结构和图神经网络的网络表征学习方法 | |
CN106778832A (zh) | 基于多目标优化的高维数据半监督集成分类方法 | |
Saito et al. | Learning path recommender system based on recurrent neural network | |
CN113254782B (zh) | 问答社区专家推荐方法及系统 | |
CN113344053A (zh) | 一种基于试题异构图表征与学习者嵌入的知识追踪方法 | |
CN114201684A (zh) | 一种基于知识图谱的自适应学习资源推荐方法及系统 | |
CN115114421A (zh) | 一种问答模型训练方法 | |
CN111930981A (zh) | 一种草图检索的数据处理方法 | |
CN116757460A (zh) | 基于深度学习的应急指挥调度平台构建方法及系统 | |
Baruah et al. | Data augmentation and deep neuro-fuzzy network for student performance prediction with MapReduce framework | |
CN115329210A (zh) | 一种基于交互图分层池化的虚假新闻检测方法 | |
CN117711001B (zh) | 图像处理方法、装置、设备和介质 | |
CN115238036A (zh) | 一种基于图注意力网络和文本信息的认知诊断方法及装置 | |
CN109543114A (zh) | 异构信息网络链接预测方法、可读存储介质和终端 | |
CN114417063A (zh) | 一种基于多视图的图神经网络的重要节点识别方法 | |
CN116882503A (zh) | 基于知识推理模型的科技创新服务决策支持方法 | |
CN111814958B (zh) | 公共文化服务个体映射到公共文化服务场景的方法及装置 | |
CN114972959B (zh) | 深度学习中样本生成和类内排序损失的遥感图像检索方法 | |
CN111292062A (zh) | 基于网络嵌入的众包垃圾工人检测方法、系统及存储介质 | |
CN109522954A (zh) | 异构信息网络链接预测装置 | |
CN115730752A (zh) | 基于知识兴趣网络的自适应学习路径规划方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |