CN116415047B - 一种基于国家形象资源推荐的资源筛选方法及系统 - Google Patents
一种基于国家形象资源推荐的资源筛选方法及系统 Download PDFInfo
- Publication number
- CN116415047B CN116415047B CN202310678985.2A CN202310678985A CN116415047B CN 116415047 B CN116415047 B CN 116415047B CN 202310678985 A CN202310678985 A CN 202310678985A CN 116415047 B CN116415047 B CN 116415047B
- Authority
- CN
- China
- Prior art keywords
- resource
- image
- country
- evaluation
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012216 screening Methods 0.000 title claims abstract description 86
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000011156 evaluation Methods 0.000 claims abstract description 94
- 230000005540 biological transmission Effects 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 51
- 238000013210 evaluation model Methods 0.000 claims description 44
- 239000011159 matrix material Substances 0.000 claims description 43
- 238000004458 analytical method Methods 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 8
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 abstract description 6
- 230000000694 effects Effects 0.000 abstract description 3
- 238000012545 processing Methods 0.000 description 11
- 238000010276 construction Methods 0.000 description 6
- 238000013075 data extraction Methods 0.000 description 4
- 230000008451 emotion Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 239000004973 liquid crystal related substance Substances 0.000 description 4
- 238000013507 mapping Methods 0.000 description 3
- 230000002996 emotional effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Linguistics (AREA)
- Mathematical Analysis (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Algebra (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种基于国家形象资源推荐的资源筛选方法及系统,该方法包括如下步骤:获取国家形象的国际宣传任务生成请求并得到资源待推荐国家集合;基于资源待推荐国家集合获取资源指数;将传播主题和补充描述信息分词,得到国家形象描述词组;提取相似度最高的K个目标国家形象资源组成初始候选资源集合;对初始候选资源集合中的目标国家形象资源进行资源评价,得到所有目标国家形象资源被评价后的基准候选资源集合;构建资源筛选模型,并构造筛选问题目标函数;通过数学求解器求解筛选问题目标函数,并基于求解结果生成资源推荐报告。本发明具有在进行国家形象的国际宣传过程中,从国家形象资源数据库中高效精准地筛选出合适形象资源的效果。
Description
技术领域
本发明属于跨语言国际传播领域,具体是涉及到一种基于国家形象资源推荐的资源筛选方法及系统。
背景技术
国家形象的构建依托于国家形象资源库中海量、多模态的国家形象资源,在进行国家形象资源推荐的任务过程中,通常需要从国家形象资源库中筛选出合适的国家形象资源。现有技术中,往往需要根据国家形象资源推荐任务的关键词、需求资源属性、需求资源分类等维度在国家形象资源库中检索,所检索出的形象资源集合中仍然包含大量的国家形象资源,此时需要逐个浏览形象资源集合中的国家形象资源,并根据国家形象资源推荐任务进一步筛选出最优的国家形象资源。整个筛选过程不仅需要耗费大量的人力,且筛选效率低下。
发明内容
本发明提供一种基于国家形象资源推荐的资源筛选方法及系统,以解决从国家形象资源库中筛选合适国家形象资源的过程需要耗费大量人力和时间的问题。
第一方面,本发明提供一种基于国家形象资源推荐的资源筛选方法,该方法包括如下步骤:
获取国家形象的国际宣传任务生成请求,所述国际宣传任务生成请求包括传播主题和所述传播主题的补充描述信息;
结合所述传播主题和所述补充描述信息进行语义分析,并基于所述语义分析的分析结果得到资源待推荐国家集合;
基于所述资源待推荐国家集合获取资源指数;
将所述传播主题和所述补充描述信息分词,得到国家形象描述词组;
根据所述国家形象描述词组从预设的国家形象资源数据库中提取相似度最高的K个目标国家形象资源组成初始候选资源集合;
构建资源评价模型,并将所述初始候选资源集合输入至所述资源评价模型进行资源评价,得到所有所述目标国家形象资源被评价后的基准候选资源集合;
结合所述资源待推荐国家集合、所述资源指数和所述基准候选资源集合构建资源筛选模型,并构造筛选问题目标函数;
通过数学求解器求解所述筛选问题目标函数,并基于求解结果从所述基准候选资源集合筛选出最优国家形象资源组成最优资源集合。
可选的,所述根据所述国家形象描述词组从预设的国家形象资源数据库中提取相似度最高的K个目标国家形象资源组成初始候选资源集合包括如下步骤:
将所述国家形象描述词组转换为描述词组词向量,并将预设的国家形象资源数据库中的所有国家形象资源均转换为形象资源词向量;
根据向量余弦公式分别计算各个所述形象资源词向量与所述描述词组词向量之间的相似度;
选取所述相似度最高的K个所述形象资源词向量作为目标形象资源词向量,并从所述国家形象资源数据库中提取所有所述目标形象资源词向量对应的目标国家形象资源组成初始候选资源集合。
可选的,所述构建资源评价模型,并将所述初始候选资源集合输入至所述资源评价模型进行资源评价,得到所有所述目标国家形象资源被评价后的基准候选资源集合包括如下步骤:
基于卷积神经网络构建初始评价模型并获取国家形象资源的历史资源评分;
通过所述历史资源评分训练所述初始评价模型,得到训练后的资源评价模型;
将所述初始候选资源集合输入至所述资源评价模型中,通过调整所述资源评价模型的模型参数获得所述目标国家形象资源在各个评估指标下的实数评分数据;
对于同一所述目标国家形象资源的任一所述评估指标,判断所述评估指标是否包含多个所述实数评分数据;
若所述评估指标仅包含一个所述实数评分数据,则将所述实数评分数据作为所述评估指标的指标评分;
若所述评估指标包含多个所述实数评分数据,则统计所述实数评分数据的数据数量;
判断所述数据数量是否超出预设的数量阈值;
若所述数据数量未超出所述数量阈值,则根据所有所述实数评分数据中的最高评分和最低评分确定所述评估指标的指标评分;
若所述数据数量超出所述数量阈值,则构建所述评估指标的云模型,并结合所述云模型和所有所述实数评分数据计算得到所述评估指标的指标评分;
将每个所述评估指标均具有所述指标评分的所有所述目标国家形象资源组成为基准候选资源集合。
可选的,所述构建所述评估指标的云模型,并结合所述云模型和所有所述实数评分数据计算得到所述评估指标的指标评分包括如下步骤:
构建所述评估指标的云模型;
基于所有所述实数评分数据计算所述云模型中的所有模型参数;
根据所述模型参数计算得到所述评估指标的指标评分。
可选的,所述模型参数包括模型期望、模型熵/>和模型超熵/>,所述模型期望/>的计算公式如下:
式中:表示所述数据数量,/>表示所述评估指标的第t个所述实数评分数据;
所述模型熵的计算公式如下:
所述模型超熵的计算公式如下:
。
可选的,所述根据所述模型参数计算得到所述评估指标的指标评分的计算公式如下:
式中:表示所述指标评分,/>表示所述模型超熵/>的影响系数。
可选的,所述资源指数包括所述资源待推荐国家集合的下限向量和资源质量期望,所述基准候选资源集合中的每个所述目标国家形象资源均在所述资源评价的各个评估指标中获得有指标评分;
所述结合所述资源待推荐国家集合、所述资源指数和所述基准候选资源集合构建资源筛选模型,并构造筛选问题目标函数包括如下步骤:
基于所述基准候选资源集合从所述国家形象资源数据库中获取文化禁忌国家集合;
结合所述文化禁忌国家集合和所述资源待推荐国家集合生成冲突矩阵;
结合所述资源质量期望和所述指标评分,计算得到所述资源待推荐国家集合和所述基准候选资源集合之间的模糊决策矩阵;
采用模糊层次分析法确定所有所述评估指标的权重向量;
结合所述模糊决策矩阵和所述权重向量计算得到所述资源待推荐国家集合和所述基准候选资源集合之间的综合适配度矩阵;
基于E-CARGO模型并结合所述综合适配度矩阵和所述下限向量构建筛选问题目标函数。
可选的,所述综合适配度矩阵中矩阵元素的计算公式如下:
式中:表示所述矩阵元素,d表示所述评估指标的数量,/>表示第k个所述评估指标的所述权重向量,/>表示第i个所述目标国家形象资源对应所述资源待推荐国家集合中第j个待推荐国家的所述资源质量期望在第k个所述评估指标的可能度。
可选的,所述筛选问题目标函数的表达式如下:
式中:表示适配度总和,m表示所述基准候选资源集合中所述目标国家形象资源的数量,n表示所述待推荐国家的数量,S表示所述冲突矩阵,T表示资源推荐矩阵,L表示所述下限向量。
第二方面,本发明还提供一种基于国家形象资源推荐的资源筛选系统,所述系统包括:
用户交互处理模块,用于获取宣传任务生成请求,所述宣传任务生成请求包括传播主题、传播对象和所述传播主题的补充描述信息;
任务处理模块,用于结合所述传播主题和所述补充描述信息进行语义分析,基于所述语义分析的分析结果得到资源待推荐国家集合,并根据所述资源待推荐国家集合获取资源指数,还用于将所述传播主题和所述补充描述信息分词,得到国家形象描述词组;
数据提取模块,用于根据所述国家形象描述词组从预设的国家形象资源数据库中提取相似度最高的K个目标国家形象资源组成初始候选资源集合;
资源评价模块,用于构建资源评价模型,并将所述初始候选资源集合输入至所述资源评价模型进行资源评价,得到所有所述目标国家形象资源被评价后的基准候选资源集合;
目标函数构建模块,用于结合所述资源待推荐国家集合、所述资源指数和所述基准候选资源集合构建资源筛选模型,并构造筛选问题目标函数;
函数求解模块,用于通过数学求解器求解所述筛选问题目标函数,并基于求解结果从所述基准候选资源集合筛选出最优国家形象资源组成最优资源集合。
本发明的有益效果是:
首先获取国家形象的国际宣传任务生成请求,通过对国际宣传任务生成请求的语义分析得到资源待推荐国家集合;基于所述资源待推荐国家集合获取资源指数;将所述传播主题和所述补充描述信息分词,得到国家形象描述词组;根据所述国家形象描述词组从预设的国家形象资源数据库中提取相似度最高的K个目标国家形象资源组成初始候选资源集合;构建资源评价模型,并将所述初始候选资源集合输入至所述资源评价模型进行资源评价,得到所有所述目标国家形象资源被评价后的基准候选资源集合;结合所述资源待推荐国家集合、所述资源指数和所述基准候选资源集合构建资源筛选模型,并构造筛选问题目标函数;最终通过数学求解器求解所述筛选问题目标函数,并基于求解结果生成最优资源集合。根据上述方法,可以通过语义分析以及相似度计算可以初步提取出合适的目标国家形象资源组成初选候选资源集合,再通过资源评价模型为目标国家形象资源添加评分属性,并通过构建资源筛选模型构建筛选问题目标函数,最终求解目标函数以完成资源筛选,得到最优资源集合。相较于人工检索筛选的方式,大幅提升了从国家形象资源数据库中准确筛选出合适形象资源的效率,并节省了人力。
附图说明
图1为本发明中基于国家形象资源推荐的资源筛选方法的流程示意图。
图2为本发明中基于国家形象资源推荐的资源筛选系统的系统结构图。
具体实施方式
本发明公开一种基于国家形象资源推荐的资源筛选方法。
参照图1,基于国家形象资源推荐的资源筛选方法具体包括如下步骤:
S101.获取国家形象的国际宣传任务生成请求。
其中,国际宣传任务生成请求包括传播主题和传播主题的补充描述信息,传播主题可以理解为需要进行国际宣传传播的内容主题,传播主题的补充描述信息指为更全面阐述传播主题内涵及其内容,通过多个维度对传播主题进行的补充性描述。用户可以通过用户交互装置输入宣传任务生成请求,从而可以通过获取用户交互装置的后台数据以获取宣传任务生成请求。
S102.结合传播主题和补充描述信息进行语义分析,并基于语义分析的分析结果得到资源待推荐国家集合。
其中,资源待推荐国家集合所包含的国家为宣传任务中的国家形象资源需要传达到的其他国家。结合传播主题和补充描述信息进行语义分析,并基于语义分析的分析结果得到资源待推荐国家集合可以通过以下步骤进行:对收集到的文本进行分词、去停用词、词性标注等处理,以便进行后续的情感分析及语义分析。使用关键词提取技术对文本进行关键词提取,以提取文本中的地点关键词。补充描述信息中包含世界各个国家或地区有关情感倾向的文字描述,因此使用情感分析技术对文本进行情感分析,以了解各国家或地区的情感倾向。使用语义相似度计算技术对地点关键词进行语义相似度计算,以了解不同地点关键词之间的语义相似度。根据语义相似度计算结果,将语义相似度较高的地点以国家为单位进行合并,并筛出在情感倾向上消极态度程度最高的N个传播对象(待推荐国家),最终将N个传播对象组合为资源待推荐国家集合。
S103.基于资源待推荐国家集合获取资源指数。
其中,资源指数通常包括下限向量和资源质量期望,下限向量指每个国家至少需要推荐的国家形象资源的数量,资源质量期望指每个国家对国家形象资源的质量在各个评估指标上的期望值,形式为区间数。
S104.将传播主题和补充描述信息分词,得到国家形象描述词组。
其中,可以使用jieba分词工具对传播主题和补充描述信息进行分词,从而得到分词后的国家形象描述词组。
S105.根据国家形象描述词组从预设的国家形象资源数据库中提取相似度最高的K个目标国家形象资源组成初始候选资源集合。
其中,预设的国家形象资源数据库中预先存储有海量的国家形象资源,可以先计算出国家形象描述词组与国家形象资源数据库中所有国家形象资源之间的相似度,再根据相似度大小进行排序,选取相似度最高的K个目标国家形象资源从国家形象资源数据库中提取出来。
S106.构建资源评价模型,并将初始候选资源集合输入至资源评价模型进行资源评价,得到所有目标国家形象资源被评价后的基准候选资源集合。
其中,在生成初始候选资源集合后,可以将初始候选资源集合输入至构建出的资源评价模型中,通过资源评价模型客观评价初始候选资源集合中的目标国家形象资源,得到被评价后的基准候选资源集合。还可以将基准候选资源集合中的国家形象资源再重新输入至国家形象资源数据库中,以对国家形象资源数据库中的资源数据进行更新。国家形象资源评价指标包括但不限于要素真实、联系真实、内容新异性、报道及时性、意义建构价值、行为指导价值、接收效应和外部性。
S107.结合资源待推荐国家集合、资源指数和基准候选资源集合构建资源筛选模型,并构造筛选问题目标函数。
其中,将国家形象资源筛选问题抽象为:∑::=<E,C,O,R,A,G>。其中,E表示一个涉及多个资源和多个国家的问题环境(environment);C是E中抽象概念的类(class)集合;O是与C相关的具体对象(object)集合;R是资源待推荐国家集合(即传播对象);A是基准候选资源集合;G是工作组(group),即由资源筛选算法建立的国家形象资源组。令m=|A|,表示资源的数量;n=|R|,表示资源待推荐国家的数量;模型中的关键组件包括:
1)资源综合适配度矩阵Q:表示一个m*n的矩阵。矩阵中的元素Q ij (0≤i<m,0≤j<n)表示资源a i 对于第j个待推荐国家r j 的适配程度;
2)资源推荐矩阵T:T i,j ∈{0,1}(0≤i<m,0≤j<n),表示资源a i 是否被推荐给国家r j ,取值为1时表示a i 被推荐给r j ,取值为0时表示a i 未被推荐给r j ;
3)国家形象资源组性能ρ:表示G中资源与R中所有国家的适配度总和。ρ越大,表示所有资源与其受众国家的适配度越高,这些资源的质量将会被最大化利用,其在受众国家中的宣传效果会越好。对于一组资源筛选任务,需要最大化利用资源的质量和发挥价值,以确保所有资源的整体ρ值最高。
S108.通过数学求解器求解筛选问题目标函数,并基于求解结果从基准候选资源集合筛选出最优国家形象资源组成最优资源集合。
其中,可以按照IBM CPLEX优化包的API接口要求,将传递过来的筛选问题目标函数转换成API接口要求的格式,之后调用CPLEX优化包的cplex.solve()方法进行求解,以求得筛选问题目标函数的解。
本实施方式的实施原理为:
首先获取宣传任务生成请求,通过对宣传任务生成请求的语义分析得到资源待推荐国家集合;基于资源待推荐国家集合获取资源指数;将传播主题和补充描述信息分词,得到国家形象描述词组;根据国家形象描述词组从预设的国家形象资源数据库中提取相似度最高的K个目标国家形象资源组成初始候选资源集合;构建资源评价模型,并将初始候选资源集合输入至资源评价模型进行资源评价,得到所有目标国家形象资源被评价后的基准候选资源集合;结合资源待推荐国家集合、资源指数和基准候选资源集合构建资源筛选模型,并构造筛选问题目标函数;最终通过数学求解器求解筛选问题目标函数,并基于求解结果生成最优资源集合。根据上述方法,可以通过语义分析以及相似度计算可以初步提取出合适的目标国家形象资源组成初选候选资源集合,再通过资源评价模型为目标国家形象资源添加评分属性,并通过构建资源筛选模型构建筛选问题目标函数,最终求解目标函数以完成资源筛选,得到最优资源集合。相较于人工检索筛选的方式,大幅提升了从国家形象资源数据库中筛选出合适形象资源的效率,并节省了人力。
在其中一种实施方式中,步骤S105即根据国家形象描述词组从预设的国家形象资源数据库中提取相似度最高的K个目标国家形象资源组成初始候选资源集合具体包括如下步骤:
将国家形象描述词组转换为描述词组词向量,并将预设的国家形象资源数据库中的所有国家形象资源均转换为形象资源词向量;
根据向量余弦公式分别计算各个形象资源词向量与描述词组词向量之间的相似度;
选取相似度最高的K个形象资源词向量作为目标形象资源词向量,并从国家形象资源数据库中提取所有目标形象资源词向量对应的目标国家形象资源组成初始候选资源集合。
在本实施方式中,首先,使用Word2Vec算法将国家形象描述词组与国家形象资源数据库中所有国家形象资源转换为词向量。然后,根据词向量余弦公式计算每一资源与国家形象描述词组的相似度。举例说明:以资源a i 为例,首先取出资源a i 的标签集合中的一个标签,计算该标签与国家形象描述词组中每一词组的相似度。然后,取相似度平均值作为该标签与国家形象描述词组的相似度。
重复上述步骤,计算出资源a i 中所有标签与国家形象描述词组的相似度,取相似度平均值作为a i 与国家形象描述词组的相似度。最后,选取相似度最高的K个形象资源词向量作为目标形象资源词向量,并从国家形象资源数据库中提取所有目标形象资源词向量对应的目标国家形象资源组成初始候选资源集合。
在其中一种实施方式中,步骤S106即构建资源评价模型,并将初始候选资源集合输入至资源评价模型进行资源评价,得到所有目标国家形象资源被评价后的基准候选资源集合具体包括如下步骤:
基于卷积神经网络构建初始评价模型并获取国家形象资源的历史资源评分;
通过历史资源评分训练初始评价模型,得到训练后的资源评价模型;
将初始候选资源集合输入至资源评价模型中,通过调整资源评价模型的模型参数获得目标国家形象资源在各个评估指标下的实数评分数据;
对于同一目标国家形象资源的任一评估指标,判断评估指标是否包含多个实数评分数据;
若评估指标仅包含一个实数评分数据,则将实数评分数据作为评估指标的指标评分;
若评估指标包含多个实数评分数据,则统计实数评分数据的数据数量;
判断数据数量是否超出预设的数量阈值;
若数据数量未超出数量阈值,则根据所有实数评分数据中的最高评分和最低评分确定评估指标的指标评分;
若数据数量超出数量阈值,则构建评估指标的云模型,并结合云模型和所有实数评分数据计算得到评估指标的指标评分;
将每个评估指标均具有指标评分的所有目标国家形象资源组成为基准候选资源集合。
在本实施方式中,在生成初始候选资源集合后,可以基于卷积神经网络构建初始评价模型,并根据初始候选资源集合中的目标国家形象资源检索得到历史专家评分数据,历史专家评分数据包括目标国家形象资源在各项评估指标中专家给出的评分以及目标国家形象资源的各项属性。对资源的各项属性进行特征工程处理,包括特征选择、特征变换等,以提取出对资源评分有影响的重要特征。将历史专家评分数据划分为训练集和测试集,以训练模型和评估模型的性能。使用训练集对模型进行训练,以学习资源的评分规律,由于训练集中包含各个评估指标的训练数据,因此可以针对不同的评估指标训练模型并得到不同的模型参数。使用测试集对模型进行评估,以评估模型的性能和泛化能力。最终将初始候选资源集合输入至资源评分模型中,并通过调整不同的模型参数得到目标国家形象资源在各个评估指标下客观的实数评分数据。
由于资源评价模型对于各个评估指标可能会生成一个或多个实数评分数据,还需对各个评估指标下的实数评分数据作进一步处理以得到最终的指标评分。指标评分为区间数据,区间为[0,1.0]。举例说明,假设评估指标为“要素真实指标”,数量阈值为6。当该指标只有一个实数评分数据v时,则要素真实指标的指标评分。当该指标的实数评分数据的数据数量为2至5时,令v 1 表示该指标下实数评分数据的最小值,v 2 表示该指标下实数评分数据的最大值,则要素真实指标的指标评分/>。当该指标的实数评分数据的数据数量大于6时,则需要构建要素真实指标的云模型,并结合云模型和该指标下所有实数评分数据计算得到评估指标的指标评分。
上述构建评估指标的云模型,并结合云模型和所有实数评分数据计算得到评估指标的指标评分这一步骤具体包括如下步骤:
构建评估指标的云模型;
基于所有实数评分数据计算云模型中的所有模型参数;
根据模型参数计算得到评估指标的指标评分。
在本实施方式中,模型参数包括模型期望、模型熵/>和模型超熵/>,模型期望/>的计算公式如下:
式中:表示数据数量,/>表示评估指标的第t个实数评分数据;
模型熵的计算公式如下:
模型超熵的计算公式如下:
。
根据模型参数计算得到评估指标的指标评分的计算公式如下:
式中:表示指标评分,/>表示模型超熵/>的影响系数,/>为常数。
在其中一种实施方式中,资源指数包括资源待推荐国家集合的下限向量和资源质量期望,基准候选资源集合中的每个目标国家形象资源均在资源评价的各个评估指标中获得有指标评分。步骤S107即结合资源待推荐国家集合、资源指数和基准候选资源集合构建资源筛选模型,并构造筛选问题目标函数具体包括如下步骤:
基于基准候选资源集合从国家形象资源数据库中获取文化禁忌国家集合;
结合文化禁忌国家集合和资源待推荐国家集合生成冲突矩阵;
结合资源质量期望和指标评分,计算得到资源待推荐国家集合和基准候选资源集合之间的模糊决策矩阵;
采用模糊层次分析法确定所有评估指标的权重向量;
结合模糊决策矩阵和权重向量计算得到资源待推荐国家集合和基准候选资源集合之间的综合适配度矩阵;
基于E-CARGO模型并结合综合适配度矩阵和下限向量构建筛选问题目标函数。
在本实施方式中,在国家形象资源数据库中除了包括大量的国家形象资源数据,还预先存储有各个国家形象资源数据所对应的文化禁忌信息,并预先建立了国家形象资源数据与文化禁忌信息之间的映射关系,其中文化禁忌信息主要包括文化禁忌条目和文化禁忌国家。因此可以根据映射关系从国家形象资源数据库中调取与目标国家形象资源相对应的文化禁忌国家,并组成文化禁忌国家集合。再结合文化禁忌国家集合和资源待推荐国家集合生成冲突矩阵,冲突矩阵可以表示为S=[s ij ] m×n =(0≤i<m, 0≤j<n)。其中,m代表基准候选资源集合中资源的数量,n代表资源待推荐国家集合中国家的数量;s ij 表示第i个资源和第j个国家之间是否存在文化禁忌冲突(即是否在国家形象资源数据库中存在映射关系),令矩阵中所有元素的初始值为0。遍历基准候选资源集合中的所有资源,以资源a i 为例,若a i 中标注了涉及文化禁忌国家r j ,则置S中的元素s ij =1。
结合资源质量期望和指标评分,计算得到资源待推荐国家集合和基准候选资源集合之间的模糊决策矩阵。通过计算“区间数可能度”,得到基准候选资源集合中所有资源的各项评估指标评分与资源待推荐国家集合中所有国家的需求期望的匹配度。以计算资源a i 的“要素真实”评估指标的评分与国家r j 的需求期望的匹配度为例,令表示资源a i 的“要素真实”指标的真实质量区间数,/>表示r j 对资源a i 的“要素真实”指标的期望质量区间数,记/>,/>。则/>的可能度P为:
根据上式可以计算每个资源与每个国家在各个评估指标上的匹配度,并最终得到资源与国家两两之间关于评估指标匹配度的模糊决策矩阵P,P i,j,k 表示第i(0≤i<m)个候选资源的质量对应第j(0≤j<n)个国家的期望在第k个评估指标的可能度。
在计算得到可能度之后,可以使用模糊层次分析(FAHP)方法来确定评估指标的权重向量W=[w 1 ,w 2 ,…,w n ]。再结合可能度和权重向量计算矩阵元素,综合适配度矩阵中矩阵元素的计算公式如下:
式中:表示矩阵元素,d表示评估指标的数量,/>表示第k个评估指标的权重向量。
通过计算得到资源的综合适配度矩阵Q后,依据E-CARGO模型,确定目标函数。通过求解该目标函数将得到能使得ρ最大的一种推荐方案,即资源推荐矩阵T。其中,筛选问题目标函数的表达式如下:
式中:表示适配度总和,m表示基准候选资源集合中目标国家形象资源的数量,n表示待推荐国家的数量,S表示冲突矩阵,T表示资源推荐矩阵,L表示下限向量。
本发明还公开一种基于国家形象资源推荐的资源筛选系统。
参照图2,基于国家形象资源推荐的资源筛选系统包括用户交互处理模块、任务处理模块、数据提取模块、资源评价模块、目标函数构建模块和函数求解模块。其中,用户交互处理模块用于获取宣传任务生成请求,宣传任务生成请求包括传播主题、传播对象和传播主题的补充描述信息。任务处理模块用于结合传播主题和补充描述信息进行语义分析,基于语义分析的分析结果得到资源待推荐国家集合,并根据资源待推荐国家集合获取资源指数,还用于将传播主题和补充描述信息分词,得到国家形象描述词组。
数据提取模块用于根据国家形象描述词组从预设的国家形象资源数据库中提取相似度最高的K个目标国家形象资源组成初始候选资源集合。资源评价模块用于构建资源评价模型,并将初始候选资源集合输入至资源评价模型进行资源评价,得到所有目标国家形象资源被评价后的基准候选资源集合。目标函数构建模块用于结合资源待推荐国家集合、资源指数和基准候选资源集合构建资源筛选模型,并构造筛选问题目标函数。函数求解模块用于通过数学求解器求解筛选问题目标函数,并基于求解结果从基准候选资源集合筛选出最优国家形象资源组成最优资源集合。
本实施方式的实施原理为:
首先通过用户交互处理模块获取国家形象的国际宣传任务生成请求,并通过任务处理模块对国际宣传任务生成请求的语义分析得到资源待推荐国家集合;任务处理模块还基于资源待推荐国家集合获取资源指数;通过任务处理模块将传播主题和补充描述信息分词,得到国家形象描述词组;数据提取模块根据国家形象描述词组从预设的国家形象资源数据库中提取相似度最高的K个目标国家形象资源组成初始候选资源集合;通过资源评价模块构建资源评价模型,并将初始候选资源集合输入至资源评价模型进行资源评价,得到所有目标国家形象资源被评价后的基准候选资源集合;目标函数构建模块结合资源待推荐国家集合、资源指数和基准候选资源集合构建资源筛选模型,并构造筛选问题目标函数;最终通过函数求解模块并利用数学求解器求解筛选问题目标函数,并基于求解结果生成最优资源集合。
根据上述系统执行,可以通过语义分析以及相似度计算可以初步提取出合适的目标国家形象资源组成初选候选资源集合,再通过资源评价模型为目标国家形象资源添加评分属性,并通过构建资源筛选模型构建筛选问题目标函数,最终求解目标函数以完成资源筛选,得到最优资源集合。相较于人工检索筛选的方式,大幅提升了从国家形象资源数据库中准确筛选出合适形象资源的效率,并节省了人力。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本申请的保护范围限于这些例子;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上的本申请中一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
本申请中一个或多个实施例旨在涵盖落入本申请的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本申请中一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (8)
1.一种基于国家形象资源推荐的资源筛选方法,其特征在于,包括如下步骤:
获取国家形象的国际宣传任务生成请求,所述国际宣传任务生成请求包括传播主题和所述传播主题的补充描述信息;
结合所述传播主题和所述补充描述信息进行语义分析,并基于所述语义分析的分析结果得到资源待推荐国家集合;
基于所述资源待推荐国家集合获取资源指数,所述资源指数包括所述资源待推荐国家集合的下限向量和资源质量期望;
将所述传播主题和所述补充描述信息分词,得到国家形象描述词组;
根据所述国家形象描述词组从预设的国家形象资源数据库中提取相似度最高的K个目标国家形象资源组成初始候选资源集合;
构建资源评价模型,并将所述初始候选资源集合输入至所述资源评价模型进行资源评价,得到所有所述目标国家形象资源被评价后的基准候选资源集合,所述基准候选资源集合中的每个所述目标国家形象资源均在所述资源评价的各个评估指标中获得有指标评分;
基于所述基准候选资源集合从所述国家形象资源数据库中获取文化禁忌国家集合;
结合所述文化禁忌国家集合和所述资源待推荐国家集合生成冲突矩阵;
结合所述资源质量期望和所述指标评分,计算得到所述资源待推荐国家集合和所述基准候选资源集合之间的模糊决策矩阵;
采用模糊层次分析法确定所有所述评估指标的权重向量;
结合所述模糊决策矩阵和所述权重向量计算得到所述资源待推荐国家集合和所述基准候选资源集合之间的综合适配度矩阵;
基于E-CARGO模型并结合所述综合适配度矩阵和所述下限向量构建筛选问题目标函数;
通过数学求解器求解所述筛选问题目标函数,并基于求解结果从所述基准候选资源集合筛选出最优国家形象资源组成最优资源集合。
2.根据权利要求1所述的基于国家形象资源推荐的资源筛选方法,其特征在于,所述根据所述国家形象描述词组从预设的国家形象资源数据库中提取相似度最高的K个目标国家形象资源组成初始候选资源集合包括如下步骤:
将所述国家形象描述词组转换为描述词组词向量,并将预设的国家形象资源数据库中的所有国家形象资源均转换为形象资源词向量;
根据向量余弦公式分别计算各个所述形象资源词向量与所述描述词组词向量之间的相似度;
选取所述相似度最高的K个所述形象资源词向量作为目标形象资源词向量,并从所述国家形象资源数据库中提取所有所述目标形象资源词向量对应的目标国家形象资源组成初始候选资源集合。
3.根据权利要求1所述的基于国家形象资源推荐的资源筛选方法,其特征在于,所述构建资源评价模型,并将所述初始候选资源集合输入至所述资源评价模型进行资源评价,得到所有所述目标国家形象资源被评价后的基准候选资源集合包括如下步骤:
基于卷积神经网络构建初始评价模型并获取国家形象资源的历史资源评分;
通过所述历史资源评分训练所述初始评价模型,得到训练后的资源评价模型;
将所述初始候选资源集合输入至所述资源评价模型中,通过调整所述资源评价模型的模型参数获得所述目标国家形象资源在各个评估指标下的实数评分数据;
对于同一所述目标国家形象资源的任一所述评估指标,判断所述评估指标是否包含多个所述实数评分数据;
若所述评估指标仅包含一个所述实数评分数据,则将所述实数评分数据作为所述评估指标的指标评分;
若所述评估指标包含多个所述实数评分数据,则统计所述实数评分数据的数据数量;
判断所述数据数量是否超出预设的数量阈值;
若所述数据数量未超出所述数量阈值,则根据所有所述实数评分数据中的最高评分和最低评分确定所述评估指标的指标评分;
若所述数据数量超出所述数量阈值,则构建所述评估指标的云模型,并结合所述云模型和所有所述实数评分数据计算得到所述评估指标的指标评分;
将每个所述评估指标均具有所述指标评分的所有所述目标国家形象资源组成为基准候选资源集合。
4.根据权利要求3所述的基于国家形象资源推荐的资源筛选方法,其特征在于,所述构建所述评估指标的云模型,并结合所述云模型和所有所述实数评分数据计算得到所述评估指标的指标评分包括如下步骤:
构建所述评估指标的云模型;
基于所有所述实数评分数据计算所述云模型中的所有模型参数;
根据所述模型参数计算得到所述评估指标的指标评分。
5.根据权利要求4所述的基于国家形象资源推荐的资源筛选方法,其特征在于,所述模型参数包括模型期望、模型熵/>和模型超熵/>,所述模型期望/>的计算公式如下:
式中:表示所述数据数量,/>表示所述评估指标的第t个所述实数评分数据;
所述模型熵的计算公式如下:
所述模型超熵的计算公式如下:
。
6.根据权利要求5所述的基于国家形象资源推荐的资源筛选方法,其特征在于,所述根据所述模型参数计算得到所述评估指标的指标评分的计算公式如下:
式中:表示所述指标评分,/>表示所述模型超熵/>的影响系数。
7.根据权利要求1所述的基于国家形象资源推荐的资源筛选方法,其特征在于,所述综合适配度矩阵中矩阵元素的计算公式如下:
式中:表示所述矩阵元素,d表示所述评估指标的数量,/>表示第k个所述评估指标的所述权重向量,/>表示第i个所述目标国家形象资源对应所述资源待推荐国家集合中第j个待推荐国家的所述资源质量期望在第k个所述评估指标的可能度。
8.根据权利要求7所述的基于国家形象资源推荐的资源筛选方法,其特征在于,所述筛选问题目标函数的表达式如下:
式中:表示适配度总和,m表示所述基准候选资源集合中所述目标国家形象资源的数量,n表示所述待推荐国家的数量,S表示所述冲突矩阵,T表示资源推荐矩阵,L表示所述下限向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310678985.2A CN116415047B (zh) | 2023-06-09 | 2023-06-09 | 一种基于国家形象资源推荐的资源筛选方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310678985.2A CN116415047B (zh) | 2023-06-09 | 2023-06-09 | 一种基于国家形象资源推荐的资源筛选方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116415047A CN116415047A (zh) | 2023-07-11 |
CN116415047B true CN116415047B (zh) | 2023-08-18 |
Family
ID=87049573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310678985.2A Active CN116415047B (zh) | 2023-06-09 | 2023-06-09 | 一种基于国家形象资源推荐的资源筛选方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116415047B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106485327A (zh) * | 2016-09-08 | 2017-03-08 | 同济大学 | 一种灾害条件下人群踩踏行为演化的知识发现方法 |
CN106503028A (zh) * | 2015-09-08 | 2017-03-15 | 北京邮电大学 | 推荐方法和系统 |
CN112925901A (zh) * | 2021-03-23 | 2021-06-08 | 华中师范大学 | 一种辅助在线问卷评估的评估资源推荐方法及其应用 |
CN113674116A (zh) * | 2021-08-30 | 2021-11-19 | 湖南师范大学 | 基于模糊云认知诊断模型的学生分数预测方法及装置 |
WO2021238722A1 (zh) * | 2020-05-29 | 2021-12-02 | 腾讯科技(深圳)有限公司 | 资源推送方法、装置、设备及存储介质 |
CN115577185A (zh) * | 2022-11-15 | 2023-01-06 | 湖南师范大学 | 基于混合推理和中智群决策的慕课推荐方法及装置 |
CN115641031A (zh) * | 2022-12-26 | 2023-01-24 | 中国人民解放军63921部队 | 一种结合区间评价与云模型的科研人员能力增量评估方法 |
CN115858919A (zh) * | 2022-11-21 | 2023-03-28 | 陕西师范大学 | 基于项目领域知识和用户评论的学习资源推荐方法及系统 |
CN115964570A (zh) * | 2023-03-17 | 2023-04-14 | 湖南师范大学 | 基于QoS多时段变化特征预测的云服务推荐方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101998244B1 (ko) * | 2017-12-14 | 2019-10-01 | 주식회사 이앤지테크 | 직무역량 평가모델 구축 방법 및 그 시스템 |
GB201908532D0 (en) * | 2019-06-13 | 2019-07-31 | Microsoft Technology Licensing Llc | Collecting observations for machine learning |
CN111191821B (zh) * | 2019-12-17 | 2023-07-25 | 东华大学 | 一种基于知识图谱驱动的设备资源配置优化方法 |
US20210357835A1 (en) * | 2020-05-13 | 2021-11-18 | Oracle International Corporation | Resource Deployment Predictions Using Machine Learning |
US20210374132A1 (en) * | 2020-06-01 | 2021-12-02 | Salesforce.Com, Inc. | Diversity and Explainability Parameters for Recommendation Accuracy in Machine Learning Recommendation Systems |
CA3237776A1 (en) * | 2021-11-08 | 2023-05-11 | League, Inc. | Machine learning-based activity and program recommender |
CN114266471A (zh) * | 2021-12-21 | 2022-04-01 | 国网河北省电力有限公司电力科学研究院 | 一种面向冷热电多能流耦合综合能源的能效评价方法 |
CN114649077A (zh) * | 2022-03-17 | 2022-06-21 | 北京工业大学 | 一种基于知识增强和预训练的慢性病用药推荐方法 |
-
2023
- 2023-06-09 CN CN202310678985.2A patent/CN116415047B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503028A (zh) * | 2015-09-08 | 2017-03-15 | 北京邮电大学 | 推荐方法和系统 |
CN106485327A (zh) * | 2016-09-08 | 2017-03-08 | 同济大学 | 一种灾害条件下人群踩踏行为演化的知识发现方法 |
WO2021238722A1 (zh) * | 2020-05-29 | 2021-12-02 | 腾讯科技(深圳)有限公司 | 资源推送方法、装置、设备及存储介质 |
CN112925901A (zh) * | 2021-03-23 | 2021-06-08 | 华中师范大学 | 一种辅助在线问卷评估的评估资源推荐方法及其应用 |
CN113674116A (zh) * | 2021-08-30 | 2021-11-19 | 湖南师范大学 | 基于模糊云认知诊断模型的学生分数预测方法及装置 |
CN115577185A (zh) * | 2022-11-15 | 2023-01-06 | 湖南师范大学 | 基于混合推理和中智群决策的慕课推荐方法及装置 |
CN115858919A (zh) * | 2022-11-21 | 2023-03-28 | 陕西师范大学 | 基于项目领域知识和用户评论的学习资源推荐方法及系统 |
CN115641031A (zh) * | 2022-12-26 | 2023-01-24 | 中国人民解放军63921部队 | 一种结合区间评价与云模型的科研人员能力增量评估方法 |
CN115964570A (zh) * | 2023-03-17 | 2023-04-14 | 湖南师范大学 | 基于QoS多时段变化特征预测的云服务推荐方法及装置 |
Non-Patent Citations (1)
Title |
---|
Universal Optimization Framework: Leader-Centered Learning Team Formation Based on Fuzzy Evaluations of Learners and E-CARGO;Hua Ma等;IEEE Systems, Man, and Cybernetics Magazine;第9卷(第2期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116415047A (zh) | 2023-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109284357B (zh) | 人机对话方法、装置、电子设备及计算机可读介质 | |
CN111753060B (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN112131350B (zh) | 文本标签确定方法、装置、终端及可读存储介质 | |
CN111797214A (zh) | 基于faq数据库的问题筛选方法、装置、计算机设备及介质 | |
CN112818093B (zh) | 基于语义匹配的证据文档检索方法、系统及存储介质 | |
CN110929038A (zh) | 基于知识图谱的实体链接方法、装置、设备和存储介质 | |
CN108595525B (zh) | 一种律师信息处理方法和系统 | |
CN108681548B (zh) | 一种律师信息处理方法和系统 | |
CN111158641B (zh) | 基于语义分析和文本挖掘的事务类功能点自动识别方法 | |
CN113761218A (zh) | 一种实体链接的方法、装置、设备及存储介质 | |
CN108363748B (zh) | 基于知乎的话题画像系统及话题画像方法 | |
CN111475603A (zh) | 企业标识识别方法、装置、计算机设备及存储介质 | |
CN112559684A (zh) | 一种关键词提取及信息检索方法 | |
CN112307164A (zh) | 信息推荐方法、装置、计算机设备和存储介质 | |
CN110781670A (zh) | 基于百科知识库和词向量的中文地名语义消歧方法 | |
CN111831924A (zh) | 内容推荐方法、装置、设备及可读存储介质 | |
CN110866102A (zh) | 检索处理方法 | |
CN111782793A (zh) | 智能客服处理方法和系统及设备 | |
CN107357765A (zh) | Word文档碎片化方法及装置 | |
CN111078835A (zh) | 简历评估方法、装置、计算机设备及存储介质 | |
CN108681977B (zh) | 一种律师信息处理方法和系统 | |
CN111666376A (zh) | 一种基于段落边界扫描预测与词移距离聚类匹配的答案生成方法及装置 | |
Ransing et al. | Screening and Ranking Resumes using Stacked Model | |
CN117574858A (zh) | 一种基于大语言模型的类案检索报告自动生成方法 | |
CN111881264B (zh) | 一种开放领域问答任务中长文本检索的方法和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |