CN110097278B - 一种科技资源智能共享融合训练系统和应用系统 - Google Patents

一种科技资源智能共享融合训练系统和应用系统 Download PDF

Info

Publication number
CN110097278B
CN110097278B CN201910350819.3A CN201910350819A CN110097278B CN 110097278 B CN110097278 B CN 110097278B CN 201910350819 A CN201910350819 A CN 201910350819A CN 110097278 B CN110097278 B CN 110097278B
Authority
CN
China
Prior art keywords
user
resource
semantic
behavior
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910350819.3A
Other languages
English (en)
Other versions
CN110097278A (zh
Inventor
周俊杰
方少亮
赵晓萌
林珠
冯鉴光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Science & Technology Infrastructure Construction Promotion Association
Guangdong Science & Technology Infrastructure Center
Original Assignee
Guangdong Science & Technology Infrastructure Construction Promotion Association
Guangdong Science & Technology Infrastructure Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Science & Technology Infrastructure Construction Promotion Association, Guangdong Science & Technology Infrastructure Center filed Critical Guangdong Science & Technology Infrastructure Construction Promotion Association
Priority to CN201910350819.3A priority Critical patent/CN110097278B/zh
Publication of CN110097278A publication Critical patent/CN110097278A/zh
Application granted granted Critical
Publication of CN110097278B publication Critical patent/CN110097278B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种科技资源智能共享融合训练系统和应用系统,其中训练系统包括:用户资源画像构建模块,用于根据用户资源群像集构建用户资源画像;需求解析模块,用于对用户特征和/或用户输入进行需求分析,为用户释放资源;行为追踪模块,用于在用户资源配对过程中对用户行为进行语义分析得到用户资源关联语义特征;资源溯源重构模块,用于对用户资源关联语义特征进行溯源重构;特征异构融合模块,用于对用户资源关联语义特征进行融合重构;群像修正模块,根据重构的用户资源关联语义特征优化用户资源群像集。本发明可以形成具有自我训练能力的用户资源关联语义特征,更好地完成用户资源关联分析、信息挖掘及供需对接。

Description

一种科技资源智能共享融合训练系统和应用系统
技术领域
本发明涉及信息分类处理和数据特征挖掘技术领域,更具体地,涉及一种科技资源智能共享融合训练系统和应用系统。
背景技术
科学技术成果转化一直是科学技术研究者的难题,同时,产品生产者同样会因技术的缺乏而需花费大量成本投入到技术研究当中,如何让现有的科技资源与生产需求对接,如何将科技资源最大化转化成有益成果成为现今科学技术研究中存在的问题。
在科技资源供需对接中,供方的科技成果与需方的科技需求都是庞大的,对于供方而言,其科技资源数据是详细的、庞大的,作为科技成果展示是明确清晰的,但是作为科技成果输出是乏力的,这是科技资源供需对接方式决定的。大多数情况下,科技资源供需双方需求并不能匹配。其主要原因在于供需双方拥有信息不对等,一方面,供方未能根据市场需求细分占有的科技资源,也无法快速得知需方的意愿;另一方面,需方对自己需求描述不够详尽或描述的需求特征与供方设想相差较大。这导致了当前供需双方科技资源对接极为困难。当供需双方完成充足准备工作的结果时,才能完成科技资源对接,这大大降低了科技资源供需对接效率。即使没有充足的准备工作,需方也需要经过多次搜索调研才能知道想要的供方信息,同时,在需方不断检索中,其使用的检索式是由供方提供的,该检索式细分度不够,同时索引构建并非遵从需方意愿,对需方并不友好,这样的科技资源供需对接是极不便捷的。
对于拥有供需双方所有信息的平台运营建设者来说,能够完成资源聚合、智能分发、智能管控的一种科技资源智能共享系统的建设是必要的。
发明内容
本发明旨在克服上述现有技术的至少一种缺陷(不足),提供一种科技资源智能共享融合训练系统和应用系统,基于大数据存储及网络交互模式对用户资源特征、用户行为进行分析形成具有自我训练、自我修正能力的用户资源关联语义特征,从而更好地完成用户资源关联分析、信息挖掘及供需对接。
本发明采取的技术方案是:
一种科技资源智能共享融合训练系统,包括:
用户资源画像构建模块,用于根据用户资源群像集构建用户资源画像;
需求解析模块,用于基于用户资源画像对用户特征和/或用户输入进行需求分析得到需求语义特征,根据需求语义特征为用户释放资源;
行为追踪模块,用于在用户资源配对过程中对用户行为进行语义分析得到用户资源关联语义特征;
资源溯源重构模块,用于对用户资源关联语义特征进行溯源重构;
特征异构融合模块,用于对用户资源关联语义特征进行融合重构;
群像修正模块,根据重构的用户资源关联语义特征优化用户资源群像集。
本发明具备自我学习、自我训练能力,初始系统仅包含用户资源基础数据,系统后续根据用户的动态需求数据、行为数据进行跟踪分析得到用户资源关联语义特征,继而进行特征融合和重构,优化用户资源群像集,修正用户资源关联语义特征,经过训练修正的用户资源关联语义特征可以更好地完成用户资源关联分析、信息挖掘及供需对接。
进一步地,所述用户资源画像构建模块,具体用于:
通过用户资源群像集构造用户特征图谱,根据用户特征图谱提取同族用户的用户特征和需求特征作为匹配索引。
进一步地,所述需求解析模块用于对用户特征进行需求分析得到需求语义特征的步骤,具体包括:
根据用户特征获取对应的匹配索引,识别该用户在集群用户中的角色定位,根据角色定位提取关联用户和/或相似用户的需求特征,根据提取的需求特征进行需求分析得到需求语义特征。
进一步地,所述需求解析模块用于对用户输入进行需求分析得到需求语义特征的步骤,具体包括:
根据用户输入获取对应的匹配索引,根据科技资源语义库对用户输入进行需求解析得到需求语义特征。
进一步地,所述用户追踪模块具体包括:
记录模块,用于在用户资源配对过程中记录用户行为数据;
分析模块,用于根据码字对照表和/或特征索引和/或行为逻辑权重对用户行为数据进行语义分析得到行为特征,并根据串行行为逻辑结构和行为语料构造基于行为特征的行为语义树;构造模块,用于根据所述行为语义树,对集群用户的行为语义进行分析,构造集群用户资源语义关联树。
进一步地,所述资源溯源重构模块,具体包括:
资源特征解析模块,用于根据行为语义树生成基于匹配资源的语义解析式;
集群分布解析模块,用于根据语义解析式对资源对象在同类特征的集群中所属聚簇或所属区间进行解析得到分布特征;
行为权重关联模块,用于根据行为语义树对资源对象语义相关性进行评价形成资源对象关联语义;
资源权属解析模块,用于根据分布特征、资源对象关联语义按照预设的分类标准由大到小构造权属图谱。
进一步地,所述特征异构融合模块,具体用于:
根据集群用户资源语义关联树提取用户集群特征和/或资源集群特征,对行为语义树以用户集群特征和/或资源集群特征为分类依据进行特征融合,形成类用户和/或类资源关联特征叠加库。
进一步地,所述群像修正模块,具体用于:
根据集群用户资源语义关联树和特征融合的比例计算集群用户或资源的特征权重,根据特征关联计算聚合度,构造新的融合群像图谱。
进一步地,所述语义分析和/或需求分析具体包括:
S1.获取资源对象的本征数据和行为数据,识别资源对象主体角色作为训练语料;
S2.提取训练语料中包含的文本数据和非文本数据;
S3.建立命名实体词库,对非文本中的长句进行词性标注,提取形容词+名词或连词短语为主的关键词,并将其及非文本语料中的短语添加至特征类标注词库;
S4.根据特征类标注词库进行分词训练,得到的匹配词即为特征类资源命名实体,若命名实体中包含特定名称,则将之定为全主体公共命名实体,否则定为特征类资源公共命名实体;S5.根据依存法和特征标注情感词构造句义模式匹配规则,对高频连续单词根据并列分隔符、连续名词主体提取表征句义的命名实体并作为用户或资源精准特征命名实体。
一种科技资源智能共享融合应用系统,包括:
处理模块,用于在完成用户资源特征分析后,基于如上所述集群用户资源语义关联树形成用户推荐语义树或资源关联语义树;
匹配模块,用于计算与用户的匹配度,基于匹配度形成分级推荐树和/或分级关联树;
共享模块,用于基于分级推荐树和/或分级关联树感知用户资源的配对映射,构建用户资源共享网络。
根据训练修正后的用户资源语义关联树,形成分级推荐树和/或分级关联树,通过分级推荐树和/或分级关联树可以更好地通过共享网络进行用户资源的配对,提高供需双方之间的匹配度和友好度。
与现有技术相比,本发明的有益效果为:
(1)本发明通过对用户资源进行需求分析、行为分析,形成自我修正、自我训练的用户资源关联语义特征,用户资源关联语义特征以用户资源语义关联树的形式,为后续的用户资源关联分析、信息挖掘以及供需对接提供更准确的依据;
(2)根据修正训练后的用户资源语义关联树生成用户资源推荐树或用户资源关联树,通过分级推荐树和/或分级关联树可以更好地通过共享网络进行用户资源的配对,提高供需双方之间的匹配度和友好度。
附图说明
图1为本发明实施例的系统主要功能框架示意图。
图2为本发明实施例的用户资源基本特征语义命名实体词库构造流程。
图3为本发明实施例的语义解析式框架示意图。
图4为本发明实施例的特征融合示意图。
具体实施方式
本发明附图仅用于示例性说明,不能理解为对本发明的限制。为了更好说明以下实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
实施例1
如图1所示,一种科技资源智能共享融合训练系统,包括:
用户资源画像构建模块,用于根据用户资源群像集构建用户资源画像;
需求解析模块,用于基于用户资源画像对用户特征和/或用户输入进行需求分析得到需求语义特征,根据需求语义特征为用户释放资源;
行为追踪模块,用于在用户资源配对过程中对用户行为进行语义分析得到用户资源关联语义特征;
资源溯源重构模块,用于对用户资源关联语义特征进行溯源重构;
特征异构融合模块,用于对用户资源关联语义特征进行融合重构;
群像修正模块,根据重构的用户资源关联语义特征优化用户资源群像集。
用户资源画像构建模块是基于用户资源群像集的。所述用户资源群像集包括类用户资源群像集及类用户资源画像集,用户资源群像由用户资源映射特征构成。所述用户资源画像集由类用户/类资源画像通过关联规则整合构成。本系统具备自我学习、自我训练能力,初始系统仅包含用户资源基础数据,类用户资源群像集是基于语义分析对用户资源基础数据分析聚类形成,类用户资源画像集是基于关联规则的,关联权属用户资源画像集。系统后续根据用户的动态需求数据、行为数据进行跟踪分析得到关联语义特征,继而进行特征融合和重构,优化用户资源群像集。
其中,用户资源画像包括基于用户画像的用户画像集、基于资源画像的资源画像集、基于关联规则的用户资源整合的画像集,用户资源群像集包括用户群像、资源群像。
其中,基础数据包括基于用户层的用户群像库、用户行为本征库和基于资源层的资源群像库以及事务逻辑层的事务特征库、逻辑编码库,而用户资源基础数据是由基于用户层的用户群像库、用户行为本征库及基于资源层的资源群像库所构成。
其中,用户资源关联语义特征可以为行为特征矩阵和/或行为语义关联树。用户行为特征库包括族谱树中同级用户的共有行为特征和相异行为特征库,所述行为特征以行为逻辑编码及关联资源语义构成。相异行为特征库包括低频相异行为特征或高频相异行为特征。
在本实施例中,所述用户资源画像构建模块,具体用于:
通过用户资源群像集构造用户特征图谱,根据用户特征图谱提取同族用户的用户特征和需求特征作为匹配索引。
其中,用户特征图谱即为用户标准画像。
在本实施例中,所述需求解析模块用于对用户特征进行需求分析得到需求语义特征的步骤,具体包括:
根据用户特征获取对应的匹配索引,识别该用户在集群用户中的角色定位,根据角色定位提取关联用户和/或相似用户的需求特征,根据提取的需求特征进行需求分析得到需求语义特征。
其中,角色定位即为用户特征在集群分布中的坐标。
在本实施例中,所述需求解析模块用于对用户输入进行需求分析得到需求语义特征的步骤,具体包括:
根据用户输入获取对应的匹配索引,根据科技资源语义库对用户输入进行需求解析得到需求语义特征。
所述需求解析包括定向需求解析和模糊需求解析,定向需求解析是直接依据用户输入的匹配范围获取需求特征,而模糊需求解析需要先确定匹配范围,再根据匹配范围获取需求特征。对于模糊需求解析,可以进行用户行为跟踪,分析用户行为特征,从而确定匹配范围。需求特征可以描述为一矩阵,包括需求语义及对应的需求倾向指数。
在本实施例中,所述用户追踪模块具体包括:
记录模块,用于在用户资源配对过程中记录用户行为数据;
分析模块,用于根据码字对照表和/或特征索引和/或行为逻辑权重对用户行为数据进行语义分析得到行为特征,并根据串行行为逻辑结构和行为语料构造基于行为特征的行为语义树;构造模块,用于根据所述行为语义树,对集群用户的行为语义进行分析,构造集群用户资源语义关联树。
具体实施过程中,所述记录用户行为数据,是以用户为主体的,具体包括:根据用户ID和用户行为序号生成组合码作为行为编码的起始位,根据用户ID和用户结束行为语义生成组合码作为行为编码的结束位。
所述用户结束行为语义包括用户结束行为语义特征及基于行为目的完成度设置的行为结果判别码。所述用户结束行为语义特征为离开系统平台前最后的行为操作语义,该语义包括行为类型、行为关联资源语义。所述行为结果判别码的生成,具体为:根据用户ID、行为类型对应的事务特征库、逻辑编码库中对应的码字以及行为关联资源语义对应词库索引号形成用户行为结束位,其中,所述结束位根据事务特征及行为关联语义聚合度生成结果判别码。所述行为结果判别码表征用户行为完成度。
所述行为编码具体可以为以行为逻辑流程序号+逻辑类型+时长量化+数据特征矩阵的形式串行的记录,所述逻辑类型、数据特征矩阵中的数据特征以及特征词频都可以编码或词典索引号的形式录入。
所述行为特征矩阵具体可以包括行为特征及行为特征频率。
系统为注册用户分配ID,系统为访客用户生成ID,系统生成的ID中包含用户IP。
对于访客用户,“注册”操作也是行为之一,假设用户A为非登录用户,识别用户IP及物理地址,若IP及物理地址可在库索引中匹配到常用IP或地址,对该用户行为以注册用户ID进行记录;若未匹配到对应IP或地址,则系统生成随机ID,记录用户后续行为,若用户登录系统,则将随机ID替换为登录ID,并添加当前IP及物理地址至登录ID信息中;若用户执行注册行为,则将注册后分配的ID覆盖当前随机ID;若用户未执行注册行为,最终离开系统平台,或长时间进行表层数据交互而未执行“注册”或“登录”操作,则记为访客行为。
对于登录用户,根据用户特征或关联资源及关联用户语义执行用户行为分析,对访客用户除需执行一般用户行为分析外,还附加执行访客行为安全分析。
在本实施例中,所述资源溯源重构模块,具体包括:
资源特征解析模块,用于根据行为语义树生成基于匹配资源的语义解析式;
集群分布解析模块,用于根据语义解析式对资源对象在同类特征的集群中所属聚簇或所属区间进行解析得到分布特征;
行为权重关联模块,用于根据行为语义树对资源对象语义相关性进行评价形成资源对象关联语义;
资源权属解析模块,用于根据分布特征、资源对象关联语义按照预设的分类标准由大到小构造权属图谱。
如图3所示,如某用户行为结果是与某资源达成意向,在完成需求前的行为及行为关联资源语义构成语义解析式。其中集群特征、行为语义树均是由特征词索引号、权重、倾向值构成的树形式,根据语义解析式中各关联语义特征权值求解集群中的分布特征,继而根据语义解析式容易得到集群分布特征及权重关联,而权属解析为根据所有构造权属图谱,例如预设的分类标准为:所属机构1、机构2等,所属机构一级单位、二级单位等,所属权利人1、权利人2等,按照该预设的分类标准由大至小构造权属图谱,如此在做资源推荐或资源对接时,可根据权属特征智能分配资源。
在本实施例中,所述特征异构融合模块,具体用于:
根据集群用户资源语义关联树提取用户集群特征和/或资源集群特征,对行为语义树以用户集群特征和/或资源集群特征为分类依据进行特征融合,形成类用户和/或类资源关联特征叠加库。
如图4所示,在进行特征融合时,为确保新特征可融合性需进行融合评估,如对于某资源,在进行特征分析和关联用户行为语义分析后生成新语义关联树,根据原始树,特征异构融合模块按照阶梯树进行相似度或聚合度分析,得到语义树融合评估框架,根据特征相似度进行关联,根据特征聚合度进行融合或替换。所述特征相似度为进行语义树结构或关联特征相似度计算而得到,所述特征聚合度为进行集合计算而得到,根据集合关系进行融合。融合时以主权特征不变性为原则,所述主权特征为一级分类,即集群特征类别,在可能出现的交叉集群情况,可向下叠加,构造交叉类别,若根据行为大数据计算后,得知对于主权特征A的集群特征树存在一个特征集B,使得特征集A是特征集B的真子集,那么复制主权特征本级,再向上叠加,构造全集特征。无论是向下叠加还是向上叠加,都不会替换特征A本级特征,这确保了资源根索引不变性,在内部数据交换处理,网络安全机制、数据集群融合管理中都不会因资源语义扩展或修改而造成系统不稳定,或管理决策混乱。
在本实施例中,所述群像修正模块,具体用于:
根据集群用户资源语义关联树和特征融合的比例计算集群用户或资源的特征权重,根据特征关联计算聚合度,构造新的融合群像图谱。
群像的修正是根据行为关联语义树和资源融合特征对原始用户或资源群像的优化。
在本实施例中,所述语义分析和/或需求分析具体包括:
S1.获取资源对象的本征数据和行为数据,识别资源对象主体角色作为训练语料;
S2.提取训练语料中包含的文本数据和非文本数据;
S3.建立命名实体词库,对非文本中的长句进行词性标注,提取形容词+名词或连词短语为主的关键词,并将其及非文本语料中的短语添加至特征类标注词库;
S4.根据特征类标注词库进行分词训练,得到的匹配词即为特征类资源命名实体,若命名实体中包含特定名称,则将之定为全主体公共命名实体,否则定为特征类资源公共命名实体;S5.根据依存法和特征标注情感词构造句义模式匹配规则,对高频连续单词根据并列分隔符、连续名词主体提取表征句义的命名实体并作为用户或资源精准特征命名实体。
在步骤S1中,本征数据为资源本身,行为数据为用户资源交互行为数据中用户特征、强相关行为中所包含资源特征,对于各种资源,比如仪器、论文、科技报告等,其均有用户权属,权属用户与资源间具有强相关性,强相关用户的需求或行为特征中包含资源隐语义,可辅助建立资源语义树。比如,有两名为“电子显微镜”的仪器资源,其一强相关用户为”集成电子电路研究所”,其二强相关用户为“材料分析检测局”,根据用户特征可得到资源隐语义,并可进行标注,如集成电子类电子显微镜A,材料分析类电子显微镜B,隐语义不仅包含资源所属领域、所属应用类型,还隐含资源应用的方法理论,所述方法理论亦是一种关联语料。
在步骤S2中,所述提取训练语料中包含的文本数据和非文本数据可以根据数据的传输接口类型和/或集群特征进行分类提取。系统获取的训练语料源于各资源平台或数据库,依据源数据库接口或源平台架构区分文本数据和非文本数据,根据集群特征和接口关键字段做关联性分析,并以此建立特征类语料。
在步骤S3中,训练语料的目的是为了得到基于特征类的命名实体,而非文本信息通常是对资源基本属性的描述,比如,对于资源“一种科技资源共享融合系统”专利,录入数据系统的非文本数据包括“资源类型-专利技术”、“资源领域-科技资源管理”、“关联技术-语义处理、大数据管理平台、资源共享融合”、“涉及解决问题-科技资源管理、科技资源供需对接、科技资源共享”、“摘要-XXX”、“权属单位-XXX”、“主体类型-科研单位”、“主体业务-基于大数据的科技管理服务、平台监理评估”等,对于这类非文本数据,基于数据库接口即可得知相应数据类型特征,而非文本数据通常以名词为主体,形容词或动词短语为定语修饰,也包括组合词、连词构成的名词短语,如此提取非文本数据并进行词性标注,通过依存法即可提取主要特征,同时这类特征词能够基本表征资源特点,如摘要中的短语词、单位名称、资源领域的名称、所关联技术中的名词、解决问题中的短语等;
在步骤S4中,其中,标注词库是由步骤203对全体非文本数据进行分析得到的类资源命名实体,所述命名实体可辅助识别文本关键词,如地名机构名组合词、人名机构名组合词、多名词组合词等,类似的如“生物医药”、“光电子信息”等可识别为一个词,相较于常规分词手段得到的“生物”“医药”“光”“电子”“电子信息”“信息”分词结果,更符合原始语义。将得到的命名实体按是否包含特定名称,如地名、人名、机构名,定为全主体公共命名实体或特征类资源公共命名实体。
在步骤S5中,特征标注情感词主要用于科技报告、可行性报告、任务书等大型文本的分析,特征标注词情感词可以包括篇章标注词、段落标注词、句式标注词等,如“技术路线”、“实施方式”、“重大意义”、“目的”、“研究方向”等可以助于提取文本或资源核心内容,该类特征标注情感词由外部大数据科技文章语料或内部训练语料中获得。
高频连续单词是指通过规则识别特定意义的句子。从中提取具有表征语义的命名实体需依据高频连续单词的识别规则,其步骤具体为:首先,根据篇章识别词对篇章论述性进行定义,即进行文档分类标注;其次,提取目录或识别段落词,提取待分析段落文本,并根据段落词语义对段落文本进行标注,即进行段落语义标注;然后,根据句式情感词对段落文本分析,提取待分析的长短句或短语,并进行句义标注;最后,对长短句或短语进行词性及分隔符或连词符标注,低频名词或动名词直接提取,高频连续单词合并提取,此即为用户或资源精准特征命名实体。
本实施例是一种基于用户资源数据特征和角色定位而进行的智能匹配融合模式,是基于协议和数据索引完成数据特征配对、语义分析、特征溯源、特征融合的。数据对象均负载一个树形节点目录,其中的每个节点包含一个公共索引密钥、一个私有配对密钥、一个共享融合密钥、一个角色定位坐标查询索引以及一个节点角色查询索引,同时数据对象基于业务和数据源进行分布式存储。所述角色定位坐标查询索引用于特征溯源或子数据资源溯源时的快速定位。
在进行用户资源画像构建时,需要公有集群特征库、用户资源群像或用户资源画像集等数据,在进行集群定位或数据匹配需要先进行公共索引密钥配对的确认,公共索引密钥分为三部分,其一为快速画像构建模块或特征分析业务模块发起的任务口令,其二为待分析对象的用户或资源ID信息,其三为安全口令。上述分析用户对象为登录用户,访客用户不具备用户特征分析或快速画像构建的条件。
公共索引密钥中还可以包括集群特征索引,对于登录用户或资源,树形节点目录基于集群特征用户或资源形成的关联用户或资源树,该集群特征索引在进行快速用户资源画像构建或用户资源特征分析时刻快速定位用户或资源对象所属集群,便于进行相似用户或资源特征关联解析。
公共索引密钥中还可以包括引用语料库索引,在数据部署时,语料库与集群用户或资源库分开部署,语料库具有集群用户或资源特征标签,但由于是分离存储,语料库携带一索引号,在进行特征或行为语义分析时可直接调取对应语料库。
公共索引密钥中还可以包括数据处理业务配对因子,该因子包括资源请求因子、业务类型因子、用户或资源对象基础特征复杂度,该因子与中央资源分配系统对接,用于分配计算资源。
私有配对密钥可以包括资源定向特征索引、特征溯源因子和特征源数据请求配对因子;
其中,私有配对密钥面向集群中的相似资源关联分析,对用户或资源基本特征进行分析时,通过聚类分析形成用户或资源集群,对集群数据,通过决策树分类形成特征决策树,该特征决策树中即包含定向特征索引,如此,对于用户或资源对象,定向特征索引即包含用户或资源所属集群特征,集群角色定位和基于特征权重的决策树特征倾向分布。
共享融合密钥可以包括特征融合请求配对密钥、备份请求密钥、备份管理存储密钥、备份管理存储索引、数据特征冗余图谱因子;所述请求配对因子用于融合共享请求匹配,所述特征插值索引为动态索引,包括节点占用情况、插值接口状态,数据特征图谱冗余因子包括组成数据图谱的各特征聚簇密度和容量。
角色定位坐标查询索引是在聚类及语义关联树生成时建立或分配的,如对“领域A”的资源进行语义提取,形成基于资源的语义树,根据语义树特征进行聚类分析得到N个特征类聚簇,根据聚类分布和语义树计算各语义权重及离散度,以此为角色定位坐标查询索引。
实施例2
本实施例提供一种科技资源智能共享融合应用系统,包括:
处理模块,用于在完成用户资源特征分析后,基于如实施例1所构造的集群用户资源语义关联树形成用户推荐语义树或资源关联语义树;
匹配模块,用于计算与用户的匹配度,基于匹配度形成分级推荐树和/或分级关联树;
共享模块,用于基于分级推荐树和/或分级关联树感知用户资源的配对映射,构建用户资源共享网络。
本实施例是一种基于用户资源特征、关联语义树、用户资源权属的智能资源调度或智能用户资源关联的主动推荐或主动关联的共享模式。根据训练修正后的用户资源语义关联树,形成分级推荐树和/或分级关联树,可以更好地通过共享网络进行用户资源的配对,提高供需双方之间的匹配度和友好度。
显然,本发明的上述实施例仅仅是为清楚地说明本发明技术方案所作的举例,而并非是对本发明的具体实施方式的限定。凡在本发明权利要求书的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (7)

1.一种科技资源智能共享融合训练系统,其特征在于,包括:
用户资源画像构建模块,用于根据用户资源群像集构建用户资源画像;
需求解析模块,用于基于用户资源画像对用户特征和/或用户输入进行需求分析得到需求语义特征,根据需求语义特征为用户释放资源;
行为追踪模块,用于在用户资源配对过程中对用户行为进行语义分析得到用户资源关联语义特征;
资源溯源重构模块,用于对用户资源关联语义特征进行溯源重构;
特征异构融合模块,用于对用户资源关联语义特征进行融合重构;
群像修正模块,根据重构的用户资源关联语义特征优化用户资源群像集;
所述行为追踪模块具体包括:
记录模块,用于在用户资源配对过程中记录用户行为数据;
分析模块,用于根据码字对照表和/或特征索引和/或行为逻辑权重对用户行为数据进行语义分析得到行为特征,并根据串行行为逻辑结构和行为语料构造基于行为特征的行为语义树;
构造模块,用于根据所述行为语义树,对集群用户的行为语义进行分析,构造集群用户资源语义关联树;
所述资源溯源重构模块,具体包括:
资源特征解析模块,用于根据行为语义树生成基于匹配资源的语义解析式;
集群分布解析模块,用于根据语义解析式对资源对象在同类特征的集群中所属聚簇或所属区间进行解析得到分布特征;
行为权重关联模块,用于根据行为语义树对资源对象语义相关性进行评价形成资源对象关联语义;
资源权属解析模块,用于根据分布特征、资源对象关联语义按照预设的分类标准由大到小构造权属图谱;
所述特征异构融合模块,具体用于:
根据集群用户资源语义关联树提取用户集群特征和/或资源集群特征,对行为语义树以用户集群特征和/或资源集群特征为分类依据进行特征融合,形成类用户和/或类资源关联特征叠加库。
2.根据权利要求1所述的一种科技资源智能共享融合训练系统,其特征在于,所述用户资源画像构建模块,具体用于:
通过用户资源群像集构造用户特征图谱,根据用户特征图谱提取同族用户的用户特征和需求特征作为匹配索引。
3.根据权利要求2所述的一种科技资源智能共享融合训练系统,其特征在于,所述需求解析模块用于对用户特征进行需求分析得到需求语义特征的步骤,具体包括:
根据用户特征获取对应的匹配索引,识别该用户在集群用户中的角色定位,根据角色定位提取关联用户和/或相似用户的需求特征,根据提取的需求特征进行需求分析得到需求语义特征。
4.根据权利要求2所述的一种科技资源智能共享融合训练系统,其特征在于,所述需求解析模块用于对用户输入进行需求分析得到需求语义特征的步骤,具体包括:
根据用户输入获取对应的匹配索引,根据科技资源语义库对用户输入进行需求解析得到需求语义特征。
5.根据权利要求1所述的一种科技资源智能共享融合训练系统,其特征在于,所述群像修正模块,具体用于:
根据集群用户资源语义关联树和特征融合的比例计算集群用户或资源的特征权重,根据特征关联计算聚合度,构造新的融合群像图谱。
6.根据权利要求1至5任一项所述的一种科技资源智能共享融合训练系统,其特征在于,所述语义分析和/或需求分析具体包括:
S1.获取资源对象的本征数据和行为数据,识别资源对象主体角色作为训练语料;
S2.提取训练语料中包含的文本数据和非文本数据;
S3.建立命名实体词库,对非文本中的长句进行词性标注,提取形容词+名词或连词短语为主的关键词,并将其及非文本语料中的短语添加至特征类标注词库;
S4.根据特征类标注词库进行分词训练,得到的匹配词即为特征类资源命名实体,若命名实体中包含特定名称,则将之定为全主体公共命名实体,否则定为特征类资源公共命名实体;
S5.根据依存法和特征标注情感词构造句义模式匹配规则,对高频连续单词根据并列分隔符、连续名词主体提取表征句义的命名实体并作为用户或资源精准特征命名实体。
7.一种科技资源智能共享融合应用系统,其特征在于,包括:
处理模块,用于在完成用户资源特征分析后,基于如权利要求1至6任一项所述的集群用户资源语义关联树形成用户推荐语义树或资源关联语义树;
匹配模块,用于计算与用户的匹配度,基于匹配度形成分级推荐树和/或分级关联树;
共享模块,用于基于分级推荐树和/或分级关联树感知用户资源的配对映射,构建用户资源共享网络。
CN201910350819.3A 2019-04-28 2019-04-28 一种科技资源智能共享融合训练系统和应用系统 Active CN110097278B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910350819.3A CN110097278B (zh) 2019-04-28 2019-04-28 一种科技资源智能共享融合训练系统和应用系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910350819.3A CN110097278B (zh) 2019-04-28 2019-04-28 一种科技资源智能共享融合训练系统和应用系统

Publications (2)

Publication Number Publication Date
CN110097278A CN110097278A (zh) 2019-08-06
CN110097278B true CN110097278B (zh) 2021-06-08

Family

ID=67446227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910350819.3A Active CN110097278B (zh) 2019-04-28 2019-04-28 一种科技资源智能共享融合训练系统和应用系统

Country Status (1)

Country Link
CN (1) CN110097278B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472680B (zh) * 2019-08-08 2021-05-25 京东城市(北京)数字科技有限公司 目标分类方法、装置和计算机可读存储介质
CN111274301B (zh) * 2020-01-20 2023-08-29 国云数字科技(重庆)有限公司 一种基于数据资产智能治理方法及系统
CN111861699B (zh) * 2020-07-02 2021-06-22 北京睿知图远科技有限公司 一种基于运营商数据的反欺诈指数生成方法
CN112650579B (zh) * 2020-10-30 2023-03-10 西北大学 一种基于网格化的云资源分发调度方法
CN112508376A (zh) * 2020-11-30 2021-03-16 中国科学院深圳先进技术研究院 一种指标体系构建方法
CN112784046B (zh) * 2021-01-20 2024-05-28 北京百度网讯科技有限公司 文本聚簇的方法、装置、设备及存储介质
CN117556264B (zh) * 2024-01-11 2024-05-07 浙江同花顺智能科技有限公司 一种评估模型的训练方法、装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102812486A (zh) * 2010-03-25 2012-12-05 诺基亚公司 根据群体行为提供个性化信息资源推荐的方法和设备
CN105825415A (zh) * 2016-03-15 2016-08-03 广东省科技基础条件平台中心 一种科技资源供需对接方法
CN108596679A (zh) * 2018-04-27 2018-09-28 中国联合网络通信集团有限公司 用户画像的构建方法、装置、终端及计算机可读存储介质
CN108647729A (zh) * 2018-05-11 2018-10-12 广东省科技基础条件平台中心 一种用户画像获取方法
CN109190051A (zh) * 2018-11-29 2019-01-11 广东省科技基础条件平台中心 一种用户行为分析方法和基于该分析方法的资源推荐方法
CN109656685A (zh) * 2018-12-14 2019-04-19 深圳市网心科技有限公司 容器资源调度方法和系统、服务器及计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8341268B2 (en) * 2009-08-28 2012-12-25 Microsoft Corporation Resource sharing in multi-principal browser
TWI569156B (zh) * 2012-10-09 2017-02-01 萬國商業機器公司 提供電子裝置之使用者介面的方法及其電子裝置
US10073830B2 (en) * 2014-01-10 2018-09-11 Cluep Inc. Systems, devices, and methods for automatic detection of feelings in text
CN109416695B (zh) * 2017-05-08 2022-05-27 微软技术许可有限责任公司 在自动聊天中提供本地服务信息

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102812486A (zh) * 2010-03-25 2012-12-05 诺基亚公司 根据群体行为提供个性化信息资源推荐的方法和设备
CN105825415A (zh) * 2016-03-15 2016-08-03 广东省科技基础条件平台中心 一种科技资源供需对接方法
CN108596679A (zh) * 2018-04-27 2018-09-28 中国联合网络通信集团有限公司 用户画像的构建方法、装置、终端及计算机可读存储介质
CN108647729A (zh) * 2018-05-11 2018-10-12 广东省科技基础条件平台中心 一种用户画像获取方法
CN109190051A (zh) * 2018-11-29 2019-01-11 广东省科技基础条件平台中心 一种用户行为分析方法和基于该分析方法的资源推荐方法
CN109656685A (zh) * 2018-12-14 2019-04-19 深圳市网心科技有限公司 容器资源调度方法和系统、服务器及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向科技资源数据处理的"一站式"共享与服务平台建设;林珠 等;《现代计算机》;20170430;第2017年卷(第12期);第67-71页 *

Also Published As

Publication number Publication date
CN110097278A (zh) 2019-08-06

Similar Documents

Publication Publication Date Title
CN110097278B (zh) 一种科技资源智能共享融合训练系统和应用系统
CN116628172B (zh) 基于知识图谱的政务服务领域多策略融合的对话方法
CN111291161A (zh) 法律案件知识图谱查询方法、装置、设备及存储介质
Nagwani Summarizing large text collection using topic modeling and clustering based on MapReduce framework
RU2686000C1 (ru) Извлечение информационных объектов с использованием комбинации классификаторов, анализирующих локальные и нелокальные признаки
RU2662688C1 (ru) Извлечение информации из смысловых блоков документов с использованием микромоделей на базе онтологии
WO2018000272A1 (zh) 一种语料生成装置和方法
RU2626555C2 (ru) Извлечение сущностей из текстов на естественном языке
RU2679988C1 (ru) Извлечение информационных объектов с помощью комбинации классификаторов
CN111881290A (zh) 一种基于加权语义相似度的配网多源网架实体融合方法
Prudhomme et al. Interpretation and automatic integration of geospatial data into the Semantic Web: Towards a process of automatic geospatial data interpretation, classification and integration using semantic technologies
RU2640297C2 (ru) Определение степеней уверенности, связанных со значениями атрибутов информационных объектов
Sirmakessis Text mining and its applications: results of the NEMIS Launch Conference
CN114462384B (zh) 一种面向数字对象建模的元数据自动生成装置
CN114218472A (zh) 基于知识图谱的智能搜索系统
CN114997288A (zh) 一种设计资源关联方法
Kiu et al. Ontology mapping and merging through OntoDNA for learning object reusability
Saranya et al. Intelligent medical data storage system using machine learning approach
CN113157887A (zh) 知识问答意图识别方法、装置、及计算机设备
CN112417170A (zh) 面向不完备知识图谱的关系链接方法
CN112182204A (zh) 构建中文命名实体标注的语料库的方法、装置
JPWO2016067396A1 (ja) 文の並び替え方法および計算機
CN114676258B (zh) 一种基于症状描述文本的非诊断为目的的疾病分类方法
CN113032353A (zh) 数据共享方法、系统、电子设备及介质
Chen English translation template retrieval based on semantic distance ontology knowledge recognition algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant