CN110232102A - 一种基于迁移学习的人员关系模型建模方法 - Google Patents

一种基于迁移学习的人员关系模型建模方法 Download PDF

Info

Publication number
CN110232102A
CN110232102A CN201910511284.3A CN201910511284A CN110232102A CN 110232102 A CN110232102 A CN 110232102A CN 201910511284 A CN201910511284 A CN 201910511284A CN 110232102 A CN110232102 A CN 110232102A
Authority
CN
China
Prior art keywords
personnel
relationship
model
class
transfer learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910511284.3A
Other languages
English (en)
Other versions
CN110232102B (zh
Inventor
李晋
纪浩博
邹德润
马超
程建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201910511284.3A priority Critical patent/CN110232102B/zh
Publication of CN110232102A publication Critical patent/CN110232102A/zh
Application granted granted Critical
Publication of CN110232102B publication Critical patent/CN110232102B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/81Indexing, e.g. XML tags; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于迁移学习的人员关系模型建模方法,在给定的人员关系源模型基础上,通过迁移学习,挖掘出数据集中新关系,优化该模型,包括:步骤1:将数据集输入给定的人员关系源模型,分析人员之间的关系;步骤2:当源模型无法解析人员数据记录之间的关系特征或者出现解析不准确的情况时,通过迁移学习对人员关系源模型的关系种类集R进行优化,获得新关系集R′;步骤3:根据新关系集,获得目的模型。根据建模方法设计并实现了一个人员关系系统,该系统自动绘制人员关系模型。本发明通过挖掘社交网络中人员之间的新关系来优化给定的人员关系模型,并以可视化的形式展示。

Description

一种基于迁移学习的人员关系模型建模方法
技术领域
本发明涉及一种人员关系模型建模及可视化方法,特别是一种基于迁移学习的人员关系模型建模及可视化方法,属于知识模型领域。
背景技术
迁移学习作为机器学习的一大分支,本质上就是把已学训练好的模型参数迁移到新的模型来帮助新模型训练。考虑到大部分数据或任务是存在相关性的,所以,通过迁移学习,可以将已经学到的模型参数,通过某种方式来分享给新模型从而加快并优化模型的学习效率。
传统的机器学习方法尤其是有监督学习,对数据的样本数量、数据分布的统一性、标签的完整性等都有着严苛的要求。在解决问题的过程中,传统的机器学习方法最常见的障碍在于训练模型过程中所需的海量数据。需要如此多的数据,原因在于机器在学习的过程中会在模型中遇到大量参数。在面对某一领域的具体问题时,通常可能无法得到构建模型所需规模的数据。
由于没有足够能力利用大数据快速进行模型的训练。利用迁移学习的思想,将那些大公司在大数据上已经训练好的模型迁移到给定任务中。针对这个任务,对模型进行微调,从而在大数据上训练出模型。
迁移学习是机器学习领域的一个重要分支。因此,其应用并不局限于特定的领域。凡是满足迁移学习问题情景的应用,迁移学习都可以发挥作用。比如,迁移学习已被广泛地应用于计算机视觉的研究中。特别地,在计算机视觉中,迁移学习方法被称为DomainAdaptation。Domain adaptation的应用场景有很多,比如图片分类、图片哈希等。再比如,由于文本数据有其领域特殊性,因此,在一个领域上训练的分类器,不能直接拿来作用到另一个领域上。这就需要用到迁移学习。例如,在电影评论文本数据集上训练好的分类器,不能直接用于图书评论的预测。这就需要进行迁移学习。
JointJs是一个HTML5的开源JavaScript库,用于创建完全互动式的图表,它极易上手且操作简单,并且支持所有的现代浏览器,用户可以使用JointJs已提供的图元素绘图,也可根据需求自定义一些图元素。除此之外,JointJs创建的图表就是SVG图形,它具有SVG的所有优点,但是用户却不必在意SVG的那些元素是怎么定义的,不用在意那些标签规则,用户更注重的是逻辑,只要通过封装好的方法把想法表现即可。
发明内容
针对上述现有技术,本发明要解决的技术问题是提供一种借助迁移学习的方法来构建人员关系模型,分析社交网络中人员之间的潜在关系,读取方便快捷,避免使用庞大冗杂的数据库的一种基于迁移学习的人员关系模型建模及可视化方法。
为解决上述技术问题,本发明的一种基于迁移学习的人员关系模型建模方法,包括以下步骤:
步骤1:将数据集输入给定的人员关系源模型SourceModel,分析人员之间的关系;
步骤2:当源模型SourceModel无法解析人员数据记录之间的关系特征或者出现解析不准确的情况时,通过迁移学习对人员关系源模型SourceModel的关系种类集R进行优化,获得扩展标记关系种类集R′;
步骤3:根据扩展标记关系种类集R′,获得目的模型TargetModel;
步骤4:将目标模型TargetModel的分析结果以可视化模型展示出来。
本发明还包括:
1.人员关系源模型SourceModel具体为:
设人员数据集为D={x1,x2,…,xm},其中,xi代表人员数据集D中第i条人员数据记录,标记关系种类集R为:
R={<r1,f1(p,q)>,<r2,f2(p,q)>,…<rn,fn(p,q)>}
其中,ri为第i种关系,fi(p,q)为bool型函数,返回人员数据记录p和q是否具有关系ri,标记关系记录集合M为:
M={<(p1,q1),r1>,<(p2,q2),r2>,…<(pk,qk),rk>}
其中<(pi,qi),ri>代表人员pi和qi之间具有关系ri,源模型SourceModel即为:将数据集D中的两条人员数据记录p和q组成二元组<p,q>,向SourceModel输入任意上述格式二元组,SourceModel能够准确判断两个人员<p,q>是否具有R中标记的关系,如果有,则输出具体关系。
2.迁移学习包括:当引入新的人员数据记录x进行测试时,当SourceModel无法解析人员数据记录x与数据集D中的人员数据记录y的关系特征或者出现解析不准确的情况,则创建一个新的关系种类rn+1作为新关系种类,然后引入具有与人员数据记录x和y同类特征的人员数据记录构成辅助关系数据集M′:
M′={<(p1,q1),rn+1>,<(p2,q2),rn+1>,…<(ps,qs),rn+1>}
然后使用TrAdaBoost算法,将M和M′作为该算法的输入,使源模型SourceModel完成迁移学习,扩展标记关系种类集为:
R′={<r1,f1(p,q)>,<r2,f2(p,q)>,…<rn,fn(p,q)>,<rn+1,fn+1(p,q)>}
3.TrAdaBoost算法包括:
步骤1:初始化权重向量,训练出一个弱分类器;
步骤2:通过计算分类器的错误率,对权重向量进行更新;
步骤3:依据新的权重向量,得到一个优化分类器;
步骤4:迭代步骤2和3,最后得到当前最优分类器。
4.目标模型TargetModel具体为:将数据集D中的两条人员数据记录p和q组成二元组<p,q>,向TargetModel输入任意上述格式二元组,TargetModel能够准确判断两个人员<p,q>是否具有R′中标记的关系,如果有,则输出具体关系。
5.将目标模型TargetModel的分析结果以可视化模型展示出来包括:
步骤1:创建集合S,向目标模型TargetModel中输入两条人员数据记录a和b,该模型会输出a和b之间的关系r,组成一个三元组<a,b,r>,表示人员数据记录a和b之间存在关系r,并将该三元组保存在集合S中;
步骤2:创建哈希表PIM作为人员身份表,其中键为人员的身份,值为一个用来绘制对应身份人员的图元类,类的属性表述该类人员所共有的画图属性,包含颜色,图标,标签等属性;
步骤3:扫描人员数据集D,在人员身份表PIM中,查询数据记录xi的身份xi-identify,若查询为空,则将xi-identify作为键添加到PIM,然后创建一个图元类,并设置类的属性,并将这个类作为键xi-identify的值;
步骤4:创建哈希表RM作为关系表,键为关系名称,值为一个用来绘制相关关系的连接线类,类的属性表述该类关系所共有的画图属性,包含颜色,线型(直线,曲线,折线)等属性;
步骤5:扫描关系种类集R′,在关系表RM中,查询数据记录ri的名称ri-name,若查询为空,则将ri-name作为键添加到RM,然后创建一个连接线类,并设置类的属性,并将这个类作为键ri-name的值;
步骤6:设计实现画图操作和图形编辑,图形编辑包括图元的复制、粘贴、模型的放大、缩小,将画图操作和图形编辑封装为一个系统,该系统能够实现人员关系模型的绘制与保存。
6.人员关系模型的绘制包括:
步骤1:读取集合S中的一个三元组<ai,bi,ri>,识别人员ai的身份ai-identify,查询在PIM中键值等于ai-identify的值,为人员ai创建一个对象,继承父类PIM[ai-identify]的属性;对人员bi做相同处理;识别关系ri的名称ri-name,查询在RM中键值等于ri-name的值,为关系ri创建一个对象,继承父类RM[ri-name]关系属性;
步骤2:在画布Paper上,将人员ai和bi实例化为图元对象Element,图元分为上下两部分,上半部分包含父类的身份名称label,颜色color,图标icon;下半部分包含人员的相关信息;将ri实例化为连接线link,连接代表人员ai和bi的图元,在连接线上表述该关系的名称;
步骤3:继续处理集合S中其他三元组,直至全部完成,实现人员关系模型的可视化。
7.人员关系模型的保存包括:
步骤1:获取画布Paper上的所有图元对象Element,提取图元对象Element的属性,依据这些属性为每一个图元对象Element创建一个json对象;
步骤2:获取画布Paper上的所有连接线对象Link,提取连接线对象Link的相关属性,依据这些属性为每一个连接线对象Link创建一个json对象;
步骤3:通过Ajax将这些json对象从画布Paper前台传至后台,在后台接收json对象然后通过Java方法创建XML文件并将json对象的相关属性写入XML文件,实现人员关系模型的保存;
步骤4:在前台读取本地XML文件,获取XML文件中存储的图元对象Element和连接线对象Link的相关属性,在画布Paper上依据这些属性创建所有的图元对象Element和连接线对象Link,最终还原完整的人员关系模型。
本发明有益效果:本发明在给定的源模型基础上,通过迁移学习,挖掘出数据集中的新关系,优化该模型。目前迁移学习的应用范围主要集中在“计算机视觉”和“文本分类”两方面,本发明的主要内容是借助迁移学习的方法来构建人员关系模型,分析社交网络中人员之间的潜在关系。使用XML文件保存数据,读取方便快捷,避免使用庞大冗杂的数据库。本发明将人员之间的关系,以图形的形式进行展示,具有直观、形象、生动、具体等特点,可以使复杂的人员关系网络简单化、通俗化、形象化,使人一目了然,便于理解和比较。
附图说明
图1是一种基于迁移学习方法生成人员关系模型的建模方法;
图2是TrAdaBoost算法流程图;
图3是系统功能结构图;
具体实施方式
下面结合附图对本发明具体实施方式做进一步说明。
本发明的一种基于迁移学习的人员关系模型建模方法,实现方法为,在给定的源模型基础上,通过迁移学习,挖掘出数据集中的新关系种类,优化该模型,得到目标模型。具体步骤为:首先初始化权重向量,训练出一个弱分类器;其次通过计算该分类器的错误率,对权重向量进行更新;再次依据新的权重向量,得到一个优化分类器,迭代上述操作,最后得到当前最优分类器。根据建模方法设计并实现了一个人员关系系统,该系统自动绘制人员关系模型。通过上述方式,本发明通过挖掘社交网络中人员之间的新关系种类来优化给定的人员关系模型,并以可视化的形式展示。
如图1所示,在给定的源模型基础上,通过迁移学习,挖掘出数据集中的新关系,优化该模型。所述方法包括如下步骤:
步骤1:将数据集输入给定的源模型SourceModel,分析人员之间的关系;
步骤2:当源模型SourceModel无法解析人员数据记录之间的关系特征或者出现解析不准确的情况时,通过迁移学习对其关系进行优化,获得新关系集;
步骤3:根据新关系集,获得目的模型TargetModel;
根据上述建模方法,设计并实现了一个人员关系系统。
上述的一种基于迁移学习的人员关系模型建模方法的人员关系源模型SourceModel具体为:
设人员数据集为D={x1,x2,…,xm},其中,xi代表人员数据集D中第i条人员数据记录,标记关系种类集R为:
R={<r1,f1(p,q)>,<r2,f2(p,q)>,…<rn,fn(p,q)>}
其中,ri为第i种关系,fi(p,q)为bool型函数,返回人员数据记录p和q是否具有关系ri。标记关系记录集合M为:
M={<(p1,q1),r1>,<(p2,q2),r2>,…<(pk,qk),rk>}
其中<(pi,qi),ri>代表人员pi和qi之间具有关系ri。所述源模型SourceModel即为:将数据集D中的两条人员数据记录p和q组成二元组<p,q>,向SourceModel输入任意上述格式二元组,SourceModel能够准确判断两个人员<p,q>是否具有R中标记的关系,如果有,则输出具体关系。
上述的一种基于迁移学习的人员关系模型建模方法的迁移学习的具体实现步骤为:
步骤1:模型迁移当引入新的人员数据记录x进行测试时,SourceModel无法解析人员数据记录x与其他人员数据记录y的关系特征或者出现解析不准确的情况,则创建一个新的关系种类rn+1作为新关系。然后引入较多条具有与人员数据记录x和y同类特征的人员数据记录构成辅助关系数据集:
M'={<(p1,q1),rn+1>,<(p2,q2),rn+1>,…<(ps,qs),rn+1>}
然后使用TrAdaBoost算法,将M和M'作为该算法得到的最优分类器的输入,使源模型SourceModel完成迁移学习,输出的扩展标记关系种类集为:
R′={<r1,f1(p,q)>,<r2,f2(p,q)>,…<rn,fn(p,q)>,<rn+1,fn+1(p,q)>}
使源模型得到优化。
步骤2:模型应用具体是设经过迁移学习后的目标模型为TargetModel,当向目标模型中输入两条人员数据记录a和b,该模型会输出a和b之间的关系r,这些数据组成一个三元组<a,b,r>,表示人员数据记录a和b之间存在关系r,并将该三元组保存在集合S中。
如图2所示,步骤1中TrAdaBoost算法的具体实现步骤为:
步骤1:设Xb为源样例空间,Xa为辅助样例空间。源样例空间这里就是后面引入的关系记录数据集M'的组件<p,q>集合,辅助样例空间就是原有的关系记录数据集M的组件<p,q>集合。设Y={0,1}为标签空间,0代表p与q之间的关系不是rn+1,1代表p与q之间的关系是rn+1。这样构成训练数据现将训练数据划分为两个数据集:
其中c(x)代表样本数据x的真实所属标签(0/1)
步骤2:初始化权重向量其中
步骤3:设迭代循环N次,最大迭代次数N根据计算机的性能而定,设置参数
步骤4:迭代循环N次,设t=1,2,……,N,为当前循环轮数,最大迭代次数N根据计算机的性能而定,循环体内具体为:
步骤4.1:求权重分布
步骤4.2:使用具有权值分布pt的训练数据集学习,得到可以应用到测试集合上的分类器ht:X→Y
步骤4.3:计算ht在Tb上的错误率:
步骤4.4:设置参数
步骤4.5:设置新的权重向量
步骤5:输出最终分类器
上述的一种基于迁移学习的人员关系模型建模方法设计并实现一个人员关系系统的具体实现为:
步骤1:创建哈希表PIM(Personnel Identification Map)作为人员身份表,其中键(Key)为人员的身份(Identify),值(Value)为一个用来绘制相关身份人员的图元类,类的属性表述该类人员所共有的画图属性,包含颜色,图标,标签等属性。
步骤2:扫描人员数据集D,在人员身份表PIM中,查询数据记录xi的身份xi-identify,若查询为空,则将xi-identify作为键添加到PIM,然后创建一个图元类,并设置类的属性,并将这个类作为键xi-identify的值。
步骤3:创建哈希表RM(Relationship Map)作为关系表,键(Key)为关系名称(Relationship Name),值(Value)为一个用来绘制相关关系的连接线类,类的属性表述该类关系所共有的画图属性,包含颜色,线型(直线,曲线,折线)等属性。
步骤4:扫描关系种类集R,在关系表RM中,查询数据记录ri的名称ri-name,若查询为空,则将ri-name作为键添加到RM,然后创建一个连接线类,并设置类的属性,并将这个类作为键ri-name的值。
步骤5:设计实现常用的画图操作,包括图元的复制、粘贴、模型的放大、缩小等,将之封装为一个系统,该系统能够实现人员关系模型的绘制与保存。
根据上述的人员关系系统,步骤5中人员关系模型的绘制具体是读取集合S中三元组<a,b,r>,并将其在画布上实例化,完成人员关系模型的可视化,其具体实现步骤为:
步骤1:读取集合S中的一个三元组<ai,bi,ri>,识别人员ai的身份ai-identify,查询在PIM中键值等于ai-identify的值,为人员ai创建一个对象,继承父类PIM[ai-identify]的属性;对人员bi做相同处理。识别关系ri的名称ri-name,查询在RM中键值等于ri-name的值,为关系ri创建一个对象,继承父类RM[ri-name]关系属性。
步骤2:在画布Paper上,将人员ai和bi实例化为图元对象Element,图元分为上下两部分,上半部分包含父类的身份名称label,颜色color,图标icon.下半部分包含人员的相关信息。将ri实例化为连接线link,连接代表人员ai和bi的图元,在连接线上表述该关系的名称。
步骤3:继续处理集合S中其他三元组,直至全部完成,实现人员关系模型的可视化。
步骤5中人员关系模型的保存具体是将画布上已经绘制的模型的相关信息保存在后台的XML文件中,并支持通过XML文件在空白画布上还原模型,具体实现步骤为:
步骤1:获取画布Paper上的所有图元对象Element,提取图元对象Element的相关属性,依据这些属性为每一个图元对象Element创建一个json对象。
步骤2:获取画布Paper上的所有连接线对象Link,提取连接线对象Link的相关属性,依据这些属性为每一个连接线对象Link创建一个json对象。
步骤3:通过Ajax将这些json对象从画布Paper前台传至后台,在后台接收json对象然后通过Java方法创建XML文件并将json对象的相关属性写入XML文件,实现人员关系模型的保存。
步骤4:在前台读取本地XML文件,获取XML文件中存储的图元对象Element和连接线对象Link的相关属性,在画布Paper上依据这些属性创建所有的图元对象Element和连接线对象Link,最终还原完整的人员关系模型。
本发明具体实施方式还包括:
本发明包括以下步骤:
步骤1:将数据集输入给定的源模型SourceModel,分析人员之间的关系;
步骤2:当源模型SourceModel无法解析人员数据记录之间的关系特征或者出现解析不准确的情况时,通过迁移学习对其关系进行优化,获得新关系集;
步骤3:根据新关系集,获得目的模型TargetModel;
根据上述建模方法,设计并实现了一个人员关系系统。
上述的一种基于迁移学习的人员关系模型建模方法,人员关系源模型SourceModel具体为:
设人员数据集为D={x1,x2,…,xm},其中,xi代表人员数据集D中第i条人员数据记录,标记关系种类集R为:
R={<r1,f1(p,q)>,<r2,f2(p,q)>,…<rn,fn(p,q)>}
其中,ri为第i种关系,fi(p,q)为bool型函数,返回人员数据记录p和q是否具有关系ri。标记关系记录集合M为:
M={<(p1,q1),r1>,<(p2,q2),r2>,…<(pk,qk),rk>}
其中<(pi,qi),ri>代表人员pi和qi之间具有关系ri。所述源模型SourceModel即为:将数据集D中的两条人员数据记录p和q组成二元组<p,q>,向SourceModel输入任意上述格式二元组,SourceModel能够准确判断两个人员<p,q>是否具有R中标记的关系,如果有,则输出具体关系。
迁移学习的具体实现步骤为:
步骤1:模型迁移当引入新的人员数据记录x进行测试时,SourceModel无法解析人员数据记录x与其他人员数据记录y的关系特征或者出现解析不准确的情况,则创建一个新的关系种类rn+1作为新关系。然后引入较多条具有与人员数据记录x和y同类特征的人员数据记录构成辅助关系数据集:
M'={<(p1,q1),rn+1>,<(p2,q2),rn+1>,…<(ps,qs),rn+1>}
然后使用TrAdaBoost算法,将M和M'作为该算法的输入,使源模型SourceModel完成迁移学习,扩展标记关系种类集为:
R={<r1,f1(p,q)>,<r2,f2(p,q)>,…<rn,fn(p,q)>,<rn+1,fn+1(p,q)>}
使源模型得到优化。
步骤2:模型应用具体是设经过迁移学习后的目标模型为TargetModel,当向目标模型中输入两条人员数据记录a和b,该模型会输出a和b之间的关系r,这些数据组成一个三元组<a,b,r>,表示人员数据记录a和b之间存在关系r,并将该三元组保存在集合S中。
TrAdaBoost算法的具体实现步骤为:
步骤1:初始化权重向量,训练出一个弱分类器。
步骤2:通过计算分类器的错误率,对权重向量进行更新
步骤3:依据新的权重向量,得到一个优化分类器
步骤4:迭代步骤2和3,最后得到当前最优分类器
所述设计并实现一个人员关系系统的具体实现为:
步骤1:创建哈希表PIM(Personnel Identification Map)作为人员身份表,其中键(Key)为人员的身份(Identify),值(Value)为一个用来绘制相关身份人员的图元类,类的属性表述该类人员所共有的画图属性,包含颜色,图标,标签等属性。
步骤2:扫描人员数据集D,在人员身份表PIM中,查询数据记录xi的身份xi-identify,若查询为空,则将xi-identify作为键添加到PIM,然后创建一个图元类,并设置类的属性,并将这个类作为键xi-identify的值。
步骤3:创建哈希表RM(Relationship Map)作为关系表,键(Key)为关系名称(Relationship Name),值(Value)为一个用来绘制相关关系的连接线类,类的属性表述该类关系所共有的画图属性,包含颜色,线型(直线,曲线,折线)等属性。
步骤4:扫描关系种类集R,在关系表RM中,查询数据记录ri的名称ri-name,若查询为空,则将ri-name作为键添加到RM,然后创建一个连接线类,并设置类的属性,并将这个类作为键ri-name的值。
步骤5:设计实现常用的画图操作,包括图元的复制、粘贴、模型的放大、缩小等,将之封装为一个系统,该系统能够实现人员关系模型的绘制与保存。
步骤5中人员关系模型的绘制具体是读取集合S中三元组<a,b,r>,并将其在画布上实例化,完成人员关系模型的可视化,其具体实现步骤为:
步骤1:读取集合S中的一个三元组<ai,bi,ri>,识别人员ai的身份ai-identify,查询在PIM中键值等于ai-identify的值,为人员ai创建一个对象,继承父类PIM[ai-identify]的属性;对人员bi做相同处理。识别关系ri的名称ri-name,查询在RM中键值等于ri-name的值,为关系ri创建一个对象,继承父类RM[ri-name]关系属性。
步骤2:在画布Paper上,将人员ai和bi实例化为图元对象Element,图元分为上下两部分,上半部分包含父类的身份名称label,颜色color,图标icon.下半部分包含人员的相关信息。将ri实例化为连接线link,连接代表人员ai和bi的图元,在连接线上表述该关系的名称。
步骤3:继续处理集合S中其他三元组,直至全部完成,实现人员关系模型的可视化。
步骤5中人员关系模型的保存具体是将画布上已经绘制的模型的相关信息保存在后台的XML文件中,并支持通过XML文件在空白画布上还原模型,具体实现步骤为:
步骤1:获取画布Paper上的所有图元对象Element,提取图元对象Element的相关属性,依据这些属性为每一个图元对象Element创建一个json对象。
步骤2:获取画布Paper上的所有连接线对象Link,提取连接线对象Link的相关属性,依据这些属性为每一个连接线对象Link创建一个json对象。
步骤3:通过Ajax将这些json对象从画布Paper前台传至后台,在后台接收json对象然后通过Java方法创建XML文件并将json对象的相关属性写入XML文件,实现人员关系模型的保存。
步骤4:在前台读取本地XML文件,获取XML文件中存储的图元对象Element和连接线对象Link的相关属性,在画布Paper上依据这些属性创建所有的图元对象Element和连接线对象Link,最终还原完整的人员关系模型。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种基于迁移学习的人员关系模型建模方法,其特征在于,包括以下步骤:
步骤1:将数据集输入给定的人员关系源模型SourceModel,分析人员之间的关系;
步骤2:当源模型SourceModel无法解析人员数据记录之间的关系特征或者出现解析不准确的情况时,通过迁移学习对人员关系源模型SourceModel的关系种类集R进行优化,获得扩展标记关系种类集R′;
步骤3:根据扩展标记关系种类集R′,获得目的模型TargetModel;
步骤4:将目标模型TargetModel的分析结果以可视化模型展示出来。
2.根据权利要求1所述的一种基于迁移学习的人员关系模型建模方法,其特征在于:所述人员关系源模型SourceModel具体为:
设人员数据集为D={x1,x2,…,xm},其中,xi代表人员数据集D中第i条人员数据记录,标记关系种类集R为:
R={<r1,f1(p,q)>,<r2,f2(p,q)>,…<rn,fn(p,q)>}
其中,ri为第i种关系,fi(p,q)为bool型函数,返回人员数据记录p和q是否具有关系ri,标记关系记录集合M为:
M={<(p1,q1),r1>,<(p2,q2),r2>,…<(pk,qk),rk>}
其中<(pi,qi),ri>代表人员pi和qi之间具有关系ri,源模型SourceModel即为:将数据集D中的两条人员数据记录p和q组成二元组<p,q>,向SourceModel输入任意上述格式二元组,SourceModel能够准确判断两个人员<p,q>是否具有R中标记的关系,如果有,则输出具体关系。
3.根据权利要求1所述的一种基于迁移学习的人员关系模型建模方法,其特征在于:所述迁移学习包括:当引入新的人员数据记录x进行测试时,当SourceModel无法解析人员数据记录x与数据集D中的人员数据记录y的关系特征或者出现解析不准确的情况,则创建一个新的关系种类rn+1作为新关系种类,然后引入具有与人员数据记录x和y同类特征的人员数据记录构成辅助关系数据集M′:
M′={<(p1,q1),rn+1>,<(p2,q2),rn+1>,…<(ps,qs),rn+1>}
然后使用TrAdaBoost算法,将M和M′作为该算法的输入,使源模型SourceModel完成迁移学习,扩展标记关系种类集为:
R′={<r1,f1(p,q)>,<r2,f2(p,q)>,…<rn,fn(p,q)>,<rn+1,fn+1(p,q)>}
4.根据权利要求3所述的一种基于迁移学习的人员关系模型建模方法,其特征在于:TrAdaBoost算法包括:
步骤1:初始化权重向量,训练出一个弱分类器;
步骤2:通过计算分类器的错误率,对权重向量进行更新;
步骤3:依据新的权重向量,得到一个优化分类器;
步骤4:迭代步骤2和3,最后得到当前最优分类器。
5.根据权利要求1所述的一种基于迁移学习的人员关系模型建模方法,其特征在于:目标模型TargetModel具体为:将数据集D中的两条人员数据记录p和q组成二元组<p,q>,向TargetModel输入任意上述格式二元组,TargetModel能够准确判断两个人员<p,q>是否具有R′中标记的关系,如果有,则输出具体关系。
6.根据权利要求1所述的一种基于迁移学习的人员关系模型建模方法,其特征在于:将目标模型TargetModel的分析结果以可视化模型展示出来包括:
步骤1:创建集合S,向目标模型TargetModel中输入两条人员数据记录a和b,该模型会输出a和b之间的关系r,组成一个三元组<a,b,r>,表示人员数据记录a和b之间存在关系r,并将该三元组保存在集合S中;
步骤2:创建哈希表PIM作为人员身份表,其中键为人员的身份,值为一个用来绘制对应身份人员的图元类,类的属性表述该类人员所共有的画图属性,包含颜色,图标,标签等属性;
步骤3:扫描人员数据集D,在人员身份表PIM中,查询数据记录xi的身份xi-identify,若查询为空,则将xi-identify作为键添加到PIM,然后创建一个图元类,并设置类的属性,并将这个类作为键xi-identify的值;
步骤4:创建哈希表RM作为关系表,键为关系名称,值为一个用来绘制相关关系的连接线类,类的属性表述该类关系所共有的画图属性,包含颜色,线型(直线,曲线,折线)等属性;
步骤5:扫描关系种类集R′,在关系表RM中,查询数据记录ri的名称ri-name,若查询为空,则将ri-name作为键添加到RM,然后创建一个连接线类,并设置类的属性,并将这个类作为键ri-name的值;
步骤6:设计实现画图操作和图形编辑,图形编辑包括图元的复制、粘贴、模型的放大、缩小,将画图操作和图形编辑封装为一个系统,该系统能够实现人员关系模型的绘制与保存。
7.根据权利要求6所述的一种基于迁移学习的人员关系模型建模方法,其特征在于:所述人员关系模型的绘制包括:
步骤1:读取集合S中的一个三元组<ai,bi,ri>,识别人员ai的身份ai-identify,查询在PIM中键值等于ai-identify的值,为人员ai创建一个对象,继承父类PIM[ai-identify]的属性;对人员bi做相同处理;识别关系ri的名称ri-name,查询在RM中键值等于ri-name的值,为关系ri创建一个对象,继承父类RM[ri-name]关系属性;
步骤2:在画布Paper上,将人员ai和bi实例化为图元对象Element,图元分为上下两部分,上半部分包含父类的身份名称label,颜色color,图标icon;下半部分包含人员的相关信息;将ri实例化为连接线link,连接代表人员ai和bi的图元,在连接线上表述该关系的名称;
步骤3:继续处理集合S中其他三元组,直至全部完成,实现人员关系模型的可视化。
8.根据权利要求6所述的一种基于迁移学习的人员关系模型建模方法,其特征在于:所述人员关系模型的保存包括:
步骤1:获取画布Paper上的所有图元对象Element,提取图元对象Element的属性,依据这些属性为每一个图元对象Element创建一个json对象;
步骤2:获取画布Paper上的所有连接线对象Link,提取连接线对象Link的相关属性,依据这些属性为每一个连接线对象Link创建一个json对象;
步骤3:通过Ajax将这些json对象从画布Paper前台传至后台,在后台接收json对象然后通过Java方法创建XML文件并将json对象的相关属性写入XML文件,实现人员关系模型的保存;
步骤4:在前台读取本地XML文件,获取XML文件中存储的图元对象Element和连接线对象Link的相关属性,在画布Paper上依据这些属性创建所有的图元对象Element和连接线对象Link,最终还原完整的人员关系模型。
CN201910511284.3A 2019-06-13 2019-06-13 一种基于迁移学习的人员关系模型建模方法 Active CN110232102B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910511284.3A CN110232102B (zh) 2019-06-13 2019-06-13 一种基于迁移学习的人员关系模型建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910511284.3A CN110232102B (zh) 2019-06-13 2019-06-13 一种基于迁移学习的人员关系模型建模方法

Publications (2)

Publication Number Publication Date
CN110232102A true CN110232102A (zh) 2019-09-13
CN110232102B CN110232102B (zh) 2020-12-04

Family

ID=67859879

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910511284.3A Active CN110232102B (zh) 2019-06-13 2019-06-13 一种基于迁移学习的人员关系模型建模方法

Country Status (1)

Country Link
CN (1) CN110232102B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090276390A1 (en) * 2008-04-30 2009-11-05 Fujitsu Limited Modeling support system, modeling support method, and modeling support program
CN107194347A (zh) * 2017-05-19 2017-09-22 深圳市唯特视科技有限公司 一种基于面部动作编码系统进行微表情检测的方法
CN108734734A (zh) * 2018-05-18 2018-11-02 中国科学院光电研究院 室内定位方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090276390A1 (en) * 2008-04-30 2009-11-05 Fujitsu Limited Modeling support system, modeling support method, and modeling support program
CN107194347A (zh) * 2017-05-19 2017-09-22 深圳市唯特视科技有限公司 一种基于面部动作编码系统进行微表情检测的方法
CN108734734A (zh) * 2018-05-18 2018-11-02 中国科学院光电研究院 室内定位方法及系统

Also Published As

Publication number Publication date
CN110232102B (zh) 2020-12-04

Similar Documents

Publication Publication Date Title
Hui et al. Linguistic structure guided context modeling for referring image segmentation
Karnitis et al. Migration of relational database to document-oriented database: Structure denormalization and data transformation
CA2884365C (en) Graphically representing programming attributes
CN109976735B (zh) 一种基于web可视化的知识图谱算法应用平台
BE1024144B1 (nl) Verbeterde constructie van databaseschemamodellen voor databasesystemen en rest api’s
Sannella Constraint satisfaction and debugging for interactive user interfaces
KR100969656B1 (ko) 엑셀기반 분석보고서 작성 시스템 및 방법
CN102915237B (zh) 根据用户应用程序要求改写数据质量规则的方法和系统
CN107807913A (zh) 一种基于web的电子表单设计系统及方法
US9552403B2 (en) Converting data models into in-database analysis models
CN106104518A (zh) 用于按照示例的数据提取的框架
US7962895B2 (en) Language for binding scalable vector graphics elements to java classes
CN106709017A (zh) 一种基于大数据的辅助决策方法
Chen et al. Graph edit distance reward: Learning to edit scene graph
Maté et al. Tracing conceptual models' evolution in data warehouses by using the model driven architecture
CN110968294A (zh) 一种业务领域模型建立系统及方法
CN113867694B (zh) 一种智能生成前端代码的方法和系统
CN103544338B (zh) 一种面向三维装配指令发布的工艺信息建模方法
CN107562763A (zh) 数据变化的显示方法及装置
US20210240675A1 (en) Automatic conversion of data models using data model annotations
CN110232102A (zh) 一种基于迁移学习的人员关系模型建模方法
CN114895875B (zh) 一种零代码可视化信息系统元数据的生产应用方法及系统
Jones An example-based introduction to graph grammars for modeling
CN103645899B (zh) 一种将cad中设计数据集成到erp系统的方法
KR102499832B1 (ko) 쿼리 바인딩 기능을 구비한 온라인 보고서 작성 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant