CN103995858B - 基于任务分解的个性化知识主动推送方法 - Google Patents

基于任务分解的个性化知识主动推送方法 Download PDF

Info

Publication number
CN103995858B
CN103995858B CN201410205531.4A CN201410205531A CN103995858B CN 103995858 B CN103995858 B CN 103995858B CN 201410205531 A CN201410205531 A CN 201410205531A CN 103995858 B CN103995858 B CN 103995858B
Authority
CN
China
Prior art keywords
knowledge
concept
user
semantic
protonotion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410205531.4A
Other languages
English (en)
Other versions
CN103995858A (zh
Inventor
刘继红
占红飞
赵振杰
王宽
姜浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201410205531.4A priority Critical patent/CN103995858B/zh
Publication of CN103995858A publication Critical patent/CN103995858A/zh
Application granted granted Critical
Publication of CN103995858B publication Critical patent/CN103995858B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于任务分解的个性化知识主动推送方法,涉及知识密集型企业知识资源管理与应用方法。本方法包含设计过程任务活动模型的构建、基于领域本体的知识需求模型构建、用户特征建模构建和进行个性化知识主动推送。通过工作流引擎进行任务分解,将工作业务流程与知识关联;采用概念语义三级扩展方法进行概念扩展;并提供知识过滤和排序方法,实现基于任务分解的个性化知识主动推送。本发明可获取尽可能详细的知识需求,形成更为完整和丰富的知识需求集,能够符合用户偏好进行个性化知识主动推送,知识推送加速知识流动,提高知识的效用和服务效率,真正实现知识源于业务并应用于业务的目标,从而提高企业知识利用效率和知识创新能力。

Description

基于任务分解的个性化知识主动推送方法
技术领域
本发明涉及计算机应用技术领域,涉及知识密集型企业知识资源管理与应用方法,尤其涉及基于任务分解的个性化知识主动推送方法。
背景技术
现代企业尤其是正在兴起的知识密集型企业的管理活动中,知识已经成为一种重要的企业资源,并逐渐成为决定企业生存和发展的关键性因素(参考文献[1]刘新宇.基于流程的知识推送系统的理论框架与应用研究[D].沈阳:东北大学博士学位论文.2005)。因此,如何有效的管理企业的知识,并通过多种途径增加企业的知识储备,合理利用知识资源将成为企业面临的一大难题。并且随着网络的普及和信息技术的快速发展,组织知识存量增长迅速,知识管理系统中包含数量众多的知识信息体,其涉及的范围很广,而知识拉取容易出现“信息过剩”的现象。在以知识为核心的知识型组织中,如何依据人们的知识需求,主动将合适的知识推送给需求者,从而提高知识工作者知识应用和创新能力,己经成为其提高知识的效用和知识创新的关键,而知识推送正好可以克服“知识过剩”,并可减少用户获取知识的工作量,因此,知识推送己成为提高知识管理系统的服务效率的重要途径(参考文献[2]刘豫徽,周良.基于Agent的主动式知识服务系统[J].中国制造业信息化.2008,37(19):16-20;参考文献[3]倪建友.基于工作流的知识推送系统模式设计[D].天津:天津大学硕士学位论文.2011)。
知识推送技术是现代企业实施知识管理的过程中正在兴起的新的模式,企业建立起合理的知识推送系统,对于促进企业知识的流动、传播,加速知识的共享与创新,提升企业核心竞争力都具有重要作用(参考文献[4]Linzhen Zhou,Defang Liu,BinWang.Research on Knowledge Active Push Model for ProductDevelopment.International Conference on Networking and Digital Society,2009)。目前,国内外关于知识推送模式的研究取得了很多的成果,除了常见的基于用户兴趣、基于内容和基于关联规则三种推送模式外,还包括多种适用于不同企业环境的知识推送模式。在这些知识推送模式中存在以下几点局限,一方面这些知识推动方法很少有关于业务流程的,而在工作业务过程中知识的传递与应用是最为频繁的,尤其像研发设计类知识密集型企业,员工在工作过程中需要用到大量与业务流程相关的知识,需要一种基于业务流程的知识推送系统以辅助其更好的完成工作。将工作流技术与知识推送理论相结合,设计出基于工作流和知识推送的系统模式,对于企业明确业务流程,规范业务活动,提高服务质量都具有重大意义。另一方面这些推送方法的知识对象来源单一,导致知识推送的源泉活力不足。知识密集型企业积累的大量知识分散在各个部门,存储于分布式知识源中。各个部门根据实际业务需要,对知识源的表示和存储不同。这些知识源在结构上和语义上都是异构的,尤其是存在大量语义异构知识(知识源采用不同的语义表示知识,如同词异义和同义词现象)。
发明内容
基于现有技术存在的问题:需要基于业务流程的知识推送技术以辅助工作更好完成,知识推送的源泉活力不足,且存在大量语义异构知识,直接应用存在困难等。本发明提供了一种基于任务分解的个性化知识主动推送方法。
本发明提出的基于任务分解的个性化知识主动推动方法,具体步骤为:
步骤1:构建设计过程任务活动模型,将设计任务分解为不同的工作任务,将工作任务与所需的知识资源进行关联。
步骤2:构建基于领域本体的知识需求模型,包括领域本体构建和基于领域本体的语义扩展。
步骤3:采用基于本体的表示方法构建用户特征模型。
步骤4:建立知识库的索引表,进行个性化知识主动推送。
步骤2中所述的基于领域本体的语义扩展中,通过中文分词方法形成初始知识推送集,再采用概念语义三级扩展方法获取最终的知识推送集;
其中,概念语义三级扩展方法的步骤如下:
步骤a:将中文分词方法形成的初始知识推送集中的本体概念与构建的领域本体关联,形成待扩展概念需求集CS0;
步骤b:以CS0中每一个概念Ci为中心,通过自定义的领域本体关系集RS中的语义关系扩展,形成以Ci为中心的一级扩展概念集CS1;
步骤c:以CS1中每一个概念Cii为中心,通过领域本体关系集RS中的语义关系扩展,形成以Cii为中心的二级扩展概念集CS2;
步骤d:以CS2中每一个概念Ciii为中心,通过领域本体关系集RS中的语义关系扩展,形成以Ciii为中心的三级扩展概念集CS3;
不同级别的概念集表示不同的语义距离,各级扩展概念集中节点语义相关度由以下规则确定:
规则1:根据本体关系设定语义相关度,设定同义关系的语义相关度为0.9,实例关系的语义相关度为0.8,继承关系的语义相关度为0.7,同类关系的语义相关度为0.6,组成关系的语义相关度为0.5,属性关系的语义相关度为0.3;
规则2:一级扩展概念与原始概念的语义相关度根据本体关系的类别由规则1确定;二级扩展概念与原始概念的语义相关度,是二级扩展概念关联的一级本体关系类型与二级本体关系类型对应的语义相关度的乘积;三级扩展概念与原始概念的语义相关度,是三级扩展概念关联的一级本体关系类型、二级本体关系类型和三级本体关系类型对应的语义相关度的乘积;
规则3:如果概念A的关系扩展概念C同时也是概念B的关系扩展概念,并且概念A和概念B不是扩展关系,则概念C与原始概念的语义相关度取根据规则2计算的值中最大的;
规则4:如果概念A的关系扩展概念C同时也是概念B的关系扩展概念,并且概念B和概念A是一级扩展关系,概念C与原始概念的语义相关度根据规则2得到两个值,将其中较小值的一半作为加成量,得到合成权重=较大值+一半的较小值,若合成权重超过1,则设置最终概念C与原始概念的语义相关度为1,否则最终概念C与原始概念的语义相关度为合成权重;
规则5:如果概念A的关系扩展概念C同时也是概念B的关系扩展概念,并且概念B和概念A是二级扩展关系,则概念C与原始概念的语义相关度根据规则2得到两个值,将其中较小值的四分之一作为加成量,得到合成权重=较大值+四分之一的较小值,若合成权重超过1,则设置最终概念C与原始概念的语义相关度为1,否则最终概念C与原始概念的语义相关度为合成权重。
本发明提供了一种能够符合用户偏好,基于任务分解的个性化知识主动推送方法,通过知识推送加速知识流动,提高知识的效用和服务效率,结合设计过程任务活动模型,真正实现知识源于业务并应用于业务的目标,从而提高企业知识创新能力。
附图说明
图1是本发明基于任务分解的知识主动推送服务框架示意图;
图2是本发明的知识主动推送方法中设计过程任务活动模型的示意图;
图3是本发明的知识主动推送方法中知识概念三层语义扩展模型示意图;
图4是本发明的基于任务分解的个性化知识主动推动方法的流程图。
具体实施方式
下面结合附图和具体实例来说明本发明的技术方案。
本发明提出基于任务分解的个性化知识主动推动方法,首先通过对知识密集型企业设计过程知识活动的分析,建立工作业务流程与知识的关联,并在此基础上提出设计过程任务活动模型,实现对知识与业务流程的映射;接着构建基于领域本体的知识需求模型,为了尽可能详细的捕获设计活动模型中全部的知识需求,借助领域本体的语义关联实现对知识推送需求概念三级扩展,形成更为完整和丰富的知识需求集;然后构建用户特征模型,实现对用户兴趣爱好、能力、关联关系等个性化条件的建模;最后提出知识过滤和排序方法,实现基于任务分解的个性化知识主动推送。
本发明主要突出知识与流程相结合、知识语义相关性以及知识与用户特征模型相匹配度。其核心思想是通过对设计过程业务知识活动的分析,结合基于领域本体的知识需求模型和用户特征模型,向用户推荐与业务过程和用户偏好相符的知识信息。下面对实现步骤进行说明。
步骤1:通过对知识密集型企业设计过程知识活动的分析,构建设计过程任务活动模型。
为了提高知识推送的精准性,需要对产品设计过程进行分析以了解设计人员在设计过程中的知识活动。企业通常采用协同设计的方法,将整个设计任务分解成不同的子任务,利用工作流引擎(或其它方式)将子任务分发给具有专长的设计人员,由设计人员各自完成具体的设计任务。具体工作流引擎分解过程是:首先对设计任务进行WBS(WorkBreakdown Structure,工作分解结构)分解,WBS分解参考任务类型,不同的产品任务对应不同流程形态;每一个WBS中的工作任务点对应一个工作流程,每一个工作流对应具体的求解过程。设计人员利用工作流引擎分解任务,明确每一个子任务的目标、对象和约束信息。一方面设计人员可以从知识库查阅得到设计手册、设计标准和其他设计经验,另一方面获取与任务相关的其他设计人员的信息和以前成果展示,如设计规范,设计方案,总结报告等,进一步明确任务的交付物。在任务求解过程中,知识、人作为企业的主要智力资产始终贯穿于整个任务求解过程之中,设计过程任务活动模型如图2所示。
在设计知识资源的支持下,设计人员为满足设计任务的要求(目标、约束),对设计问题进行求解,进而得到设计结果。任务知识资源包括设计经验、设计标准、设计手册以及学术专著等多方面的内容;设计人员,即节点专家,是设计知识的使用者,也是知识推送的对象;设计任务描述了设计目标,设计约束以及所涉及的设计对象等信息。因此建立设计人员、知识资源和工作任务的映射关系。每一工作任务节点都有详细的目标、对象和约束信息,然后对目标、对象和约束信息分析需要的知识资源并建立关联,而知识资源又和其他设计人员紧密关联,至此,完成对每一个工作任务节点的设计过程任务活动模型的构建。
在分析设计过程任务活动模型的基础上,建立工作流与知识资源的关联关系,映射知识资源与业务流程。建立工作流与知识资源的关联关系的常用方式是取用系统集成的办法,将业务流程与知识之间的关联过程集成到系统中去,当需要为业务活动提供知识支持时,系统自动寻找到所需的知识点,并按照特定的形式显示给员工。以典型的PDM(产品数据管理)业务系统为例,集成知识管理系统与PDM业务系统,实现在PDM系统中的知识创建、知识检索和知识推送功能,积累专业基础知识、专业标准规范、设计经验、实用技巧等知识资源。用户在PDM系统完成工作流节点任务过程中,如创建设计文档,通过设计过程任务活动模型记录用户创建文档任务的相关属性,将与任务相关的知识资源主动推送给用户,包括内容模板、技术文档等及其它知识资源。同时知识管理系统存储PDM业务系统中所创建的设计过程模型与知识资源关联关系映射。
步骤2:基于领域本体的知识需求模型构建,包括步骤2.1:知识型密集企业领域本体构建;步骤2.2:基于领域本体的语义扩展。为了尽可能详细的捕获设计任务活动模型中全部的知识需求,借助领域本体的语义关联性并按照设定的概念扩展规则实现对知识推送需求概念三级扩展,形成具备语义关联强度的知识需求集。
步骤2.1:企业领域本体构建。
本体的构建是一个庞大的、复杂的过程,在需要领域专家的大量参与的同时,也离不开相关的规则与方法的指导。最有影响力的是Gruber在1995年提出的本体构建的五项基本原则:①明确性和客观性:本体应该对其中的术语给出明确的、客观的语义定义;②完全性:本体中给出的定义必须能完整地描述对象术语的含义;③一致性:相关术语的推理结论不能产生矛盾与冲突;④最大单调可扩展性:当需要对本体进行扩展即增加通用的或专有的术语时,应该不需要或尽可能少地修改现有的本体内容;⑤最小本体承诺:本体中术语的相关约束应该尽可能地少。
而关于本体建模方法,目前尚未达成一个统一的标准,相关研究多是从特定领域特点以及项目实践经验出发对本体构建的相关理论与方法的总结,每一个项目或工程都拥有自己独立的方法,因此,本体的工程构建到目前为止仍处于不成熟的阶段。得到公认的有IDEF5方法、METHONTOLOGY法、KACTUS工程法、SENSUS法等。这些本体构建方法对细节的描述较少,且对于怎样形式化表达知识,对前期知识的收集、分析以及开发人员与领域专家怎样合作表述不够详细,而在实际构建过程中又不得不面临这样的问题。本发明综合了现有研究和知识密集型企业特点,采用基于IDEF5的本体构建方法,从企业核心资料中采用自顶向下的方式来分析领域本体概念,概念主要从企业的术语标准规范、设计流程关键词、叙词表、期刊文献中收集,确认概念层次框架。在本体模型中,关系的定义至关重要,是概念之间联系的桥梁。本体对领域知识描述的准确与详尽程度在一定程度上取决于关系定义。对领域本体的寓意关系进行分析,有助于本体开发人员检查本体描述的粒度与正确性,以精炼本体模型;还可以提炼出本体描述中的公理和规则,为知识的精确检索做准备。在这些概念结构框架的基础上,定义六种基本关系,包括同义关系(Is_Synonym),组成关系(Part_of,Has_part)、继承关系(Kind_of,Has_kind)、同类关系(Sibling_of)、属性关系(Attribute_of,Has_attribute)和实例关系(Is_Instance/Has_Instance),其中组成关系、继承关系、同类关系、属性关系以及实例关系为单向互逆关系。同义关系和同类关系为双向对称及传递性关系。单向互逆关系是两个关系满足P1(y,x)->P2(y,x)形式,如Is_Part(制导系统,飞航导弹)->Has_Part(飞航导弹,制导系统)。双向对称关系是一个关系满足P(y,x)->P(y,x)形式,如Is_Sibling(制导装置,制导系统)。传递性关系是一个关系满足P(x,y)and P(y,z)->P(x,z),如Is_Sibling(弹体,导弹外形),Is_Sibling(导弹外形,导弹主体)->Is_Sibling(弹体,导弹主体)。在本体开发过程中,本体开发人员通过直接比对,快速确定术语关系。领域本体按照概念关系集限定的关联关系相互交织,可形成支持推理的描述产品设计知识的复杂语义网络图,作为设计知识管理基础模型,支持后续环节的进行。
借助一定的编辑工具进行相关的本体分析和构建工作,以降低建模难度。根据本体模型与OWL建模元语的映射关系,本发明利用Protégé4.02进行本体建模,利用Protégé进行本体的可视化建模、概念逻辑关系一致性检查以及图形化浏览等。首先,建立概念及关键词间的关系。对于可以用规则推理出关联的关系,不用重复建立。①定义双向对称及传递性关系,选出一个常用核心概念,其他概念只需与其建立关系即可,如同义关系。②定义两个概念间的单向互逆关系时,只需以中心词为主语,按照主谓宾形成建立一个方向的关系(如has_part),而无需建立逆方向的关系(如part_of)。③定义继承关系时,父类建立了关联概念,则子类无需重复建立。④无需定义同位关系,默认同属于一个分类(即拥有一样kind_of或instance_of)的概念间关系为同位关系。
步骤2.2:基于领域本体的语义扩展。
利用领域本体的语义关系,分析和处理知识需求,确定设计问题与本体概念及关系的对应,其基本思想是:①利用领域本体字典和通用词典对业务流程设计任何描述进行需求提取,得到领域术语关键词(存在于领域本体中的术语)和一般关键词,获取设计人员的最初知识需求意图;②利用领域本体对领域术语关键词进行语义扩展,获取与每个关键词具有语义关系的扩展词及权重,由此将设计人员的设计问题转化为计算机理解的本体概念集,形成检索知识需求,实现对设计人员真实意图的捕捉。
步骤2.2.1:实现基于领域本体词典和通用词典的中文分词方法。
本发明通过构建领域本体词典和通用词典实现基于词典的中文分词。领域本体词典就是步骤2.1构建的领域本体库中的概念库,即领域本体词典中的术语就是领域本体模型中已规范好的术语;将自然语言中常用的词语构建成常用语词典;同时为了屏蔽明显无意义的词元,如“的”和“了”等,构建了屏蔽词典。基于这些词典,考虑到知识密集型企业术语的复杂性,将中文分词中正向最大匹配方法和逆向最大匹配方法结合起来,同时优先匹配最长词元构成双向匹配最大词长切分法。先利用领域术语词典从检索式中提出领域术语,再对剩下的检索语句根据常用语词典提取一般词,从而保证了在对检索式进行分词解析时,提取设计问题中的领域术语关键词和一般关键词。首先,检索式分别经过正向匹配和逆向匹配两种分词方法;其次,对得到两种分词结果中的重复词元进行消重,得到一组没有重复词元的分词结果;第三,由于分词结果中可能是另一个词元的子字段,则消除该子字段,保留具有最大词长的词元。
步骤2.2.2,实现知识推送需求概念语义三级扩展方法。
词条提取得到的领域术语关键词由于是根据领域本体提取的,这使得对领域术语关键词进行基于本体的语义扩展成为可能。利用本体中的概念关系,如同义关系、同类关系、继承关系和实例关系及其权重等对该概念进行语义扩展,并将其扩展关系词加入到检索需求关键词集中,形成最终的知识推送集。
如图3所示,概念语义三级扩展方法步骤如下:
1)是将步骤2.2.1中文分词方法形成的初始知识推送集中的本体概念与步骤2.1构建的领域本体关联,形成待扩展概念需求集CS0;
2)以CS0中每一个概念Ci为中心,通过自定义的领域本体关系集RS中的语义关系扩展,形成以Ci为中心的一级扩展概念集CS1;领域本体关系集RS在步骤2.1中获得;
3)以CS1中每一个概念Cii为中心,通过领域本体关系集RS中的语义关系扩展,形成以Cii为中心的二级扩展概念集CS2;
4)以CS2中每一个概念Ciii为中心,通过领域本体关系集RS中的语义关系扩展,形成以Ciii为中心的三级扩展概念集CS3。
不同本体关系表示不同的语义关联,不同的概念层级表示不同的语义距离。因此各级扩展概念集中节点语义相关度由以下规则确定。
1)规则1:不同本体关系表示不同语义关联,根据领域专家经验和不同关系的属性确定本体关系的语义相关度,设定同义关系的语义相关度为0.9,实例关系的语义相关度为0.8,继承关系的语义相关度为0.7,同类关系的语义相关度为0.6,组成关系的语义相关度为0.5,属性关系的语义相关度为0.3。
2)规则2:不同级别的概念集表示不同的语义距离,一级扩展概念与原始概念的语义相关度根据本体关系的类别由规则1确定;二级扩展概念与位于CS0中的原始概念的语义相关度,是该二级扩展概念关联的一级本体关系类型与二级本体关系类型对应的两个语义相关度的乘积;三级扩展概念与原始概念的语义相关度由该三级扩展概念关联的一级本体关系类型、二级本体关系类型与三级本体关系类型对应的三个语义相关度的乘积决定。概念Ci为原始概念,概念Cii是概念Ci的一级扩展概念,概念Ciii由概念Cii扩展得到,设概念Cii与概念Ci之间为继承关系,概念Ciii与概念Cii之间为继承关系,则概念Cii与概念Ci之间的语义相关度为0.7,概念Ciii与概念Ci之间的语义相关度为0.7*0.7=0.49。
3)规则3:如果概念集中概念A的关系扩展(如同类关系)概念C同时也是概念B的关系扩展(如同类关系)概念,并且概念A和概念B不是扩展关系,则概念C与原始概念的语义相关度取根据规则2计算的值中最大的。
4)规则4:如果概念集中概念A的关系扩展(如同类关系)概念C同时也是概念B的关系扩展(如同类关系)概念,并且概念B和概念A是一级扩展关系,则在保留本体关系权重大的概念,并给予关系权重加成处理。具体关系加成计算方法是:根据规则2计算得到概念C与原始概念的语义相关度的两个值,将其中较小值的一半作为加成量,得到合成权重=较大值+一半的较小值,如果合成权重超过1,则设置最终概念C与原始概念的语义相关度为1,否则,最终概念C与原始概念的语义相关度就是合成权重。
5)规则5:如果概念集中概念A的关系扩展(如同类关系)概念C同时也是概念B的关系扩展(如同类关系)概念,并且概念B和概念A是二级扩展关系,则在保留本体关系权重大的概念,并给予关系权重加成处理。具体关系加成计算方法是:根据规则2计算得到概念C与原始概念的语义相关度的两个值,取其中较小值的四分之一作为加成量,得到合成权重=较大值+四分之一的较小值,若合成权重超过1,则设置最终概念C与原始概念的语义相关度为1,否则最终概念C与原始概念的语义相关度就是合成权重。
步骤3:用户特征建模。针对不同用户的兴趣爱好、专业能力、人际关联等个性化特征,多方面搜集知识管理系统内用户的特征数据,构建用户特征模型,并不断对用户特征模型进行更新进化,实现对用户特征的精确刻画。
作为主动知识服务的基础和核心,用户模型的质量直接关系到个性化服务的质量。只有当用户的兴趣、偏好、访问模式等用户信息可以很好地被系统“理解”时,才可能实现理想的个性化服务。用户模型通过学习机制以及推理机制,一方面学习了用户在知识需求上的偏好,另一方面,也可以对用户需求进行推导、归纳。在加入用户模型之后,传统的检索流程变为带着用户兴趣的查找过程,同反馈流程也针对个体用户的意见进行,以提供更加准确和友好的知识服务。用户模型的内容主要包含用户的知识背景、技术水平、用户的能力和偏好等。
(1)首先,进行用户特征模型的信息来源分析。
从理论上说,用户建模的信息主要来源于:用户浏览的知识源、用户浏览的行为、系统日志及用户手工输入的其他信息等。但由于用户信息对用户模型的性能有至关重要的影响,因此需要慎重选择。只有那些能够反映用户兴趣和意图的信息才能作为建模数据,否则构建出来的用户模型将不具有良好的性能。
A)用户浏览的知识源。
用户浏览的知识源可以全面地反映用户的需求。用户在某个知识源上驻留的时间较长,可以表明用户对该知识源不够熟悉。通过用户浏览的知识源构建用户模型,可以实现自动用户建模,因为浏览的知识源可以由系统自动保存,不需要用户提供任何帮助。其缺点是用户有时会意外打开不想阅读的知识源,因此在构建用户模型时,要对这些意外情况进行处理。由于浏览行为对用户兴趣的体现需要以浏览的知识源为载体,因而用户的浏览行为必须与浏览的知识源相结合才能构建用户模型。
B)用户浏览的行为。
用户的浏览行为包括用户对知识源的阅读时间,对知识源进行的操作(如下载、保存、打印页面),鼠标和键盘的操作以及用户浏览页面时眼睛的移动、表情的变化等。用户浏览的行为也能较好地反映用户的需求。因为一般说来,只有用户认为很感兴趣或很重要的文档,才会下载和保存。而且,为了方便管理和访问,用户通常会对收集的感兴趣信息进行分类和整理,以便以后能快速访问。这些经用户保存、整理的文档往往能够反映用户长期关注的主题、从事的研究等用户特点,因而称这种信息为用户的背景知识。
C)系统日志。
系统日志包括用户的IP、访问时间、用户所在的时区、访问的知识源、知识源的大小等信息。系统日志既记录了用户浏览的知识源,也记录了用户在访问过程中的行为,因而能够很好地反映用户的知识需求。
D)用户手工输入的其他信息。
用户手工输入的有关用户兴趣特点的信息,如用户感兴趣主体的关键词、对浏览知识源的熟悉程度、选择的感兴趣领域等等。在自动用户建模技术尚不成熟的情况下,用户手工输入的信息是用户建模的重要信息来源。
在所有的信息来源中,用户浏览的知识源和浏览行为最能全面地反映用户的需求;系统日志也能较好地体现用户的需求;用户输入的查询关键词不宜单独用于用户建模。
(2)用户特征模型的构建。
用户模型记录了每个用户的兴趣集合,同时系统还记录了用户的检索历史、浏览记录以及反馈信息,并在此基础上利用一定的学习机制和推理机制进行兴趣推理。
用户模型的表示方法决定了用户模型反映用户真实信息的能力和可计算能力,同时也在一定程度上限制了用户建模方法的选取。用户模型的表示目前还没有一个统一的标准,常见的表示方法有:基于布尔或加权关键词向量空间模型方法、基于神经网络的用户模型、基于用户—项目矩阵的用户模型表示方法、基于本体的表示方法。本发明采用基于本体的表示方法,引入本体来表示用户模型的最大好处在于能够实现知识的重用和共享,包括用户间本体类样本的共享以及与其他外部本体的知识交流与共享。如果用本体的思想来组织表达用户兴趣的一组关键词,那么在向用户推荐信息的时候,就不再是单纯的关键词匹配,而是把词与词之间的关系考虑进来了,这样就能有效的提高系统的服务质量。
用户特征模型可以表示为一个四元组:
UP=(PI,PK,PA,PC)
其中:UP代表用户特征模型,PI表示用户基本信息、PK表示用户知识背景集合、PA表示用户在知识管理系统和企业业务系统活动信息集合、PC表示用户与用户之间的关联关系集合。PI包括用户姓名、性别、年龄等基本信息和学历、专业、职务、兴趣描述等背景知识;PK为用户知识背景集合,PK={CU,AC,RU,W,E,TC},其中:
CU表示概念的集合,CU={C1,C2,C3,…Cn};n表示CU中的概念数量;
AC表示概念的属性集合,概念C∈CU的属性集合记为AC={aC(i)|i=1,…,|AC|},|AC|表示概念C属性的数目;
RU表示概念之间关系的集合。基于本体的用户建模表示沿用企业领域本体对概念结构框架的定义,基本的关系有六大类:同义关系(Is_Synonym),组成关系(Part_of,Has_part)、继承关系(Kind_of,Has_kind)、同类关系(Sibling_of)、属性关系(Attribute_of,Has_attribute)、和实例关系(Is_Instance/Has_Instance)。
W表示概念的权重,W={w1,w2,…,wn},概念Ck的权重为wk。概念的权重包括该概念的熟悉程度WF和重要性WI;其中用户对概念的熟悉程度WF主要受到时间和记忆内容的影响,德国心理学家Hermann Ebbinghaus提出的人类记忆遗忘理论认为人们对于信息的遗忘的速度会受到一些因素的影响。这些因素包括了:1)需要记忆的信息的难易程度2)记忆者对于信息的理解程度3)记忆者的生理状态。本发明借鉴参考文件[5]和[6](参考文件[5]Fuchs A H.Ebbinghaus's Contributions to Psychology after1885[J],AmericanJournal of Psychology1997,110(4):621-634;参考文件[6]刘豫徽,基于Agent的主动知识服务及其应用研究[D].南京:南京航空航天大学,2008)提出的概念熟悉程度随时间的变化规律来刻画WF。
其中,a∈(0,1)为遗忘曲线的特征系数,表示用户对概念熟悉程度随时间增长而下变缓的规律。表示用户对概念Ck的熟悉程度,x表示时间,表示概念Ck重要程度,为弧度,η是遗忘曲线的拐点,η一般取值10天,δ为遗忘曲线稳定时刻用户熟悉程度系数,δ的表示如公式(2)所示
WI表示概念的重要性,概念Ck重要程度 通过根据用户浏览知识过程中的行为动作,通过对知识项的浏览量、评分值、收藏量等进行综合分析,进而确定知识项价值和作用的大小。
概念Ck的权重
E表示概念之间关联度的结合。E={Ci,Cj,f(Ci,Cj)},f(Ci,Cj)表示概念Ci,Cj之间的关联程度,f(Ci,Cj)∈[0,1];
TC表示用户对概念代表的知识源的阅读时间。TC={t(Ck),Ck∈Cu,k=1,2,…,n},对于概念所代表的知识,熟悉程度和阅读时间成正比。
PA表示用户在知识管理系统和企业业务系统活动信息集合,PA={Participate,Contribution,Attention},其中Participate根据用户行为评价用户个人参与知识管理系统或者企业业务系统活动的积极程度,Contribution根据用户行为评价用户对知识管理系统或者企业业务系统活动的贡献程度,Attention根据用户的操作历史获取用户可能关注的资源对象。
Participate主要通过统计用户在知识浏览过程中对知识项、知识发布者、知识评价者进行评分评价的行为。主要包括知识推荐,知识评分(高级、简单评分),知识评论,评论投票,评论回复,热点评论推荐等。从全方位记录和统计用户行为,进行员工参与度评价。Contribution通过对用户知识发布量、知识质量等进行综合分析、评价和统计,来展现用户知识贡献度。Attention根据用户对日志进行查询,得到用户的操作对象集。根据目标操作对象种类聚焦用户关注的专业、WBS目录、关键词(概念)、其他用户。
PC表示用户与用户之间的关联关系集合,通过人与人之间的操作历史获取人与人之间的密切程度。
系统在进行知识推送时,将基于用户模型予以分析,同时结果的匹配、过滤也需要基于用户特征模型进行。用户模型构建过程中,通过显性和隐性两种途径获得用户兴趣,显性方式主要是用户通过“知识订阅”方式选择关注的信息,隐性方式主要是用户在系统内的其他知识行为,如知识上传、下载、评分评论等行为,这些行为被系统日志记录。通过对日志文件进行数据预处理,提取用户个性化信息。日志文件是用户浏览Web服务器时记录下来用户访问网站的情况,被记录在Web服务器中。Web日志挖掘就是对原始的日志文件进行预处理转变成适合挖掘的数据形式,然后用传统的数据挖掘方法(如关联规则、聚类等)对Web数据进行挖掘,最后将挖掘出的结果进行汇总,从而应用到实际当中去。
步骤四、知识过滤和排序。本步骤是知识推送的核心步骤。在保证符合知识活动流程,满足知识需求语义一致性基础上,开展基于扩展语义的知识检索,并从知识检索的候选集中选择最符合用户特征模型的解返回给用户。本步骤包括知识概念与用户特征模型概念匹配方法,基于用户特征模型知识活动的知识过滤方法(用户关注度、密切度和知识有效性)以及基于综合评估的知识推送排序方法。
步骤4.1:基于Lucene的知识检索方法。
知识检索引擎是从集中或分布式信息资源集合中找出满足特定要求的知识的过程,即采用一定的策略从知识库中找出满足特定要求的知识。本发明基于现有的全文检索工具包Lucene,对索引知识库中的知识条目建立索引;利用得到的检索需求网络对索引进行搜索;形成候选结果集,从而实现知识候选资源的准确定位。具体步骤如下:
(1)索引知识库的索引建立。要实现知识库的检索,就必须对知识库建立可供检索的索引。本发明利用Lucene的document、analysis和index API对索引知识库中的具体知识条目内容进行索引。步骤如下:①对索引知识库中的每条知识条目进行基于词典的中文分词,对知识条目内容进行分词,将每项描述内容,如特征词集、知识标题、任务描述等,分别作为单独的索引域进行索引,过滤垃圾信息,提取领域术语和一般术语,形成文本中间格式库,为索引提供输入数据。②依次读取分析文本中间格式库中每个索引域中的索引项(知识描述内容经过分词后的词元),利用预设的索引项字典建立按索引项排列的链表,并动态更改索引字典。最终完成按照索引项组织的索引列表、索引字典和知识索引,用于表示知识以及生成知识库的索引表。
(2)索引知识库的检索。索引的检索是检索词集与索引项的匹配过程,本发明利用Lucene的searcher API来实现对知识库的快速检索。步骤如下:①首先利用检索需求中的词元在索引字典中到找与其相匹配的索引项;②根据索引项,在索引表(文本索引库)中找出该索引项所对应的知识链;③根据检索设置,对知识链进行“与”“或”“非”的操作。各索引项词元所指向的知识条目地址组成的一条链即为知识链,一个索引项词元在多篇知识条目中出现,就指向多个知识条目地址;每个索引项都指向包含该索引项的知识条目链表,因此,最终得到的知识链表即为命中的知识条目组成的链表。
采用基于本体的语义检索方式,能检索出与用户查询语句中所表达的概念具有同义、继承、属性和实例等语义关系的知识信息。系统在获取用户任务描述后,提取与任务相关的属性,进行分词处理,并通过本体扩展实现知识检索,将与任务相关的知识资源检索出来。
步骤4.2:个性化知识主动推送方法。
本发明知识推送主要是运用知识推送方法,结合设计任务过程模型、用户特征模型和企业领域本体对知识进行个性化推送。推送对象主要是知识对象,分为知识项和问题项。本发明知识推送方法主要有两类应用场景:用户促发式个性化推送和系统自动个性化推送。用户促发式个性化推送方法主要是根据设计任务过程模型,实时获取用户设计任务需求,通过用户特征模型与领域本体匹配计算完成个性化推送。而系统自动个性化推送方法主要是根据用户特征模型的用户实例中的知识概念与领域本体相互匹配计算概念权重,完成概念权重高知识对象的个性化推送。
用户促发式个性化推送模式主要包括面向设计任务的知识推送,本体标签推送,订阅推送,设计任务目录推送等,其中本体标签推送用于在知识创建时主动向用户推荐本体术语;设计任务目录推荐是用户在知识创建时主动向用户推荐知识所属专业目录;主题推荐用户在知识创建时主动推荐知识所属主题。而系统自动个性化推送主要包括最新知识推送、最新问题推送、知识关联推送和主题推送。在用户促发式个性化推送方法中涉及面向任务分解的设计过程需求模型构建,基于多领域本体的知识检索和用户特征模型的多维度匹配。而系统自动个性化推送方法的输入是从用户实例中抽取的知识概念集合,即下面方法中的Step3~Step14和用户促发式个性化推送方法是一致的。
具体个性化知识主动推送方法的步骤如下,如图4所示:
Step1:利用工作流引擎获取用户设计任务流信息Task=(T1,T2,...,TN),其中N为用户任务分解后子任务个数,对于每一个子任务Ti构建设计过程任务活动模型DKAMi,DKAMi包括填充任务描述的设计目标、对象和约束,任务结果的设计方案、三维模型、总结报告等信息,以及相对应知识库中的经验、手册知识。对每个任务节点,进行属性提取,获得任务节点名称、所属类型、专业、分类、摘要、关键词、编号等属性。
Step2:以设计过程任务活动模型作为输入,通过基于领域本体词汇的最大词长切分法,提炼设计需求原始概念集OC=(OC1,OC2,…OCH),H表示原始概念集OC中概念数量。
Step3:对于原始概念集中的每一个概念OCi(OCi∈OC),判断是否为领域本体概念,若否,不进行本体语义扩展;若是,按照基于领域本体的知识需求模型构建方法,设置不同本体关系的不同语义权重,进行本体语义扩展和语义相关度计算,原始概念OCi语义权重赋予最大值1,扩展概念的语义权重等于计算得到的与原始概念的语义相关度,OCi所有扩展概念存入概念集EC(i)。当某概念不存在扩展关系时,则不需要进行本体语义扩展和语义相关度计算。
最终,对于概念OCi得到带语义相关度的扩展知识概念集EC(i)=(EC1,EC2,…ECM)及其对应的语义权重向量W_EC(i)=(w1,w2,…,wM),ECM表示第M个概念,wM表示概念ECM的语义权重。
所有EC(i)形成总的扩展概念集EC。
Step4:根据用户特征模型UP=(PI,PK,PA,PC)中PK={CU,AC,RU,W,E,TC},比较每一个原始集OC的概念OCi和CU={C1,C2,C3,…Cn}的相似度。
本体概念相似度计算采用经典基于本体概念网络语义距离的方法和基于本体概念属性刚性匹配方法相结合。本体语义距离是在本体网络中连接两个概念之间语义边长(本体关系权重)之和。
基于本体语义距离的相似度Sim(OCi,Ck)WP为:
Sim(OCi,Ck)WP=1/(distance(OCi,Ck)+1)
其中distance(OCi,Ck)表示OCi与Ck的本体语义距离。
本体概念属性集合AC={aC(i)|i=1,…,|AC|},则基于本体概念属性的相似度Sim(OCi,Ci)A为:
Sim(OCi,Ci)A=1/(num(AOCi,ACk)+1)
其中,num(AOCi,ACk)表示OCi与Ck的属性匹配个数。因此,原始集OC的概念OCi和每一个Ck∈{C1,C2,C3,…Cn}的相似度计算如下:
Sim(OCi,Ck)=Sim(OCi,Ck)WP*Sim(OCi,Ck)A
Step5:根据用户特征模型UP=(PI,PK,PA,PC)中PK={CU,AC,RU,W,E,TC},比较扩展集EC(i)中的每一个概念ECi和CU={C1,C2,C3,…Cn}的相似度。概念ECi与CU中的概念Ck的相似度Sim(ECi,Ck)的计算方法与Step4中计算Sim(OCi,Ck)的方法相同。
Step6:根据用户特征模型UP=(PI,PK,PA,PC)中PK={CU,AC,RU,W,E,TC},根据用户特征模型中每一个概念的权重W={w1,w2,…,wn}、Step4和Step5的计算结果,调整原始概念集OC中每一概念OCi的语义权重和扩展概念集EC(i)中每一个ECi的语义权重W_ECi。具体调整方法如下:
对于每一个OCi∈OC,与每一个用户兴趣概念Ck∈CU的语义相似度是wkSim(OCi,Ck),则每一个OCi与CU总的语义相似度如下:
其中wk∈W,Ck∈CU
调整后的OCi的语义权重如下:
公式中的“1”表示原始概念OCi的语义权重初始设置为1。
同理,对于每一ECi∈EC(i),与每一个用户兴趣概念Ck∈CU={C1,C2,C3,…Cn}的总的语义相似度为:
其中wk∈W,Ck∈CU
调整后ECi的语义权重为:
其中wi∈W_EC(i)
wi表示在Step3中计算得到的概念ECi的语义权重。
Step7:输入原始概念集OC和扩展概念集EC及相对应的调整后权重向量,分别将原始概念集OC与中扩展概念集EC中每一个概念及对应的权重,按照基于Lucene的知识检索方法,从知识库中检索,得到已排序的原始知识条目集合OKC和扩展知识条目集合EKC。
Step8:提取OKC排名前五的知识条目添加入知识条目推送列表PushKL1,按照精确匹配优先级最高原则,将最符合原始概念需求的五条知识条目优先进入待推送队列。
Step9:根据用户特征模型UP=(PI,PK,PA,PC)中PA信息筛选候选知识条目集合,其中PA={Participate,Contribution,Attention}。根据PA中关注度Attention采集的用户兴趣信息,得到当前用户关注的四大类信息排序:知识概念关注度排序、设计目录关注度排序、专业类型关注度排序,用户关注度排序。然后对每一个候选知识条目K,进行关注度排行匹配。每一个候选知识K的知识概念、所在的设计目录、专业类型和关联的用户,与当前用户关注的对应类信息排序进行比对。对于知识概念,获取候选知识条目K中各知识概念在知识概念关注度排序中出现的匹配排行位置和频数,频数是指K中某知识概念出现的次数,然后根据频数/匹配排行位置再求和,获得候选知识条目K的知识概念关注度。对于所在的设计目录、专业类型和关联的用户,从对应类信息排序中找到匹配排行位置,则候选知识条目K的对应类信息关注度为1/匹配排行位置。最后,将K的四类信息关注度加权求和,得到候选知识条目K总的关注度Attent。所述的候选知识条目K是指集合EKC与除去前五条知识条目的集合OKC中的知识条目。所述的用户关注度排序是按照与当前用户关系程度进行排序的用户列表。
Step10:根据用户特征模型UP=(PI,PK,PA,PC)中PC用户密切度信息刷选知识条目集合。根据PC采集的用户兴趣信息,得到当前用户活动密切的用户排行,即密切度用户排行。对于每一个候选知识条目K,K与当前用户的密切度Rel=频数/匹配排行位置,其中频数的计算有两种:一种是候选知识条目K创建者与密切度用户排行匹配的次数,另外一种是密切度排行中用户曾经推荐过候选知识条目K次数。当候选知识条目K的创建者和推荐者有多个时,K与当前用户的密切度Rel通过计算相应用户的频数/匹配排行位置再求和得到。
Step11:通过知识评价方法,获取候选知识条目K的知识有效性Effect,其中知识评价方法通过遍历知识条目的所有操作集合(知识评分、知识评论、知识订阅、知识下载、知识推荐、知识收藏),并赋予各种操作不同权重,根据知识条目的操作次数及相应的操作权值进行加权统计,得到候选知识条目K的有效性评价值。
Step12:综合Step9,Step10,Step11得到计算结果,得到每一个候选知识条目K的综合推送优先级PushPriority=Attent*Rel*Effect。如果遇到具有相同综合推送优先级的不同候选知识条目,则依据定位优先级:Effect排行>Attent排行>Rel排行,根据Step9,Step10,Step11得到的计算结果进行排序定位。
Step13:根据优先级PushPriority的大小原则,得到知识条目推送列表PushKL2。
具体PushKL2中知识条目的个数可由用户根据需要设定。
Step14:合并知识条目推送列表PushKL1和PushKL2,形成最终的知识推送列表PushKL,向当前用户进行推送。
本方法从具体任务列表中通过工作流引擎抽取业务流程节点的任务并形成初始知识需求。通过构建所在企业的领域本体,并按照设定的语义扩展策略对知识需求进行三级扩展形成具有语义关联强度的知识求集。然后进一步借助Lucene检索工具,利用基于扩展语义的知识检索方法形成候选结果集。通过构建用户特征模型(包括初始特征模型和模型的更新进化),实现对用户偏好的度量,最后借助知识过滤和排序方法实现知识取之于业务并用之于业务的目的。

Claims (2)

1.一种基于任务分解的个性化知识主动推送方法,其特征在于,包括以下步骤:
步骤1:构建设计过程任务活动模型,将设计任务分解为不同的子任务,将子任务与所需的知识资源进行关联;
步骤2:构建基于领域本体的知识需求模型,包括领域本体构建和基于领域本体的语义扩展;
所述的基于领域本体的语义扩展中,通过中文分词方法形成初始知识推送集,再采用概念语义三级扩展方法获取最终的知识推送集;
其中,概念语义三级扩展方法的步骤如下:
步骤a:将中文分词方法形成的初始知识推送集中的本体概念与构建的领域本体关联,形成待扩展概念需求集CS0;
步骤b:以CS0中每一个概念Ci为中心,通过自定义的领域本体关系集RS中的语义关系扩展,形成以Ci为中心的一级扩展概念集CS1;
步骤c:以CS1中每一个概念Cii为中心,通过领域本体关系集RS中的语义关系扩展,形成以Cii为中心的二级扩展概念集CS2;
步骤d:以CS2中每一个概念Ciii为中心,通过领域本体关系集RS中的语义关系扩展,形成以Ciii为中心的三级扩展概念集CS3;
不同级别的概念集表示不同的语义距离,各级扩展概念集中节点语义相关度由以下规则确定:
规则1:根据本体关系设定语义相关度,设定同义关系的语义相关度为0.9,实例关系的语义相关度为0.8,继承关系的语义相关度为0.7,同类关系的语义相关度为0.6,组成关系的语义相关度为0.5,属性关系的语义相关度为0.3;
规则2:一级扩展概念与原始概念的语义相关度根据本体关系的类别由规则1确定;二级扩展概念与原始概念的语义相关度,是二级扩展概念关联的一级本体关系类型与二级本体关系类型对应的语义相关度的乘积;三级扩展概念与原始概念的语义相关度,是三级扩展概念关联的一级本体关系类型、二级本体关系类型和三级本体关系类型对应的语义相关度的乘积;
规则3:如果概念A的关系扩展概念C同时也是概念B的关系扩展概念,并且概念A和概念B不是扩展关系,则概念C与原始概念的语义相关度取根据规则2计算的值中最大的;
规则4:如果概念A的关系扩展概念C同时也是概念B的关系扩展概念,并且概念B和概念A是一级扩展关系,概念C与原始概念的语义相关度根据规则2得到两个值,将其中较小值的一半作为加成量,得到合成权重=较大值+一半的较小值,若合成权重超过1,则设置最终概念C与原始概念的语义相关度为1,否则最终概念C与原始概念的语义相关度为合成权重;
规则5:如果概念A的关系扩展概念C同时也是概念B的关系扩展概念,并且概念B和概念A是二级扩展关系,则概念C与原始概念的语义相关度根据规则2得到两个值,将其中较小值的四分之一作为加成量,得到合成权重=较大值+四分之一的较小值,若合成权重超过1,则设置最终概念C与原始概念的语义相关度为1,否则最终概念C与原始概念的语义相关度为合成权重;
步骤3:采用基于本体的表示方法构建用户特征模型;
所述构建用户特征模型,具体实现方法是:
将用户特征模型表示为一个四元组:
UP=(PI,PK,PA,PC)
其中:UP代表用户特征模型,PI表示用户基本信息、PK表示用户知识背景集合、PA表示用户在知识管理系统和企业业务系统活动信息集合、PC表示用户与用户之间的关联关系集合;
(1)PK={CU,AC,RU,W,E,TC},其中:
CU表示概念的集合,CU={C1,C2,…,Cn},n表示CU中的概念数;
AC表示概念C的属性集合,概念C的属性集合记为AC={aC(i)|i=1,…,|AC|},|AC|表示概念C属性的数目,C∈CU
RU表示概念之间关系的集合;
W表示概念的权重,W={w1,w2,…,wn},概念Ck的权重为wk,每个wk通过如下方法得到:
为用户对概念Ck的熟悉程度,根据下式获得:
WF C k = 1.2 × sin ( a × β C k ) x + 1 3 , 0 ≤ x ≤ η δ 1 + ln ( x - η + 1 ) 10 , x ≥ η
其中,a∈(0,1)为遗忘曲线的特征系数,表示概念Ck重要程度,x表示时间,η是遗忘曲线的拐点,δ为遗忘曲线稳定时刻用户熟悉程度系数,
δ = 1.2 × s i n ( a × β C k ) η + 1 3
表示概念Ck重要程度,等于
E表示概念之间关联度的结合,E={Ci,Cj,f(Ci,Cj)},f(Ci,Cj)表示概念Ci和Cj之间的关联程度,f(Ci,Cj)∈[0,1];
TC表示用户对概念代表的知识源的阅读时间;
(2)PA={Participate,Contribution,Attention},
其中,Participate是根据用户行为评价用户个人参与知识管理系统或者企业业务系统活动的积极程度,Contribution是根据用户行为评价用户对知识管理系统或者企业业务系统活动的贡献程度,Attention是根据用户的操作历史获取用户关注的资源对象;
步骤4:建立知识库的索引表,进行个性化知识主动推送;具体实现方法是:
Step1:利用工作流引擎获取用户设计任务流Task=(T1,T2,...,TN),其中N为子任务的个数,对于每一个子任务Ti构建设计过程任务活动模型DKAMi,DKAMi中包括子任务的目标、对象和约束以及所需的知识资源;
Step2:以设计过程任务活动模型作为输入,提炼设计需求原始概念集OC,
OC=(OC1,OC2,…OCH),H表示原始概念集中的概念数;
Step3:对于原始概念集OC中的每一个原始概念OCi,按照基于领域本体的知识需求模型,进行语义扩展和语义相关度计算,OCi的扩展概念形成扩展集EC(i),所有EC(i)形成总的扩展概念集EC;
EC(i)=(EC1,EC2,…ECM),ECM表示第M个概念;
原始概念OCi语义权重赋予最大值1,扩展概念的语义权重等于计算得到的与原始概念的语义相关度,EC(i)的语义权重向量W_EC(i)=(w1,w2,…,wM),wM表示概念ECM的语义权重;
Step4:对于原始概念集OC中的每一个原始概念OCi,获取概念OCi与步骤3构建的用户特征模型中的概念集合的相似度;
设步骤3构建的用户特征模型中的概念集合CU={C1,C2,…,Cn},则概念OCi与CU的概念Ck的相似度Sim(OCi,Ck)表示为:
Sim(OCi,Ck)=Sim(OCi,Ck)WP*Sim(OCi,Ck)A
其中,Sim(OCi,Ck)WP为基于本体语义距离的相似度,Sim(OCi,Ci)A为基于本体概念属性的相似度;
Sim(OCi,Ck)WP=1/(distance(OCi,Ck)+1),distance(OCi,Ck)表示OCi与Ck的本体语义距离;
Sim(OCi,Ci)A=1/(num(AOCi,ACk)+1),其中,AOCi表示OCi的属性集合,ACk表示Ck的属性集合,num(AOCi,ACk)表示OCi与Ck的属性匹配个数;
Step5:获取扩展集EC(i)中的每个概念ECi和与概念集合CU={C1,C2,…,Cn}的相似度;概念ECi与CU中的概念Ck的相似度Sim(ECi,Ck)的计算方法与Step4相同;
Step6:调整原始概念集OC中每一概念OCi的语义权重和扩展集EC(i)中每一个ECi的语义权重;具体调整方法为:设步骤2构建的用户特征模型中,概念集合CU={C1,C2,…,Cn}对应的概念权重为W={w1,w2,…,wn};
则OCi与CU中概念Ck的语义相似度是wkSim(OCi,Ck),OCi与CU总的语义相似度为:
其中wk∈W,Ck∈CU
调整后的OCi的语义权重
ECi与CU总的语义相似度为:其中wk∈W,Ck∈CU;调整后ECi的语义权重其中wi∈W_EC(i)
Step7:分别对于原始概念集OC和扩展概念集EC,将其中的每个概念及其对应的调整后的语义权重按照基于Lucene的知识检索方法,从知识库中检索,得到已排序的原始知识条目集合OKC和扩展知识条目集合EKC;
Step8:提取OKC排名前五的知识条目添加入知识条目推送列表PushKL1;
Step9:获得当前用户关注的四类信息排序:知识概念关注度排序、设计目录关注度排序、专业类型关注度排序以及用户关注度排序;对每一个候选知识条目K,得到K的知识概念、所在的设计目录、专业类型和关联的用户;
候选知识条目K的知识概念关注度是根据对各知识概念的频数除以对应的匹配排行位置所得结果再全部求和得到,此处的频数是指K中某知识概念出现的次数,此处的匹配排行位置是指对应知识概念在知识概念关注度排序中的位置;
候选知识条目K的设计目录关注度、专业类型关注度以及用户关注度,都是在对应信息排序中找到匹配的排行位置,则K的对应类信息关注度为1/匹配排行位置;
最后,将K的四类信息关注度加权求和,得到候选知识条目K总的关注度Attent;
所述的候选知识条目K是指集合EKC与除去前五条知识条目的集合OKC中的知识条目;
Step10:获取当前用户的密切度用户排行,确定候选知识条目K与当前用户的密切度Rel,Rel等于频数除以匹配排行位置,此处的频数有两种确定方法:一种是候选知识条目K创建者与密切度用户排行匹配的次数,另外一种是密切度排行中用户曾经推荐过候选知识条目K次数;此处的匹配排行位置是指对应用户在密切度用户排行中的位置;
Step11:确定候选知识条目K的知识有效性Effect,具体方法是:遍历候选知识条目K的所有操作集合,赋予各种操作不同权重,再进行加权统计,得到候选知识条目K的知识有效性;
Step12:确定每个候选知识条目K的综合推送优先级PushPriority=Attent*Rel*Effect,对于具有综合推送优先级的不同候选知识条目,根据定位优先级进行排序,定位优先级是:Effect排行>Attent排行>Rel排行;
Step13:根据优先级PushPriority获得知识条目推送列表PushKL2;
Step14:合并知识条目推送列表PushKL1和PushKL2,形成最终的知识推送列表PushKL,向当前用户进行推送。
2.根据权利要求1所述的基于任务分解的个性化知识主动推送方法,其特征在于,所述的步骤1,其具体实施方法是:利用工作流引擎分解设计任务,将整个设计任务分解成不同的子任务,明确每一个子任务的目标、对象和约束;在设计知识资源的支持下,设计人员为满足子任务的要求,对设计问题进行求解,进而得到设计结果;分析每一子任务的目标、对象和约束需要的知识资源,将该子任务和所需知识资源建立关联。
CN201410205531.4A 2014-05-15 2014-05-15 基于任务分解的个性化知识主动推送方法 Expired - Fee Related CN103995858B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410205531.4A CN103995858B (zh) 2014-05-15 2014-05-15 基于任务分解的个性化知识主动推送方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410205531.4A CN103995858B (zh) 2014-05-15 2014-05-15 基于任务分解的个性化知识主动推送方法

Publications (2)

Publication Number Publication Date
CN103995858A CN103995858A (zh) 2014-08-20
CN103995858B true CN103995858B (zh) 2017-06-30

Family

ID=51310023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410205531.4A Expired - Fee Related CN103995858B (zh) 2014-05-15 2014-05-15 基于任务分解的个性化知识主动推送方法

Country Status (1)

Country Link
CN (1) CN103995858B (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104240026B (zh) * 2014-09-05 2017-09-08 上海交通大学 产品设计知识管理服务匹配方法
CN105786813A (zh) * 2014-12-17 2016-07-20 北京邮电大学 一种任务信息发送方法及装置
CN105786927B (zh) * 2014-12-26 2019-08-30 中国移动通信集团公司 一种日志处理方法及装置
CN104572982B (zh) * 2014-12-31 2017-10-31 东软集团股份有限公司 基于问题引导的个性化推荐方法及系统
CN104699858A (zh) * 2015-04-09 2015-06-10 成都卡莱博尔信息技术有限公司 基于大数据的知识智能推送知识工程系统
CN106205248B (zh) * 2016-08-31 2019-01-18 北京师范大学 一种表征学习者在特定领域知识学习掌握状态的在线学习认知地图生成系统及方法
TWI642015B (zh) 2016-11-11 2018-11-21 財團法人工業技術研究院 產生使用者瀏覽屬性的方法、以及非暫存電腦可讀的儲存媒介
CN107038256B (zh) * 2017-05-05 2018-06-29 平安科技(深圳)有限公司 基于数据源的业务定制装置、方法及计算机可读存储介质
CN107798387B (zh) * 2017-11-01 2020-07-28 西安交通大学 一种适用于高端装备全生命周期的知识服务系统及方法
CN107967518B (zh) * 2017-11-21 2020-11-10 中国运载火箭技术研究院 一种基于产品设计的知识自动关联系统及方法
CN108491582B (zh) * 2018-02-27 2022-10-14 中国空间技术研究院 一种基于设计流程的卫星设计知识本体关联方法和系统
CN108416008A (zh) * 2018-02-28 2018-08-17 华南理工大学 一种基于自然语言处理的bim产品数据库语义检索方法
CN108573628B (zh) * 2018-04-23 2020-11-24 中山大学 基于学习轨迹的学习能力评估与扩展知识点集推荐的方法
CN109189866A (zh) * 2018-08-22 2019-01-11 北京大学 一种构建装备故障诊断领域知识本体知识库的方法和系统
CN109684537A (zh) * 2018-10-29 2019-04-26 昆明理工大学 一种面向业务流程的知识资源智能推送系统及其推送方法
CN109545285A (zh) * 2018-11-13 2019-03-29 中国核动力研究设计院 一种核反应堆数字实验平台的知识使用方法
CN109800249B (zh) * 2018-12-24 2023-08-04 北京航天智造科技发展有限公司 基于工业服务云平台用户行为感知的知识服务方法和系统
CN111444334B (zh) * 2019-01-16 2023-04-25 阿里巴巴集团控股有限公司 数据处理方法、文本识别方法、装置及计算机设备
CN109947949A (zh) * 2019-03-12 2019-06-28 国家电网有限公司 知识信息智能管理方法、装置及服务器
CN110083773B (zh) * 2019-04-30 2022-09-23 南京邮电大学 个性化知识推荐方法及计算机存储介质
CN110866332B (zh) * 2019-10-29 2022-12-16 中国电子科技集团公司第三十八研究所 一种复杂线缆组件装配方法及系统
CN111177322A (zh) * 2019-12-30 2020-05-19 成都数之联科技有限公司 一种领域知识图谱的本体模型构建方法
CN111768099B (zh) * 2020-06-29 2024-05-14 浪潮通用软件有限公司 一种科研生产模式下基于模型件的任务分解方法
CN111859221B (zh) * 2020-07-27 2023-05-30 中国联合网络通信集团有限公司 一种项目推荐方法及装置
CN113537927B (zh) * 2021-06-28 2024-06-07 北京航空航天大学 一种科技资源服务平台交易协同系统及方法
CN115098931B (zh) * 2022-07-20 2022-12-16 江苏艾佳家居用品有限公司 一种用于挖掘用户室内设计个性化需求的小样本分析方法
CN114996589B (zh) * 2022-08-02 2022-10-21 八爪鱼人工智能科技(常熟)有限公司 基于防疫大数据的线上资讯推送方法及系统
CN117332066B (zh) * 2023-10-27 2024-05-28 天讯瑞达通信技术有限公司 一种基于大模型的智能坐席文本处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324703A (zh) * 2013-06-14 2013-09-25 西安工程大学 基于工作流引擎和知识引擎双驱动的知识推送方法
CN103593336A (zh) * 2013-10-30 2014-02-19 中国运载火箭技术研究院 一种基于语义分析的知识推送系统及方法
CN103617481A (zh) * 2013-11-04 2014-03-05 中国航空工业集团公司沈阳飞机设计研究所 一种面向流程的领域知识抽取与推送系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100390731C (zh) * 2002-03-07 2008-05-28 霍尼韦尔国际公司 交互设计用户界面的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324703A (zh) * 2013-06-14 2013-09-25 西安工程大学 基于工作流引擎和知识引擎双驱动的知识推送方法
CN103593336A (zh) * 2013-10-30 2014-02-19 中国运载火箭技术研究院 一种基于语义分析的知识推送系统及方法
CN103617481A (zh) * 2013-11-04 2014-03-05 中国航空工业集团公司沈阳飞机设计研究所 一种面向流程的领域知识抽取与推送系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于本体的航天科技领域知识推送技术研究;陈伟东;《中国优秀硕士学位论文全文数据库 信息科技辑》;20131215(第S2期);I138-472 *

Also Published As

Publication number Publication date
CN103995858A (zh) 2014-08-20

Similar Documents

Publication Publication Date Title
CN103995858B (zh) 基于任务分解的个性化知识主动推送方法
Wu et al. Knowledge integration and sharing for complex product development
US20120041769A1 (en) Requests for proposals management systems and methods
Portmann et al. FORA–A fuzzy set based framework for online reputation management
Somodevilla García et al. An overview of ontology learning tasks
Ameri et al. Semantic rule modelling for intelligent supplier discovery
Spirin et al. People search within an online social network: Large scale analysis of facebook graph search query logs
Liu et al. Ontology representation and mapping of common fuzzy knowledge
Du et al. GIS-KG: building a large-scale hierarchical knowledge graph for geographic information science
Parinov Open repository of semantic linkages
Lopez-Rodriguez et al. Modeling scientometric indicators using a statistical data ontology
Singto et al. Semantic searching it careers concepts based on ontology
Marivate et al. An intelligent multi-agent recommender system for human capacity building
Martin et al. Developing a catalogue of explainability methods to support expert and non-expert users
Chicaiza et al. Usage of social and semantic web technologies to design a searching architecture for software requirement artefacts
Zheng et al. Disaster sitrep-a vertical search engine and information analysis tool in disaster management domain
Basharat et al. Semantically enriched task and workflow automation in crowdsourcing for linked data management
Wang et al. A design knowledge management model for civil aircraft cabin based on Markov Logic Networks
Parinov et al. A Challenge of Research Outputs in GL Circuit: From Open Access to Open Use.
Slimani et al. Models of Digital Educational Resources Indexing and Dynamic User Profile Evolution.
Basharat et al. Crowdlink: Crowdsourcing for large-scale linked data management
Gómez et al. Materialization of OWL ontologies from relational databases: a practical approach
He et al. Integrating a case-based reasoning shell and Web 2.0: design recommendations and insights
Siebert et al. Increasing search quality with the semantic desktop in proposal development
Werrmann et al. Knowledge management through ontology-driven integration of disparate knowledge sources

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170630

CF01 Termination of patent right due to non-payment of annual fee