CN117151442B - 一种基于思维导图的人口健康领域科学数据管理生成方法 - Google Patents

一种基于思维导图的人口健康领域科学数据管理生成方法 Download PDF

Info

Publication number
CN117151442B
CN117151442B CN202311425816.4A CN202311425816A CN117151442B CN 117151442 B CN117151442 B CN 117151442B CN 202311425816 A CN202311425816 A CN 202311425816A CN 117151442 B CN117151442 B CN 117151442B
Authority
CN
China
Prior art keywords
data management
management plan
mapping
mind map
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311425816.4A
Other languages
English (en)
Other versions
CN117151442A (zh
Inventor
吴思竹
修晓蕾
胡拯涌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Medical Information CAMS
Original Assignee
Institute of Medical Information CAMS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Medical Information CAMS filed Critical Institute of Medical Information CAMS
Priority to CN202311425816.4A priority Critical patent/CN117151442B/zh
Publication of CN117151442A publication Critical patent/CN117151442A/zh
Application granted granted Critical
Publication of CN117151442B publication Critical patent/CN117151442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/206Drawing of charts or graphs

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于思维导图的人口健康领域科学数据管理生成方法,涉及数据管理技术领域。包括:根据项目需求获得数据管理计划语义知识和原始数据管理计划;根据数据管理计划语义知识建立数据管理计划语义知识模型和思维导图映射规范;根据思维导图映射规范,将原始数据管理计划各部分信息映射为思维导图的节点信息、附加信息以及节点间的树状结构关系信息,形成映射关系并建立思维导图;根据思维导图生成和导出科学数据管理计划。本发明具有辅助研究人员梳理和组织数据管理计划的各要素、动态管理数据管理计划和团队协作等优势,可以大大提高科研工作的效率和成果,具有广泛的应用前景。

Description

一种基于思维导图的人口健康领域科学数据管理生成方法
技术领域
本发明涉及数据管理技术领域,尤其涉及一种基于思维导图的人口健康领域科学数据管理生成方法。
背景技术
数据管理计划Data Management Plan,DMP是一份书面文件,其概要介绍科研人员在项目研究期间进行数据收集、处理、共享和保存等方面的实践和管理策略。数据管理计划不是一成不变的,它是一份动态文件,需要随着研究过程的变化而对其进行更改。通过数据管理计划的制定,有助于项目所有利益相关者掌握和追踪数据收集、处理、存储、共享和保存等全过程,提高研究人员数据管理效率,有助于确保数据质量和可靠性,保障数据安全。然而,制定一个完整、清晰和可行的数据管理计划并非易事,需要研究人员具备丰富的领域知识和数据管理经验。
我国数据管理计划推行较晚,国内科研人员制定数据管理计划的意识较为薄弱,存在数据管理人员有限、专业知识和技术能力不足的问题。此外,当前研究人员仍采用传统的文本文档的方式编写数据管理计划,这种方式虽然简单易行,但也存在如下缺点:(1)缺乏结构化的表达方式,难以清晰地表达数据管理计划各要素之间的关联和依赖关系;(2)缺乏灵活性,难以快速适应数据管理计划的动态变更;(3)难以实现团队协作,多人之间的数据管理计划容易出现冲突和重复。
当前迫切需要开发一个能够根据研究者研究内容的不同和特定的数据管理要求,智能推荐相应的数据管理计划模板,辅助研究人员制定数据管理计划;能够利用可视化知识图的形式与研究人员实现动态交互,辅助研究人员梳理和组织数据管理计划中的各要素;可以与项目组成员以团队协作的方式动态制定和管理数据管理计划的科学数据管理计划生成器,以缩短研究者的时间成本,保证生成的数据管理计划模板具有统一的标准和规范,确保数据管理计划的质量,提高科学数据的可访问性和可重复性。
因此,提出一种基于思维导图的人口健康领域科学数据管理生成方法,来解决现有数据管理计划零散、缺乏整体性和联想性以及内容冗杂散乱的问题,是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于思维导图的人口健康领域科学数据管理生成方法,可以达到结构化处理的效果。
为了实现上述目的,本发明采用如下技术方案:
一种基于思维导图的人口健康领域科学数据管理生成方法,包括以下步骤:
S1、根据项目需求获得数据管理计划语义知识和原始数据管理计划;
S2、根据数据管理计划语义知识建立数据管理计划语义知识模型和思维导图映射规范;
S3、根据思维导图映射规范,将原始数据管理计划各部分信息映射为思维导图的节点信息、附加信息以及节点间的树状结构关系信息,形成映射关系;
S4、根据映射关系建立思维导图;
S5、根据思维导图生成和导出科学数据管理计划。
上述的方法,可选的,S2中,数据管理计划语义知识模型用于支持用户进行数据管理计划的自制定和项目团队成员间协作制定数据管理计划;
思维导图映射规范分为基于问题列表的思维导图映射规范和基于语义知识模型的思维导图映射规范。
上述的方法,可选的,基于问题列表的思维导图映射规范包括标题和问题列表的映射规范,标题的映射规范包括项目数据管理计划名称和模块,模块包括模块名称和模块的附加信息,模块的附加信息包括对模块内容的描述或解释信息;
基于语义知识模型的思维导图映射规范包括节点和属性的映射规范、节点间关系的映射规范、映射后形成的思维导图修改和完善规范、以及项目团队成员协作制定管理计划时的映射规范。
上述的方法,可选的,S3步骤中,节点信息包括节点的名称,对应原始数据管理计划中的计划名称、模块名称、问题和答案以及数据管理计划语义知识模型中的类和实例的概念名称;
附加信息包括节点的属性,对应原始数据管理计划中的模块名称和问题的补充和解释信息以及数据管理计划语义知识模型中的类和实例的属性信息;
节点间的树状结构关系信息包括开始节点信息、结束节点信息和两个节点之间的关系属性;
根据映射关系,确定两个节点之间的树状结构关系信息。
上述的方法,可选的,根据映射关系,确定两个节点之间的树状结构关系信息包括:
1)基于问题列表的思维导图映射规范确定为两个节点之间的树状结构关系信息,根据映射关系,将计划名称确定为思维导图中心主题名称,将N级模块名称映射思维导图的N级节点名称;当问题含有答案时,将答案映射为叶子节点;若没有答案,则将问题映射为叶子节点;
2)基于语义知识模型的思维导图映射规范确定为两个节点之间的树状结构关系信息,根据映射关系,将语义知识模型中的父类确定为开始节点,将父类对应的子类或实例确定为结束节点,或者将语义关系的domain属性所对应的节点确定为开始节点,将语义关系的range属性所对应的节点确定为结束节点;根据父类节点和子类节点或父类节点和实例,以及两个类或两个实例之间的语义关系确定两个节点之间的关系属性。
上述的方法,可选的,S4中,建立思维导图包括将映射获得的思维导图节点和节点间的图形关系与思维导图的树状结构关系进行对比,从映射得到思维导图中找到多余的节点和图形关系,加入待删除节点列表和待删除图形关系列表;从映射得到思维导图中找到缺失的图形关系,加入待补充图形关系列表。
上述的方法,可选的,S5中,生成数据管理计划包括人类可读的以问题列表形式呈现的数据管理计划或者以思维导图形式呈现的数据管理计划,或机器可读的数据管理计划等文件生成步骤,根据思维导图映射规范、待删除节点列表、待删除图形关系列表、待补充图形关系列表,将思维导图中多余的节点和关系进行删除约束,对思维导图中缺失的关系进行补充,得到能清晰准确表达问题列表数据管理计划内容和问题间逻辑关系的思维导图;
项目组使用团队协作的方式共同创建项目的数据管理计划,将各成员制定的数据管理计划语义知识模型进行拆分、组合,得到一个整合后的综合数据管理计划语义知识模型,对综合数据管理计划语义知识模型与各成员制定的数据管理计划语义知识模型进行对比,标注出模型之间的差异,并按照基于语义知识模型的思维导图映射规范映射为思维导图形式的数据管理计划。
经由上述的技术方案可知,与现有技术相比,本发明提供了一种基于思维导图的人口健康领域科学数据管理生成方法,具有以下有益效果:1)本发明可以帮助研究人员更加高效地管理数据,通过思维导图,研究人员可以将数据管理计划的各个要素以图形化的方式呈现出来,便于梳理和组织,使得数据管理计划更加清晰和易于实施;2)本发明能根据不同的研究领域和数据管理要求,智能推荐相应的数据管理计划模板,并可通过思维导图的形式动态制定和管理数据管理计划,即修改、添加、删除节点等操作,可以随时调整数据管理计划的内容和组织方式,不仅可以适应科研工作的动态变化,也可以帮助研究人员更加灵活地管理数据,提高数据的质量和实用性;3)本发明通过分享和备份功能,研究团队成员可以在同一个平台上共同管理数据,帮助团队成员之间更加高效地协作,减少沟通和交流成本,提高科研工作的效率和成果;4)本发明具有辅助研究人员梳理和组织数据管理计划的各要素、动态管理数据管理计划和团队协作等优势,可以大大提高科研工作的效率和成果,具有广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明公开的一种基于思维导图的人口健康领域科学数据管理生成方法流程图;
图2为本实施例公开的人口健康领域数据管理计划(DMP)语义知识模型图;
图3为本实施例公开的用户自建的高血压数据管理计划语义知识模型;
图4为本实施例公开的高血压数据管理计划语义知识模型转变为思维导图的过程示意图;
图5为本实施例公开的显示计划详情节点示意图;
图6为本实施例公开的高血压数据管理计划思维导图示意图;
图7为本实施例公开的团队间合作制定数据管理计划映射过程示意图;
图8为本实施例公开的一个人口健康领域数据管理计划(DMP)语义知识模型的RDF文档;
图9为本实施例公开的高血压数据管理计划语义知识模型的RDF文档。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
参照图1所示,本发明公开了一种基于思维导图的人口健康领域科学数据管理生成方法,包括以下步骤:
S1、根据项目需求获得数据管理计划语义知识和原始数据管理计划;
S2、根据数据管理计划语义知识建立数据管理计划语义知识模型和思维导图映射规范;
S3、根据思维导图映射规范,将原始数据管理计划各部分信息映射为思维导图的节点信息、附加信息以及节点间的树状结构关系信息,形成映射关系;
S4、根据映射关系建立思维导图;
S5、根据思维导图生成和导出科学数据管理计划。
具体的,S1中数据管理计划语义知识总体分为3部分:计划概述、贡献者和计划详情,计划概述主要是简要说明本项目的名称、项目摘要、开始时间和结束时间等内容;贡献者主要是写明本项目的首席专家、数据管理者、项目联系人等角色的姓名、工作单位、联系方式等基本信息;计划详情是详细描述从项目开始到结束全生命周期中涉及数据的详细计划,其有多重分类方法,如可按照项目生命周期数据管理过程将数据管理计划详情模块分成数据采集、数据存储、数据共享等部分。
进一步的,S2中,数据管理计划语义知识模型用于支持用户进行数据管理计划的自制定和项目团队成员间协作制定数据管理计划;
思维导图映射规范分为基于问题列表的思维导图映射规范和基于语义知识模型的思维导图映射规范。
具体的,构建的数据管理计划语义知识模型用于支持用户进行数据管理计划的自制定和项目团队成员间协作制定数据管理计划。在用户制定数据管理计划的过程中,支持用户对数据管理计划语义知识模型进行拆分、修改和补充。
根据业务需求构建数据管理计划语义知识模型后,需获取数据管理计划语义知识模型的资源描述框架(Resource Description Framework,RDF)文件。RDF是万维网联盟(W3C)提出的一组标记语言的技术规范,是基于可扩展标记语言(XML)编写。RDF文档中包含语义知识模型节点和节点的属性信息,以及节点间的逻辑关系。基于数据管理计划语义知识模型的RDF文件,更便于将数据管理计划映射为思维导图。
更进一步的,基于问题列表的思维导图映射规范包括标题和问题列表的映射规范,标题的映射规范包括项目数据管理计划名称和模块,模块包括模块名称和模块的附加信息,模块的附加信息包括对模块内容的描述或解释信息;
基于语义知识模型的思维导图映射规范包括节点和属性的映射规范、节点间关系的映射规范、映射后形成的思维导图修改和完善规范、以及项目团队成员协作制定管理计划时的映射规范。
具体的,节点和属性的映射规范包括语义模式中的类、实例,以及类和实例的各种属性的映射规范。类和实例包括中文概念名称和英文概念名称,属性包括属性的内容、格式要求、语言要求等,例如字符串类型string或数值类型dataTime等。节点间关系的映射规范包括类之间的关系、类和实例之间的关系以及实例之间的关系。映射后形成的思维导图修改和完善规范是因语义知识模型和思维导图结构的不同所需制定的映射规范,语义知识模型是网状结构关系,思维导图是树状结构关系。项目团队成员协作制定管理计划时的映射规范是指在完成语义知识图谱的拆分、合并、映射后,对数据管理计划思维导图中相同内容和不同内容的标注规范。
进一步的,S3步骤中,节点信息包括节点的名称,对应原始数据管理计划中的计划名称、模块名称、问题和答案以及数据管理计划语义知识模型中的类和实例的概念名称;
附加信息包括节点的属性,对应原始数据管理计划中的模块名称和问题的补充和解释信息以及数据管理计划语义知识模型中的类和实例的属性信息;
节点间的树状结构关系信息包括开始节点信息、结束节点信息和两个节点之间的关系属性;
根据映射关系,确定两个节点之间的树状结构关系信息。
更进一步的,根据映射关系,确定两个节点之间的树状结构关系信息包括:
1)基于问题列表的思维导图映射规范确定为两个节点之间的树状结构关系信息,根据映射关系,将计划名称确定为思维导图中心主题名称,将N级模块名称映射思维导图的N级节点名称;当问题含有答案时,将答案映射为叶子节点;若没有答案,则将问题映射为叶子节点;
2)基于语义知识模型的思维导图映射规范确定为两个节点之间的树状结构关系信息,根据映射关系,将语义知识模型中的父类确定为开始节点,将父类对应的子类或实例确定为结束节点,或者将语义关系的domain属性所对应的节点确定为开始节点,将语义关系的range属性所对应的节点确定为结束节点;根据父类节点和子类节点或父类节点和实例,以及两个类或两个实例之间的语义关系确定两个节点之间的关系属性。
进一步的,S4中,建立思维导图包括将映射获得的思维导图节点和节点间的图形关系与思维导图的树状结构关系进行对比,从映射得到思维导图中找到多余的节点和图形关系,加入待删除节点列表和待删除图形关系列表;从映射得到思维导图中找到缺失的图形关系,加入待补充图形关系列表。
进一步的,S5中,生成数据管理计划包括人类可读的以问题列表形式呈现的数据管理计划或者以思维导图形式呈现的数据管理计划,或机器可读的数据管理计划等文件生成步骤,根据思维导图映射规范、待删除节点列表、待删除图形关系列表、待补充图形关系列表,将思维导图中多余的节点和关系进行删除约束,对思维导图中缺失的关系进行补充,得到能清晰准确表达问题列表数据管理计划内容和问题间逻辑关系的思维导图;
项目组使用团队协作的方式共同创建项目的数据管理计划,将各成员制定的数据管理计划语义知识模型进行拆分、组合,得到一个整合后的综合数据管理计划语义知识模型,对综合数据管理计划语义知识模型与各成员制定的数据管理计划语义知识模型进行对比,标注出模型之间的差异,并按照基于语义知识模型的思维导图映射规范映射为思维导图形式的科学数据管理计划。
在一具体实施例中,
本实施例以人口健康领域数据管理计划(DMP)制定为例进行案例说明。制定人口健康领域数据管理计划包括:
S1.根据业务需求构建数据管理计划语义知识模型和思维导图映射规范;
S1.1根据业务需求构建数据管理计划语义知识模型并获取数据管理计划语义知识模型的RDF文件;
如图2所示,本实施例利用斯坦福本体构建工具Protégé构建了一个人口健康领域数据管理计划(DMP)语义知识模型,将该语义知识模型存储为RDF文件,如图8所示。
具体的,DMP语义知识模型的RDF文件是以owl为标志的树状结构。开头的<rdf:RDF>表示这是一个RDF文档的头部声明,定义了该文档的命名空间和所使用的RDF和OWL版本等信息。“</rdf:RDF>”表示该RDF文档的结束。
每个以“<owl:”为开始的行,表示接下来将对语义知识模型中的某一信息进行定义;“/>”表示这个标签的结束;“</owl:”表示这个定义的结束。
例如按照上述所给实例进行DMP语义知识模型RDF文件的读取,会顺序读到“<owl:Ontology”,这一行是一个本体论的定义,不做思维导图内容展示。
读到“<owl:ObjectProperty”表示该语义知识模型有一个对象属性“has_answer”,“<rdfs:domain”表示该对象属性是从“数据采集相关问题”类指向“数据采集相关答案”类(“<rdfs:range”)的。读到“</owl:ObjectProperty>”表示对该对象属性的定义结束”
继续读到“<owl:Class”可知,该语义知识模型有一个“DMP名称”类和一个“数据采集”类,其中“数据采集”类是“计划详情”的子类(“<rdfs:subClassOf”);“<rdfs:comment>”表示该类有一个注释属性,它的内容是“本节将描述您计划收集或创建的数据”;读到“</owl:Class>”表示对该类的定义结束。
继续读到“<owl:Class”可知,该语义知识模型有一个“数据采集相关答案”类,它是“数据采集”的子类;读到“</owl:Class>”表示对该类的定义结束。
继续读到“<owl:Class”可知,该语义知识模型有一个“数据采集相关问题”类,它是“数据采集”的子类;读到“</owl:Class>”表示对该类的定义结束。
继续读到“<owl:Class”可知,该语义知识模型有一个“计划详情”类,它是“DMP名称”的子类;读到“</owl:Class>”表示对该类的定义结束。
继续读到“</rdf:RDF>”表示该RDF文档的结束。
S1.2构建思维导图映射规范,包括:
1)基于问题列表的思维导图映射规范;
该映射规范包括标题和问题列表的映射规范。标题规范包括项目数据管理计划名称和模块。模块是指不同的数据管理计划模板按照各自的逻辑结构将数据管理计划分成的不同部分,一个数据管理计划可能有多个级别的模块。模块主要包括模块名称和模块的附加信息。在数据管理计划中,模块的附加信息主要是对模块内容的描述或解释信息。
问题列表规范包括问题和问题间的逻辑关系。问题是指在研究中需要解决的数据相关的问题,如何有效地管理、存储、共享、保护和描述数据等等。问题包括在研究中需要解决的数据相关的问题、问题的附加信息和和答案。问题的附加信息主要是记录问题的注释信息或补充信息,或示例答案信息。当用户没有填写问题的答案时,问题将以叶子节点的形式单独呈现在思维导图中;若用户填写了答案,则问题和答案将以问题答案键值对的形式存储在临时存储库中,并在思维导图中将答案作为叶子节点进行一对一的呈现。问题间的逻辑关系主要记录的是用户填写答案的顺序,如用户填写完第3题后,需跳转到第7题继续完成数据管理计划的制定。
基于问题列表的思维导图映射规范具体如下:
Ⅰ、设置项目计划名称映射为思维导图的中心主题;
Ⅱ、设置数据管理计划的N级模块名称映射为思维导图的N级节点名称;
Ⅲ、设置当用户没有回答问题时,数据管理计划的具体问题映射为思维导图相应模块节点下的叶子节点;当用户回答了问题时,问题和答案将以问题和答案键值对的形式存储在系统的临时存储库中,并将答案映射为相应问题的叶子节点;
Ⅳ、设置模块和问题的附加信息映射为思维导图相应节点的附加信息;
Ⅴ、问题间的逻辑关系映射为思维导图节点间的超链接。
2)基于语义知识模型的思维导图映射规范;
在实际应用中,基于语义知识模型的思维导图映射规范可以提供给用户进行自定义,以便进行映射关系个性化定制和扩展。
在本发明的示例中,根据示例需求,将该语义知识模型的思维导图映射规范定义为如下内容:
1)首先进行节点和属性的映射,映射规范如下:
<owl:Class表明该行#后所含内容是类,映射为思维导图中的相应节点。
在<owl:Class模块中,“<rdfs:subClassOf”行的#后所含内容映射为该类的上一级节点。
<owl:NamedIndividual表示该行#后所含内容是用户构建的具体实例,映射为相应类的下一节点
<owl:DatatypeProperty表明该行#后所含内容是数据属性。在本示例中,对应数据管理计划中问题的附加信息,即对问题的注释信息或补充信息,或示例答案信息。
“<owl:Class”模块中的<rdfs:comment>表示该类有一属性“comment”,两个<rdfs:comment>间的内容是对该类的描述或解释信息,映射为思维导图中该类相应节点的附加信息。
2)最后进行节点间关系的映射规范,映射规范如下:
Ⅰ、<owl:ObjectProperty表明该行#后所含内容是对象属性,即两个类之间的语义关系,即RDF三元组中的谓语。
Ⅱ、在<owl:ObjectProperty模块中,“<rdfs:domain”行的#后所含内容是该谓语的主语,“<rdfs:range”行的#后所含内容是该谓语的宾语。在本示例中的对象属性是“has_answer”,表示数据管理计划中问题和答案之间的连线。答案将会被映射为思维导图的叶子节点,问题被映射为相应答案的上一级节点。
Ⅲ、“<owl:Class”模块中的“<rdfs:subClassOf”表示<owl:Class行#后所含的类是<rdfs:subClassOf行#后所含类的子类,即<owl:Class行#后所含的类映射为<rdfs:subClassOf行#后所含类的下一级节点。
Ⅳ、在“<owl:NamedIndividual”模块中的“<rdf:type”表示,<rdf:type行的#后所含内容是<owl:NamedIndividual行#后所含实例的类,即“类instance_of实例”,即将它们之间的语义关系存储为“instance_of”,并在思维导图中将实例映射为相应类的叶子节点。
Ⅴ、同一类下实例间的语义关系映射为思维导图中相应实例节点间的超链接。
3)删除映射后形成的思维导图中多余的节点信息和节点间的图形关系信息,补充映射后形成的思维导图中缺失的节点间的图形关系
Ⅰ、删除“DMP名称”类映射后形成的思维导图节点,将该类的实例映射后形成的思维导图的节点当作思维导图的中心主题节点,并删除“DMP名称”类与其实例以及其他类映射后形成的思维导图图形关系;
Ⅱ、将“DMP名称”类与其他类之间的语义关系映射后形成的思维导图图形关系,转变为“DMP名称”类的实例节点与他类节点之间思维导图图形关系,并完成思维导图中图形关系的补充;
Ⅲ、删除类间除了“subClassOf”映射后形成的思维导图图形关系外,其他所有的类间语义关系映射后形成的思维导图图形关系;
Ⅳ、删除“xx相关问题”类和“xx相关答案”类映射后形成的思维导图节点,以及与其他节点间的图形关系;
Ⅴ、构建“xx相关问题”类的实例与“xx相关问题”类的父类之间的“instance_of”语义关系,并完成“xx相关问题”类的实例与“xx相关问题”的父类的“instance_of”语义关系的思维导图图形关系映射。
4)当项目组团队成员协作构建数据管理计划时,在完成语义知识模型的拆分、合并后,在新合成的语义模型中使用不同的颜色和标注创建人姓名等方法,对N个语义模型(N等于团队成员构建的数据管理计划数量)中不同的模块和内容进行直观的区分。
S2、根据思维导图映射规范,将数据管理计划各部分信息映射为思维导图的节点信息、附加信息以及节点间的树状结构关系信息。
系统首先会根据用户填写的项目类别、学科分类、计划名称等信息,采用语义分析技术,基于预构建的语义知识模型,为用户推荐相关的数据管理计划,用户可以采用推荐的数据管理计划或选择根据业务需求自己构建数据管理计划。
S2.1、用户选择采用推荐的数据管理计划。
当用户选择采用推荐的数据管理计划时,系统将依据步骤1.2中的“基于问题列表的思维导图映射规范”对数据管理计划的项目名称、模块名称、问题、问题间的逻辑关系、模块或问题的附加信息、答案进行思维导图的映射。
具体的,在用户没有进行数据管理计划的问题作答时,将数据管理计划的项目名称映射为思维导图的中心主题,N级模块名称映射为思维导图的N级节点,模块内的具体问题映射为思维导图相应模块下的叶子节点,问题间的逻辑关系通过在思维导图相应问题节点之间添加超链接实现。具体而言,思维导图相应问题节点间的超链接可以通过超文本标记语言(HTML)语言进行自定义编辑而实现。对于模块和问题的附加信息,可采用悬浮窗口、外置标签或内嵌节点等多种形式,将模块和问题的附加信息展示在对应节点上,使得思维导图能够在展示数据管理计划主要信息的同时,兼具携带同级额外信息。
S2.2、用户选择根据业务需求自建数据管理计划。
当用户选择根据业务需求自建数据管理计划,系统将基于预构建的语义知识模型和问题库为用户推荐相应的数据管理计划框架和各模块所对应的问题。用户可按照业务需求对推荐的数据管理计划模块进行增加、删除和修改,然后依据步骤1.2中的“基于语义知识模型的思维导图映射规范”对语义知识模型中的各节点、节点的附加信息和节点间的关系进行标注。
下面以用户构建的高血压数据管理计划的数据采集模块为例,如图3所示,说明将用户自建的数据管理计划映射为思维导图的过程。
1)获取该语义知识模型RDF文档,如图9所示;
2)依次读取该文档中各类、实例的节点信息、属性信息以及类和实例间的关系信息,对其进行解析。
具体的,首先构建一个节点数据库和节点间关系数据库。节点数据库用于临时存储读取的语义知识模型中各类、各实例的信息;节点间关系数据库用于临时存储读取的语义知识模型中各类、各实例之间的语义关系信息。
依次读取RDF文档包括:
Ⅰ、读到“<owl:ObjectProperty”可知,该模型含有一个类间的谓语关系“has_answer”,并且是从“数据采集相关问题”类指向“数据采集相关答案”类的。
Ⅱ、继续读到“<owl:DatatypeProperty”可知,该模型的实例有一个数据属性“备注”,并且其内容的字符类型是string。
Ⅲ、继续读到“<owl:Class”可知,该模型有一个类“DMP名称”;
该模型有一个类“数据采集”,它是“计划详情”的子类,并且有一个“comment”的属性,该属性的内容是“本节将描述您计划收集或创建的数据”;
该模型有一个类“数据采集相关答案”,它是“数据采集”的子类;
该模型有一个类“数据采集相关问题”,它是“数据采集”的子类;
该模型有一个类“计划详情”,它是“DMP名称”的子类;
Ⅳ、继续读到“<owl:NamedIndividual”可知,该模型有一个实例“R和spss”,它是“数据采集相关答案”类的实例;
该模型有一个实例“txt和csv”,它是“数据采集相关答案”类的实例;
该模型有一个实例“将使用什么文件格式”,它是“数据采集相关问题”类的实例,并且与实例“txt和csv”之间的语义关系是“has_answer”。它有一个“备注”的数据属性,具体内容为“对于所有收集或生成的数据,请说明将用于存储的文件格式。例如,纯文本(.txt)、逗号分隔值(.csv)、地理参考TIFF(.GIF、.tfw)”;
该模型有一个实例“您会创建任何软件或编写任何代码来处理或分析数据吗”,它是“数据采集相关问题”类的实例,并且与实例“R和spss”之间的语义关系是“has_answer”。它有一个“备注”的数据属性,具体内容为“如果是,请详细说明”;
该模型有一个实例“高血压数据管理计划”,它是“DMP名称”类的实例。
Ⅴ、继续读到“</rdf:RDF>”,文档结束。
将读取的节点信息和节点间关系信息存储在节点数据库和节点间关系库中,用于模型的解析和思维导图的映射。本示例中的节点信息和节点间关系信息如表1和表2所示:
表1-节点数据库
表2-节点间关系数据库
3)按照映射规范将读取的类、实例和属性信息以及它们之间的关系信息映射为思维导图的图形信息。
在本发明的示例中,首先进行语义知识模型节点信息、属性信息与思维导图图信息间的映射,具体的,将类“DMP名称、数据采集、数据采集相关答案、数据采集相关问题、计划详情、数据采集相关问题”,和实例“R和spss、txt和csv、将使用什么文件格式、您会创建任何软件或编写任何代码来处理或分析数据吗、高血压数据管理计划”;类的属性“Comment:本节将描述您计划收集或创建的数据”映射为思维导图中“数据采集”节点的附加信息;实例的属性“备注:对于所有收集或生成的数据,请说明将用于存储的文件格式。例如,纯文本(.txt)、逗号分隔值(.csv)、地理参考TIFF(.GIF、.tfw)”和“如果是,请详细说明”分别映射为思维导图中“将使用什么文件格式”和“您会创建任何软件或编写任何代码来处理或分析数据吗”节点的附加信息。
在本发明的示例中,在节点映射完毕后,将依据基于语义知识模型的思维导图映射规范,进行语义知识模型语义关系信息与思维导图树状结构关系信息的映射。具体的,可以获取语义知识模型中全部的语义关系,语义关系包括类间的语义关系和实例间的语义关系。梳理思维导图中全部节点间的图形关系,包括类之间的子类和父类关系(subClassOf)以及类之间的其他语义关系(如has_answe),类和实例之间的语义关系(instance_of),以及实例继承类间的语义关系后形成的实例间的语义关系(如has_answer),而后根据各语义关系的主语和宾语信息,映射为思维导图中各节点之间的树状结构关系。
具体的,根据基于语义知识模型的思维导图映射规范依据读取的类、实例间的语义关系可知:
Ⅰ、“数据采集相关问题”类和“数据采集相关答案”类之间的“has_answer”语义关系映射为思维导图中“数据采集相关问题”节点指向“数据采集相关答案”节点的图形关系;
Ⅱ、“数据采集相关答案”类和“数据采集”类之间的“subClassOf”语义关系、“数据采集相关问题”类和“数据采集”类之间的“subClassOf”语义关系、“计划详情”类和“DMP名称”类之间的“subClassOf”语义关系映射为思维导图中“数据采集相关答案”节点指向“数据采集”节点、“数据采集相关问题”节点指向“数据采集”节点、“计划详情”节点指向“DMP名称”节点的图形关系;
Ⅲ、“数据采集相关答案”类和“R和spss”实例之间的“instance_of”语义关系、“数据采集相关答案”类和“txt和csv”实例之间的“instance_of”语义关系、“数据采集相关问题”类和“将使用什么文件格式?”实例之间的“instance_of”语义关系映射为思维导图中“数据采集相关答案”节点指向“R和spss”节点、“数据采集相关答案”节点指向“txt和csv”节点、“数据采集相关问题”节点指向“将使用什么文件格式?”节点的图形关系;
Ⅳ、“将使用什么文件格式?”实例和“txt和csv”实例间的“has_answer”语义关系映射为思维导图中“将使用什么文件格式?”节点指向“txt和csv”节点的图形关系;
Ⅴ、“数据采集相关问题”类和“您会创建任何软件或编写任何代码来处理或分析数据吗?”实例之间的“instance_of”语义关系映射为思维导图中“数据采集相关问题”节点指向“您会创建任何软件或编写任何代码来处理或分析数据吗?”节点的图形关系;
Ⅵ、“您会创建任何软件或编写任何代码来处理或分析数据吗?”实例和“R和spss”实例间的“has_answer”语义关系为思维导图中“您会创建任何软件或编写任何代码来处理或分析数据吗?”节点指向“R和spss”节点的图形关系;
Ⅶ、“DMP名称”类和“高血压数据管理计划”实例之间的“instance_of”语义关系映射为思维导图中“DMP名称”节点指向“高血压数据管理计划”节点的图形关系。
在本示例中,通过本发明提出的标注方法和映射方法,可将用户制定的数据管理计划转换为含标记的数据管理计划。本发明的思维导图映射规范不限定标记的位置,也不限定上述标记方法,其他基于数据管理计划进行思维导图映射的方法也在本发明的涵盖范围内。
S3、根据获取的节点信息、附加信息和节点间的树状结构关系信息建立思维导图。
根据解析获取的思维导图节点和节点间的图形关系,获得的思维导图如图4所示。
在本实例中,类和实例的属性信息是通过悬浮窗口实现的,例如,在思维导图中,当鼠标点(是指鼠标光标或鼠标箭头所指的点)悬浮于计划详情节点时,计划详情节点的附加信息才会显示,如图5所示
删除映射后形成的高血压数据管理计划思维导图中多余的节点信息和节点间的图形关系信息,补充映射后形成的思维导图中缺失的节点间的图形关系。
在本示例中,依据基于语义知识模型的思维导图映射规范:
Ⅰ、删除“DMP名称”类映射后形成的思维导图节点“DMP名称”,并将该类的实例“高血压数据管理计划”映射后形成的思维导图节点“高血压数据管理计划”当作思维导图的中心主题节点,并删除“DMP名称”类与其实例“高血压数据管理计划”和其他类“计划详情”映射后形成的思维导图图形关系;
Ⅱ、将“DMP名称”类与“计划详情”类之间的语义关系映射后形成的思维导图图形关系,转变为“高血压数据管理计划”节点与“计划详情”节点之间思维导图图形关系,并完成思维导图中图形关系的补充;
Ⅲ、删除类间除了“subClassOf”映射后形成的思维导图图形关系外,其他所有的类间语义关系映射后形成的思维导图图形关系;
Ⅳ、删除“数据采集相关问题”类和“数据采集相关答案”类映射后形成的思维导图节点,以及与其他节点间的图形关系;
Ⅴ、构建“数据采集相关问题”类的实例“将使用什么文件格式?”和“您会创建任何软件或编写任何代码来处理或分析数据吗”与“数据采集相关问题”类的父类“数据采集”之间的“instance_of”语义关系,并完成实例“将使用什么文件格式?”和“您会创建任何软件或编写任何代码来处理或分析数据吗”与类“数据采集”间“instance_of”语义关系的思维导图图形关系映射。
S4、生成和导出数据管理计划
依据基于语义知识模型的思维导图映射规范,本示例中的语义知识模型映射为如下的思维导图经整理,上述知识图谱转变成思维导图,如图6所示;
当用户选择通过团队协作的方式共同创建项目的数据管理计划时,系统会将项目组不同成员构建的数据管理计划进行对比。具体来说,将各成员构建的数据管理计划语义知识模型的类、实体、属性、类及实体间的语义关系进行严格的一一对比,生成一个新的数据管理计划语义知识模型,包含原有模型的相同部分和不同部分。然后依据步骤1.2中的“基于语义知识模型的思维导图映射规范”对语义知识模型中的各节点、节点的附加信息和节点间的关系进行标注,并使用不同的颜色标注出语义模型中不同模块和内容的创建人姓名,以便不断完善项目的数据管理计划,提高计划的质量。
具体映射过程如图7下所示。
本发明支持用户将完成的数据管计划以多种形式导出,如word、pdf等文本的形式,思维导图的图片或JSON机器可读的形式,以便与其他人共享或保存。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (4)

1.一种基于思维导图的人口健康领域科学数据管理生成方法,其特征在于,包括以下步骤:
S1、根据项目需求获得数据管理计划语义知识和原始数据管理计划;
S2、根据数据管理计划语义知识建立数据管理计划语义知识模型和思维导图映射规范;
S3、根据思维导图映射规范,将原始数据管理计划各部分信息映射为思维导图的节点信息、附加信息以及节点间的树状结构关系信息,形成映射关系;
S4、根据映射关系建立思维导图;
S5、根据思维导图生成和导出科学数据管理计划;
思维导图映射规范分为基于问题列表的思维导图映射规范和基于语义知识模型的思维导图映射规范;
基于问题列表的思维导图映射规范包括标题和问题列表的映射规范,标题的映射规范包括项目数据管理计划名称和模块,模块包括模块名称和模块的附加信息,模块的附加信息包括对模块内容的描述或解释信息;
基于语义知识模型的思维导图映射规范包括节点和属性的映射规范、节点间关系的映射规范、映射后形成的思维导图修改和完善规范、以及项目团队成员协作制定管理计划时的映射规范;
S3步骤中,节点信息包括节点的名称,对应原始数据管理计划中的计划名称、模块名称、问题和答案以及数据管理计划语义知识模型中的类和实例的概念名称;
附加信息包括节点的属性,对应原始数据管理计划中的模块名称和问题的补充和解释信息以及数据管理计划语义知识模型中的类和实例的属性信息;
节点间的树状结构关系信息包括开始节点信息、结束节点信息和两个节点之间的关系属性;
根据映射关系,确定两个节点之间的树状结构关系信息;
根据映射关系,确定两个节点之间的树状结构关系信息包括:
1)基于问题列表的思维导图映射规范确定为两个节点之间的树状结构关系信息,根据映射关系,将计划名称确定为思维导图中心主题名称,将N级模块名称映射思维导图的N级节点名称;当问题含有答案时,将答案映射为叶子节点;若没有答案,则将问题映射为叶子节点;
2)基于语义知识模型的思维导图映射规范确定为两个节点之间的树状结构关系信息,根据映射关系,将语义知识模型中的父类确定为开始节点,将父类对应的子类或实例确定为结束节点,或者将语义关系的domain属性所对应的节点确定为开始节点,将语义关系的range属性所对应的节点确定为结束节点;根据父类节点和子类节点或父类节点和实例,以及两个类或两个实例之间的语义关系确定两个节点之间的关系属性。
2.根据权利要求1所述的一种基于思维导图的人口健康领域科学数据管理生成方法,其特征在于,
S2中,数据管理计划语义知识模型用于支持用户进行数据管理计划的自制定和项目团队成员间协作制定数据管理计划。
3.根据权利要求1所述的一种基于思维导图的人口健康领域科学数据管理生成方法,其特征在于,
S4中,建立思维导图包括将映射获得的思维导图节点和节点间的图形关系与思维导图的树状结构关系进行对比,从映射得到思维导图中找到多余的节点和图形关系,加入待删除节点列表和待删除图形关系列表;从映射得到思维导图中找到缺失的图形关系,加入待补充图形关系列表。
4.根据权利要求1所述的一种基于思维导图的人口健康领域科学数据管理生成方法,其特征在于,
S5中,生成数据管理计划包括人类可读的以问题列表形式呈现的数据管理计划或者以思维导图形式呈现的数据管理计划,或机器可读的数据管理计划文件生成步骤,根据思维导图映射规范、待删除节点列表、待删除图形关系列表、待补充图形关系列表,将思维导图中多余的节点和关系进行删除约束,对思维导图中缺失的关系进行补充,得到能清晰准确表达问题列表数据管理计划内容和问题间逻辑关系的思维导图;
项目组使用团队协作的方式共同创建项目的数据管理计划,将各成员制定的数据管理计划语义知识模型进行拆分、组合,得到一个整合后的综合数据管理计划语义知识模型,对综合数据管理计划语义知识模型与各成员制定的数据管理计划语义知识模型进行对比,标注出模型之间的差异,并按照基于语义知识模型的思维导图映射规范映射为思维导图形式的科学数据管理计划。
CN202311425816.4A 2023-10-31 2023-10-31 一种基于思维导图的人口健康领域科学数据管理生成方法 Active CN117151442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311425816.4A CN117151442B (zh) 2023-10-31 2023-10-31 一种基于思维导图的人口健康领域科学数据管理生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311425816.4A CN117151442B (zh) 2023-10-31 2023-10-31 一种基于思维导图的人口健康领域科学数据管理生成方法

Publications (2)

Publication Number Publication Date
CN117151442A CN117151442A (zh) 2023-12-01
CN117151442B true CN117151442B (zh) 2024-01-23

Family

ID=88906595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311425816.4A Active CN117151442B (zh) 2023-10-31 2023-10-31 一种基于思维导图的人口健康领域科学数据管理生成方法

Country Status (1)

Country Link
CN (1) CN117151442B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113488180A (zh) * 2021-07-28 2021-10-08 中国医学科学院医学信息研究所 一种临床指南知识建模方法及系统
CN115115740A (zh) * 2022-04-21 2022-09-27 腾讯科技(深圳)有限公司 思维导图识别方法、装置、设备、介质及程序产品

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2520263A (en) * 2013-11-13 2015-05-20 Ibm Method for enhancing a mind map with different streams of information

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113488180A (zh) * 2021-07-28 2021-10-08 中国医学科学院医学信息研究所 一种临床指南知识建模方法及系统
CN115115740A (zh) * 2022-04-21 2022-09-27 腾讯科技(深圳)有限公司 思维导图识别方法、装置、设备、介质及程序产品

Also Published As

Publication number Publication date
CN117151442A (zh) 2023-12-01

Similar Documents

Publication Publication Date Title
Simon et al. Linked data annotation without the pointy brackets: Introducing Recogito 2
CN103399857B (zh) 一种通用文档结构信息抽取方法
Hartmann et al. An infrastructure for scalable, reliable semantic portals
KR20200082179A (ko) 공간 데이터의 의미론적 주석을 위한 데이터 변환 방법
Gruber et al. Semantic web technologies applied to numismatic collections
Völkel Personal knowledge models with semantic technologies
CN113704383A (zh) 篇章语义标注的方法、系统及装置
CN117151442B (zh) 一种基于思维导图的人口健康领域科学数据管理生成方法
Kokolaki et al. Facetize: An interactive tool for cleaning and transforming datasets for facilitating exploratory search
Fafalios et al. Towards Semantic Interoperability inHistorical Research: Documenting Research Data and Knowledge with Synthesis
Liu et al. A Java-based digital library portal for geography education
Oelen Leveraging human-computer interaction and crowdsourcing for scholarly knowledge graph creation
Fakhre Alam et al. A comparative study of RDF and topic maps development tools and APIs
Jones XooML: XML in support of many tools working on a single organization of personal information
Meghini et al. Introducing narratives in Europeana: Preliminary steps
Hu et al. The China family tree geographic information system
Faulhaber PhiloBiblon y el mundo wiki
Peng et al. PZXG: A genealogy data service platform for kinship management and application
Darari et al. LinkedLab: A linked data platform for research communities
Bedi et al. Versioning OWL ontologies using temporal tags
Liu et al. A conceptual model for the web
Shakya et al. StYLiD: Social Information Sharing with Free Creation of Structured Linked Data.
Jordal et al. Was it worth it? Experiences with a CIDOC CRM-based database
Buchanan et al. Periods, Organized (PeriodO): A gazetteer of period assertions for linking and visualizing periodized data
Busse et al. Information handling—A challenge for databases and expert systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant