CN113643506A - 一种遗传资源处理的预警方法和装置 - Google Patents

一种遗传资源处理的预警方法和装置 Download PDF

Info

Publication number
CN113643506A
CN113643506A CN202110557535.9A CN202110557535A CN113643506A CN 113643506 A CN113643506 A CN 113643506A CN 202110557535 A CN202110557535 A CN 202110557535A CN 113643506 A CN113643506 A CN 113643506A
Authority
CN
China
Prior art keywords
file
genetic
resource
resource information
early warning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110557535.9A
Other languages
English (en)
Other versions
CN113643506B (zh
Inventor
吴闯
孙向奎
李星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bayer Healthcare LLC
Original Assignee
Beijing Deep Intelligent Pharma Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Deep Intelligent Pharma Technology Co ltd filed Critical Beijing Deep Intelligent Pharma Technology Co ltd
Priority to CN202110557535.9A priority Critical patent/CN113643506B/zh
Publication of CN113643506A publication Critical patent/CN113643506A/zh
Application granted granted Critical
Publication of CN113643506B publication Critical patent/CN113643506B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Technology Law (AREA)
  • Emergency Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请提供一种遗传资源处理的预警方法和装置,装置包括:第一监控模块,用于对目标对象内的资源信息进行监控,判断所述目标对象内是否出现新的资源信息,当所述目标对象内出现新的资源信息时向采集模块输出采集指令,所述资源信息包括关于遗传资源的目标法规文件,以及行政处罚文件;第一采集模块,用于在获取到所述采集指令时,由所述目标对象内获取所述新的资源信息;第一识别模块,用于采用自然语言处理技术对所述第一采集模块采集的资源信息的内容进行识别,得到目标字段,基于所述目标字段生成存储文件并进行存储;第一预警模块,用于当所述第一采集模块更新本地存储内容时,输出预警信号,实现了对遗传资源相关文件的管理。

Description

一种遗传资源处理的预警方法和装置
技术领域
本发明涉及数据处理技术领域,具体涉及一种遗传资源处理的预警方法和装置。
背景技术
人类遗传资源是:1)生命科学研究的重要物质和信息基础(认识人类进化、研究种族之间血缘关系、研究人的寿命和衰老等),2)认知和掌握疾病发生、发展的基础资料(新靶点发现、创新药物、新型疫苗、先进医疗装备、生物治疗技术、人口健康研究等),因此,为了国家安全,各个国家对于人类遗传资源的利用都有相关规定。
因此,如何安全可靠的对遗传资源相关数据进行管理,成为本领域技术人员亟待解决的技术问题之一。
发明内容
有鉴于此,本发明实施例提供一种遗传资源处理的预警方法和装置,以实现对遗传资源相关数据进行管理。
为实现上述目的,本发明实施例提供如下技术方案:
一种遗传资源处理的预警装置,包括:
第一监控模块,用于对目标对象内的资源信息进行监控,判断所述目标对象内是否出现新的资源信息,当所述目标对象内出现新的资源信息时向第一采集模块输出采集指令,所述资源信息包括关于遗传资源的目标法规文件,以及行政处罚文件;
第一采集模块,用于在获取到所述采集指令时,由所述目标对象内获取所述新的资源信息;
第一识别模块,用于采用自然语言处理技术对所述第一采集模块采集的资源信息的内容进行识别,得到目标字段,基于所述目标字段生成存储文件并进行存储;
第一预警模块,用于当所述第一采集模块更新本地存储内容时,输出预警信号。
可选的,上述遗传资源处理的预警装置中,所述第一监控模块判断所述目标对象内是否出现新的资源信息时,具体用于:
对所述目标对象中所新增的数据内容进行关键字识别,当所述新增的数据内容命中的关键字数量大于预设值时,表明所述目标对象内出现新的资源信息;
或者是,采用人工智能模型对目标对象中所新增的数据内容的主题字段进行识别,基于识别结果判断被识别的数据内容是否属于所述资源信息,如果属于时,表明所述目标对象内出现新的资源信息。
可选的,上述遗传资源处理的预警装置中,所述第一识别模块在采用自然语言处理技术对所述第一采集模块采集的资源信息的内容进行识别,得到目标字段时,具体用于:
采用分类模型基于所述第一采集模块采集的资源信息的内容对所述资源信息进行分类,获取与分类结果相匹配的目标字段列表,基于所述目标字段列表对所述第一采集模块采集的资源信息进行数据抓取,基于抓取数据生成与所述目标字段列表相匹配的数据表。
可选的,上述遗传资源处理的预警装置中,还包括:
申报资料监控模块,用于目标文档管理系统相连,检测所述目标系统中存储的遗传资源申报书准备文件是否更新,所述遗传资源申报书准备文件包括但不限于研究方案文件、知情同意书文件、伦理审查批件文件、国际合作协议文件;
遗传资源采集模块,用于获取并存储更新后的遗传资源申报书准备文件;
第二预警模块,用于当检测到遗传资源申报书准备文件更新时,生成预警信号。
可选的,上述遗传资源处理的预警装置中,还包括:
遗传资源样本采集模块,用于获取遗传资源采集数据;
遗传资源申报文件存储模块,用于将获取到的获取遗传资源采集数据和与其对应的预设遗传资源申报文件各项指标进行比较,判断采集数据与所述申报文件中的申报数据是否一致,如果不一致,向第三预警模块输出触发指令;
第三预警模块,用于获取到触发指令时,生成预警信号。
可选的,上述遗传资源处理的预警装置中,还包括:
推送模块,用于当检测到所述遗传资源处理的预警装置内有预警信号生成时,根据预设推送规则,将所述预警信号推送至目标用户。
一种遗传资源处理的预警方法,包括:
对目标对象内的资源信息进行监控,判断所述目标对象内是否出现新的资源信息,所述资源信息包括关于遗传资源的目标法规文件,以及行政处罚文件;
获取所述目标对象内新的资源信息时;
采用自然语言处理技术对采集的资源信息的内容进行识别,得到目标字段,基于所述目标字段生成存储文件并进行存储,生成并输出预警信号;
可选的,上述遗传资源处理的预警方法中,判断所述目标对象内是否出现新的资源信息包括:
对所述目标对象中所新增的数据内容进行关键字识别,当所述新增的数据内容命中的关键字数量大于预设值时,表明所述目标对象内出现新的资源信息;
或者是,采用人工智能模型对目标对象中所新增的数据内容的主题字段进行识别,基于识别结果判断被识别的数据内容是否属于所述资源信息,如果属于时,表明所述目标对象内出现新的资源信息。
可选的,上述遗传资源处理的预警方法中,所述采用自然语言处理技术对采集的资源信息的内容进行识别,得到目标字段,包括:
采用分类模型基于采集到的资源信息的内容对所述资源信息进行分类,获取与分类结果相匹配的目标字段列表,基于所述目标字段列表对采集到的资源信息进行数据抓取,基于抓取数据生成与所述目标字段列表相匹配的数据表。
可选的,上述遗传资源处理的预警方法中,还包括:
基于目标系统中存储的遗传资源申报书准备文件对本地存储的遗传资源申报书准备文件监控,所述遗传资源申报书准备文件包括但不限于研究方案文件、知情同意书文件、伦理审查批件文件、国际合作协议文件;
获取并存储更新后的遗传资源申报书准备文件;
当检测到遗传资源申报书准备文件更新时,生成预警信号。
可选的,上述遗传资源处理的预警方法中,还包括:
获取遗传资源采集数据;
将获取到的获取遗传资源采集数据和与其对应的预设遗传资源申报文件各项指标进行比较,判断采集数据与所述申报文件中的申报数据是否一致,如果不一致,生成并输出预警信号。
可选的,上述遗传资源处理的预警方法中,还包括:
当检测到所述遗传资源处理的预警方法中内有预警信号生成时,根据预设推送规则,将所述预警信号推送至目标用户。
基于上述技术方案,本发明实施例提供的上述方案,通过所述第一监控模块对目标对象内的发布内容进行监控,当检测到所述目标对象发布目标法规文件或行政处罚文件时,获取所述目标对象发布的目标法规文件或行政处罚文件,采用所述第一识别模块对所述目标法规文件或行政处罚文件数据抓取,得到目标字段,对所述目标字段进行存储,然后生成并输出预警信号,实现了目标法规文件,以及行政处罚文件管理,以及预警。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例公开的遗传资源处理的预警装置的结构示意图;
图2为本申请实施例公开的遗传资源处理的预警方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。为了更加特定地强调实施的独立性,本说明书涉及许多模块或单元。举例而言,模块或单元可由硬件电路实现,该硬件电路包括特制VLSI电路或门阵列,比如逻辑芯片、晶体管,或其它组件。模块或单元也可在可编程的硬设备中实现,比如场效可编程门阵列、可编程阵列逻辑、可编程逻辑设备等等。
模块或单元也可在藉由各种形式的处理器所执行的软件中实现。比如说,一可执行码模块可包括一个或多个实体的或逻辑的计算机指令区块,该区块可能形成为,比如说,对象、程序或函数。然而,鉴别模块或单元的可执行部分不需要物理上放置在一起,但可由存于不同位置的不同指令所组成,当逻辑上组合在一起时,形成模块或单元且达到该模块或单元所要求的目的。实际上,可执行码模块或单元可以是一单一指令或多个指令,甚至可以分布在位于不同的程序中的数个不同的码区段,并且横跨数个存储设备。同样地,操作数据可被辨识及显示于此模块或单元中,并且可以以任何合适的形式实施且在任何合适的数据结构形式内组织。操作数据可以集合成单一数据集,或可分布在具有不同的存储设备的不同的位置,且至少部分地只以电子信号方式存在于一系统或网络。
本说明书所提及的“实施例”或类似用语表示与实施例有关的特性、结构或特征,包括在本发明的至少一实施例中。因此,本说明书所出现的用语“在一实施例中”、“在实施例中”以及类似用语可能但不必然都指向相同实施例。再者,本发明所述特性、结构或特征可以以任何方式结合在一个或多个实施例中。以下说明将提供许多特定的细节,比如编程序、软件模块、用户选择、网络交易、数据库查询、数据库结构、硬件模块、硬件电路、硬件芯片等例子,以提供对本发明实施例的了解。然而相关领域的普通技术人员将看出本发明,即使没有利用其中一个或多个特定细节,或利用其它方法、组件、材料等亦可实施。另一方面,为避免混淆本发明,公知的结构、材料或操作并没有详细描述。
为了对遗传资源数据进行管理,本申请公开了一种遗传资源处理的预警装置,参见图1,该装置可以包括:
第一监控模块100、第一采集模块200、第一识别模块300和第一预警模块 400;
在本方案中,所述第一监控模块100用于对目标对象内的资源信息进行监控,判断所述目标对象内是否出现新的资源信息,当所述目标对象内出现新的资源信息时向第一采集模块200输出采集指令,所述资源信息包括目标法规文件,以及行政处罚文件;
具体的,所述第一监控模块100用于采用预设方式对监控列表内的目标对象内存储的资源信息进行监控,判断所述目标对象内是否出现新的资源信息,其中,所述预设防止可以指的是现有技术中的任意一种数据监控方式,例如,在本方案中,所述预设防止可以为爬虫或者是RSS订阅等方式,所述监控列表内的目标对象指的是目标网站,在现有方案中,所述目标网站为发布目标法规文件以及行政处罚文件的网站,所述目标网站的数量可以为多个。所述第一监控模块100用于对所述目标网站内的发布内容进行监控,当检测到所述目标网站发布新的目标法规文件或行政处罚文件时,表明所述目标对象内出现新的资源信息。
在本申请实施例公开的技术方案中,所述目标对象内发布的文件可能是本申请中所需监控的资源信息对应的文件,也可以是其他类型的文件,为了判断所述目标对象内发布的新的文件是否是本申请所需架空的资源信息文件,上述方案中,所述第一监控模块100判断所述目标对象内是否出现新的资源信息时,具体用于:
对所述目标对象中所新增的数据内容进行关键字识别,当所述新增的数据内容命中的关键字数量大于预设值时,表明所述目标对象内出现新的资源信息;在本方案中,可以预先设置多个关键字,基于所述关键字对所述目标对象发布的内容进行匹配,当所述目标对象某个发布内容命中所述关键字,且命中的关键字的数量大于预设值时,表明所述目标对象的发布内容为本方案所需监控的资源信息,所述关键字的理性可以依据用户需求自行设定。
或者是,在本方案中,也可以预先配置一个人工智能模型,所述人工智能模型内加载有用于对所述目标对象的发布内容进行识别的神经网络模型,通过所述人工智能模型对所述目标对象发布的内容的主题字段进行识别,基于识别结果判断被识别的数据内容是否属于所述目标法规文件或行政处罚文件,如果属于时,表明所述目标对象内出现新的资源信息,否则,不触发后续操作。
所述第一采集模块200,用于在获取到所述第一监控模块100输出的采集指令时,由所述目标对象内获取所述新的资源信息;所述第一采集模块200由所述目标网站内获取所述目标网站发布的新的目标法规文件以及行政处罚文件;
第一识别模块300,用于采用自然语言处理技术对所述第一采集模块200 采集的资源信息的内容进行识别,得到目标字段,基于所述目标字段生成存储文件并进行存储;
在本方案中,所述第一识别模块300用于对所述第一采集模块200采集到的资源信息的内容进行识别,并采用预设处理方式对所述资源信息进行预处理,生成预设格式的文件列表,例如,以所述行政处罚文件为例,本方案中,通过对获取到的行政处罚文件进行预处理,所述预处理后的文件中,具有处罚单位字段、处罚单位地址字段、触发单位法人字段、触发时间字段、处罚原因字段、触发类别字段、触发结果字段等,基于这些字段构建数据表,并对构建好的数据表进行存储。
本方案中,在存储所述目标对象内发布的资源信息时,可以对这些信息进行格式转换后进行存储,例如,所述第一识别模块300在采用自然语言处理技术对所述第一采集模块200采集的资源信息的内容进行识别,得到目标字段时,具体用于:
采用分类模型基于所述第一采集模块200采集的资源信息的内容对所述资源信息进行分类,获取与分类结果相匹配的目标字段列表,基于所述目标字段列表对所述第一采集模块200采集的资源信息进行数据抓取,基于抓取数据生成与所述目标字段列表相匹配的数据表。上述方案中,所述目标法规文件以及行政处罚文件所需抓取的字段不同,在本方案中,可以预先采用所述分类模块对所述目标对象发布的资源信息进行分类,判断发布内容是目标法规文件还是行政处罚文件,
例如,构建好的数据表可以如下所示:
Figure RE-GDA0003293356530000081
所述第一预警模块400,用于当所述第一采集模块200更新本地存储内容时,输出预警信号。即,当所述第一预警模块400当检测到有新的资源信息存储在本地存储设备中时,输出预警信号,提示用户有新的目标法规文件或行政处罚文件,其中,该预警信号中具有用于对更新的目标法规文件或行政处罚文件进行定位的地址信号。
在本申请上述实施例提供的方案中,通过所述第一监控模块100对目标对象内的发布内容进行监控,当检测到所述目标对象发布目标法规文件或行政处罚文件时,获取所述目标对象发布的目标法规文件或行政处罚文件,采用所述第一识别模块300对所述目标法规文件或行政处罚文件数据抓取,得到目标字段,对所述目标字段进行存储,然后生成并输出预警信号,实现了目标法规文件,以及行政处罚文件管理,以及预警。
本申请实施例公开的上述系统,除了可以对所述目标法规文件以及行政处罚文件进行监控外,还可以对遗传资源申报书准备文件进行监控,所述遗传资源申报书准备文件可以包括但不限于研究方案文件、知情同意书文件、伦理审查批件文件、国际合作协议文件,对这些文件进行监控和及时更新本地文件。对此,上述方案中还可以包括:
申报资料监控模块500,用于目标文档管理系统相连,检测所述目标系统中存储的遗传资源申报书准备文件是否更新,其中,所述目标文档管理系统可以包括但不限于SharePoint、企业内容管理(ECM)等系统,这些系统中存储有所述研究方案文件、知情同意书文件、伦理审查批件文件、国际合作协议文件等,系统内部的相应文件会不定期进行更新;
遗传资源采集模块600,用于获取并存储更新后的遗传资源申报书准备文件;
申报变更识别模块610,用于将获取到的遗传资源申报书准备文件与已存储的本地遗传资源申报书准备文件进行对比,如果两者不一致时,更新本地以存储的遗传资源申报书准备文件;
第二预警模块700,用于当检测到遗传资源申报书准备文件更新时,生成预警信号,在本步骤中国将获取到的遗传资源申报书准备文件中的预置条件与已经存储的遗传资源申报书准备文件的预置条件进行对比,判断是否需要更新本地存储的遗传资源申报书准备文件,如果预置条件发生变化,则需要更新文件,否则不需要更新文件,所述阈值条件可以包括但不限于:方案版本及版本日期、伦理审查批件号、知情同意书版本号、筛选人数/入组人数、是否出境、是否涉及基因检测、是否涉及生物标志物、人类遗传资源来源、项目摘要、项目名称、合作方、联系方式(联系人、电话、邮箱、通讯地址)、临床试验批件号等。当所述阈值条件中的任意一项发生变化时,则判定需要更新本地存储的遗传资源申报书准备文件,并生成预警信号。在本方案中,可以通过该预警信号所包含的地址数据对更新的本地存储的遗传资源申报书准备文件进行定位。
在本申请另一实施例公开的技术方案中,还可以包括:
遗传资源样本采集模块800,用于通过主动(如通过可穿戴设备跟踪受试者样本采集量)或被动(人工获取相关信息上传至监控模块)的方式获取遗传资源采集数据;
遗传资源变更识别模块900,用于将获取到的获取遗传资源采集数据和与其对应的预设遗传资源申报文件各项指标进行比较,判断采集数据与所述申报文件中的申报数据是否一致,如果不一致,控制第三预警模块1000输出预警信号;在本方案中,所述各项指标可以为样本类型、单例数量、例数、合计数量、单位规格、检测内容、检测单位等,当上述任意一项指标不一致时,均触发第三预警模块1000。
例如,遗传资源申报文件中申请的样本采集计划为:全血100管、尿液 100管;受试者入组后在site实际产生的遗传资源采集数据为全血100管,尿液120管,血浆500ml;
则所述遗传资源变更识别模块900会识别出:尿液已申请-20管;血浆未申请-500ml。基于这些识别出的数据生成预警信号,且所述预警信号中具有用于对所述遗传资源采集数据进行定位的地址信息。
第三预警模块1000,用于当检测到遗传资源申报文件更新或者是有新的遗传资源申报文件存储时,生成预警信号。
在本申请另一实施例公开的技术方案中,还包括:推送模块1100,用于当检测到所述遗传资源处理的预警装置内有预警信号生成时,根据预设推送规则,将所述预警信号推送至目标用户。具体的,所述根据预设推送规则,将所述预警信号推送至目标用户,可以指的是,基于所述预警信号对应的文件类型,获取对应的目标用户的通讯地址,基于所述通讯地址,向目标用户发送所述预警信号。
对应于上述方法,本申请还公开了一种遗传资源处理的预警方法,参见图2,方法包括:
对目标对象内的资源信息进行监控,判断所述目标对象内是否出现新的资源信息,所述资源信息包括关于遗传资源的目标法规文件,以及行政处罚文件;
获取所述目标对象内新的资源信息时;
采用自然语言处理技术对采集的资源信息的内容进行识别,得到目标字段,基于所述目标字段生成存储文件并进行存储,生成并输出预警信号;
可选的,上述遗传资源处理的预警方法中,判断所述目标对象内是否出现新的资源信息包括:
对所述目标对象中所新增的数据内容进行关键字识别,当所述新增的数据内容命中的关键字数量大于预设值时,表明所述目标对象内出现新的资源信息;
或者是,采用人工智能模型对目标对象中所新增的数据内容的主题字段进行识别,基于识别结果判断被识别的数据内容是否属于所述资源信息,如果属于时,表明所述目标对象内出现新的资源信息。
可选的,上述遗传资源处理的预警方法中,所述采用自然语言处理技术对采集的资源信息的内容进行识别,得到目标字段,包括:
采用分类模型基于采集到的资源信息的内容对所述资源信息进行分类,获取与分类结果相匹配的目标字段列表,基于所述目标字段列表对采集到的资源信息进行数据抓取,基于抓取数据生成与所述目标字段列表相匹配的数据表。
可选的,上述遗传资源处理的预警方法中,还包括:
基于目标系统中存储的遗传资源申报书准备文件对本地存储的遗传资源申报书准备文件监控,所述遗传资源申报书准备文件包括但不限于研究方案文件、知情同意书文件、伦理审查批件文件、国际合作协议文件;
获取并存储更新后的遗传资源申报书准备文件;
当检测到遗传资源申报书准备文件更新时,生成预警信号。
可选的,上述遗传资源处理的预警方法中,还包括:
获取遗传资源采集数据;
将获取到的获取遗传资源采集数据和与其对应的预设遗传资源申报文件各项指标进行比较,判断采集数据与所述申报文件中的申报数据是否一致,如果不一致,生成并输出预警信号。
可选的,上述遗传资源处理的预警方法中,还包括:
当检测到所述遗传资源处理的预警方法中内有预警信号生成时,根据预设推送规则,将所述预警信号推送至目标用户。
为了描述的方便,描述以上系统时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (12)

1.一种遗传资源处理的预警装置,其特征在于,包括:
第一监控模块,用于对目标对象内的资源信息进行监控,判断所述目标对象内是否出现新的资源信息,当所述目标对象内出现新的资源信息时向采集模块输出采集指令,所述资源信息包括关于遗传资源的目标法规文件,以及行政处罚文件;
第一采集模块,用于在获取到所述采集指令时,由所述目标对象内获取所述新的资源信息;
第一识别模块,用于采用自然语言处理技术对所述第一采集模块采集的资源信息的内容进行识别,得到目标字段,基于所述目标字段生成存储文件并进行存储;
第一预警模块,用于当所述第一采集模块更新本地存储内容时,输出预警信号。
2.根据权利要求1所述的遗传资源处理的预警装置,其特征在于,所述第一监控模块判断所述目标对象内是否出现新的资源信息时,具体用于:
对所述目标对象中所新增的数据内容进行关键字识别,当所述新增的数据内容命中的关键字数量大于预设值时,表明所述目标对象内出现新的资源信息;
或者是,采用人工智能模型对目标对象中所新增的数据内容的主题字段进行识别,基于识别结果判断被识别的数据内容是否属于所述资源信息,如果属于时,表明所述目标对象内出现新的资源信息。
3.根据权利要求1所述的遗传资源处理的预警装置,其特征在于,所述第一识别模块在采用自然语言处理技术对所述第一采集模块采集的资源信息+的内容进行识别,得到目标字段时,具体用于:
采用分类模型基于所述第一采集模块采集的资源信息的内容对所述资源信息进行分类,获取与分类结果相匹配的目标字段列表,基于所述目标字段列表对所述第一采集模块采集的资源信息进行数据抓取,基于抓取数据生成与所述目标字段列表相匹配的数据表。
4.根据权利要求1所述的遗传资源处理的预警装置,其特征在于,还包括:
申报资料监控模块,用于目标文档管理系统相连,检测所述目标系统中存储的遗传资源申报书准备文件是否更新,所述遗传资源申报书准备文件包括但不限于研究方案文件、知情同意书文件、伦理审查批件文件、国际合作协议文件;
遗传资源采集模块,用于获取并存储更新后的遗传资源申报书准备文件;
第二预警模块,用于当检测到遗传资源申报书准备文件更新时,生成预警信号。
5.根据权利要求4所述的遗传资源处理的预警装置,其特征在于,还包括:
遗传资源样本采集模块,用于获取遗传资源采集数据;
遗传资源申报文件存储模块,用于将获取到的获取遗传资源采集数据和与其对应的预设遗传资源申报文件各项指标进行比较,判断采集数据与所述申报文件中的申报数据是否一致,如果不一致,向第三预警模块输出触发指令;
第三预警模块,用于获取到触发指令时,生成预警信号。
6.根据权利要求1所述的遗传资源处理的预警装置,其特征在于,还包括:
推送模块,用于当检测到所述遗传资源处理的预警装置内有预警信号生成时,根据预设推送规则,将所述预警信号推送至目标用户。
7.一种遗传资源处理的预警方法,其特征在于,包括:
对目标对象内的资源信息进行监控,判断所述目标对象内是否出现新的资源信息,所述资源信息包括关于遗传资源的目标法规文件,以及行政处罚文件;
获取所述目标对象内新的资源信息时;
采用自然语言处理技术对采集的资源信息的内容进行识别,得到目标字段,基于所述目标字段生成存储文件并进行存储,生成并输出预警信号。
8.根据权利要求7所述的遗传资源处理的预警方法,其特征在于,判断所述目标对象内是否出现新的资源信息包括:
对所述目标对象中所新增的数据内容进行关键字识别,当所述新增的数据内容命中的关键字数量大于预设值时,表明所述目标对象内出现新的资源信息;
或者是,采用人工智能模型对目标对象中所新增的数据内容的主题字段进行识别,基于识别结果判断被识别的数据内容是否属于所述资源信息,如果属于时,表明所述目标对象内出现新的资源信息。
9.根据权利要求7所述的遗传资源处理的预警方法,其特征在于,所述采用自然语言处理技术对采集的资源信息的内容进行识别,得到目标字段,包括:
采用分类模型基于采集到的资源信息的内容对所述资源信息进行分类,获取与分类结果相匹配的目标字段列表,基于所述目标字段列表对采集到的资源信息进行数据抓取,基于抓取数据生成与所述目标字段列表相匹配的数据表。
10.根据权利要求7所述的遗传资源处理的预警方法,其特征在于,还包括:
基于目标系统中存储的遗传资源申报书准备文件对本地存储的遗传资源申报书准备文件监控,所述遗传资源申报书准备文件包括但不限于研究方案文件、知情同意书文件、伦理审查批件文件、国际合作协议文件;
获取并存储更新后的遗传资源申报书准备文件;
当检测到遗传资源申报书准备文件更新时,生成预警信号。
11.根据权利要求10所述的遗传资源处理的预警方法,其特征在于,还包括:
获取遗传资源采集数据;
将获取到的获取遗传资源采集数据和与其对应的预设遗传资源申报文件各项指标进行比较,判断采集数据与所述申报文件中的申报数据是否一致,如果不一致,生成并输出预警信号。
12.根据权利要求7所述的遗传资源处理的预警方法,其特征在于,还包括:
当检测到所述遗传资源处理的预警方法中内有预警信号生成时,根据预设推送规则,将所述预警信号推送至目标用户。
CN202110557535.9A 2021-05-21 2021-05-21 一种遗传资源处理的预警方法和装置 Active CN113643506B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110557535.9A CN113643506B (zh) 2021-05-21 2021-05-21 一种遗传资源处理的预警方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110557535.9A CN113643506B (zh) 2021-05-21 2021-05-21 一种遗传资源处理的预警方法和装置

Publications (2)

Publication Number Publication Date
CN113643506A true CN113643506A (zh) 2021-11-12
CN113643506B CN113643506B (zh) 2022-09-23

Family

ID=78415796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110557535.9A Active CN113643506B (zh) 2021-05-21 2021-05-21 一种遗传资源处理的预警方法和装置

Country Status (1)

Country Link
CN (1) CN113643506B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101436229A (zh) * 2008-10-23 2009-05-20 江汉大学 基于issr分子标记构建中国长豇豆遗传资源数据库的方法及其应用
US20150127378A1 (en) * 2012-02-11 2015-05-07 Yougene Corp. Systems for storing, processing and utilizing proprietary genetic information
CN108563734A (zh) * 2018-04-09 2018-09-21 平安科技(深圳)有限公司 制度信息查询方法、装置、计算机设备和存储介质
CN109636091A (zh) * 2018-10-26 2019-04-16 阿里巴巴集团控股有限公司 一种需求文档风险识别方法及装置
CN110309393A (zh) * 2019-03-28 2019-10-08 平安科技(深圳)有限公司 数据处理方法、装置、设备及可读存储介质
CN111951131A (zh) * 2020-08-25 2020-11-17 杭州科诺知识产权服务有限公司 一种知识产权服务管理平台
CN112232673A (zh) * 2020-10-16 2021-01-15 拜耳医药保健有限公司 用于遗传资源的处理的预警方法、装置、设备和介质
AU2021100820A4 (en) * 2021-02-10 2021-04-22 Dairy Cattle Research Center, Shandong Academy Of Agricultural Science Primer combination and kit for simultaneously detecting 93 bovine genetic defect genes and lethal haplotypes

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101436229A (zh) * 2008-10-23 2009-05-20 江汉大学 基于issr分子标记构建中国长豇豆遗传资源数据库的方法及其应用
US20150127378A1 (en) * 2012-02-11 2015-05-07 Yougene Corp. Systems for storing, processing and utilizing proprietary genetic information
CN108563734A (zh) * 2018-04-09 2018-09-21 平安科技(深圳)有限公司 制度信息查询方法、装置、计算机设备和存储介质
CN109636091A (zh) * 2018-10-26 2019-04-16 阿里巴巴集团控股有限公司 一种需求文档风险识别方法及装置
CN110309393A (zh) * 2019-03-28 2019-10-08 平安科技(深圳)有限公司 数据处理方法、装置、设备及可读存储介质
CN111951131A (zh) * 2020-08-25 2020-11-17 杭州科诺知识产权服务有限公司 一种知识产权服务管理平台
CN112232673A (zh) * 2020-10-16 2021-01-15 拜耳医药保健有限公司 用于遗传资源的处理的预警方法、装置、设备和介质
AU2021100820A4 (en) * 2021-02-10 2021-04-22 Dairy Cattle Research Center, Shandong Academy Of Agricultural Science Primer combination and kit for simultaneously detecting 93 bovine genetic defect genes and lethal haplotypes

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王玥: "新技术条件下我国人类遗传资源安全的法律保障研究", 《上海政法学院学报》 *

Also Published As

Publication number Publication date
CN113643506B (zh) 2022-09-23

Similar Documents

Publication Publication Date Title
CN111899878B (zh) 老年人健康检测系统、方法、计算机设备及可读存储介质
CN105809035B (zh) 基于安卓应用实时行为的恶意软件检测方法和系统
Shany et al. Are we stumbling in our quest to find the best predictor? Over‐optimism in sensor‐based models for predicting falls in older adults
Fan et al. Exploiting Multiple Optimizers with Transfer Learning Techniques for the Identification of COVID‐19 Patients
CN106372572A (zh) 监控方法和装置
CN113299401B (zh) 传染病数据的传播监测方法、装置、计算机设备及介质
US20170300582A1 (en) Event identification through analysis of social-media postings
Lee et al. Prediction of impending mood episode recurrence using real-time digital phenotypes in major depression and bipolar disorders in South Korea: a prospective nationwide cohort study
Moura et al. Epilepsy among elderly Medicare beneficiaries: a validated approach to identify prevalent and incident epilepsy
CN111402971A (zh) 一种基于大数据的药物不良反应快速识别方法及系统
CN113643506B (zh) 一种遗传资源处理的预警方法和装置
CN115862897B (zh) 一种基于临床数据的症候群监测方法及系统
CN112289458A (zh) 一种面向大数据的潜在药物不良反应数据挖掘系统及方法
CN111008275A (zh) 数据挖掘方法及装置、存储介质及电子终端
CN114389875A (zh) 一种人机行为检测方法、系统、设备及介质
CN111368694A (zh) 一种卡口检查方法及电子设备
Hakala Classification of patients with depression and healthy controls based on behavioural patterns acquired from smartphone sensor data
CN115544541B (zh) 目标对象行为数据的处理方法、设备及存储介质
Mutinda et al. Blood biochemical reference intervals for free-ranging olive baboons (Papio anubis) in Kenya
CN114205215B (zh) 一种数据预分析方法及装置
Muñoz et al. Automatic detection of epileptic waves in electroencephalograms using bag of visual words and machine learning
Silva et al. Identification of patterns of fatal injuries in humans through big data
Hu et al. Three-level Sleep Stage Classification Based on Wrist-worn Accelerometry Data Alone
CN114400081A (zh) 一种医疗资源管理方法与系统
Morobe et al. Data for Human rhinovirus spatial-temporal epidemiology in rural coastal Kenya, 2015-2016, observed through outpatient surveillance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240119

Address after: 102600 No.7, Rongjing East Street, Beijing Economic and Technological Development Zone, Daxing District, Beijing

Patentee after: BAYER HEALTHCARE LLC

Address before: 102629 Room 101, floor 1, building 12-3, yard 26, Yongwang West Road, Daxing biomedical industry base, Zhongguancun Science Park, Daxing District, Beijing

Patentee before: BEIJING DEEP INTELLIGENT PHARMA TECHNOLOGY Co.,Ltd.