CN111223537A - 分布式云样本管理方法及系统 - Google Patents

分布式云样本管理方法及系统 Download PDF

Info

Publication number
CN111223537A
CN111223537A CN202010037816.7A CN202010037816A CN111223537A CN 111223537 A CN111223537 A CN 111223537A CN 202010037816 A CN202010037816 A CN 202010037816A CN 111223537 A CN111223537 A CN 111223537A
Authority
CN
China
Prior art keywords
sample
information
user terminal
request
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010037816.7A
Other languages
English (en)
Other versions
CN111223537B (zh
Inventor
杨光
曹毓琳
滕睿頔
白志惠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tangyihuikang Biomedical Technology Co Ltd
Original Assignee
Beijing Tangyihuikang Biomedical Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tangyihuikang Biomedical Technology Co Ltd filed Critical Beijing Tangyihuikang Biomedical Technology Co Ltd
Priority to CN202010037816.7A priority Critical patent/CN111223537B/zh
Publication of CN111223537A publication Critical patent/CN111223537A/zh
Application granted granted Critical
Publication of CN111223537B publication Critical patent/CN111223537B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/604Tools and structures for managing or administering access control systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2141Access rights, e.g. capability lists, access control lists, access tables, access matrices

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioethics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Epidemiology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Automation & Control Theory (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种分布式云样本管理方法及系统,能根据多重标签对样本进行多级分类,查找时根据标签逐级查找、缩小范围,然后利用根据特征指标生成的特征标签在最小分类级别的列表中进行精确查找,可有效提高降低查找的工作量、提高查找精度;根据创建样本的用户的授权情况选择性地发送属性信息给发起请求的用户终端,可有效保护捐赠者/采集者的隐私。另外,通过定期更新样本的复核信息、及时确认样本的特征指标的稳定情况,以确保查找到的目标样本与其登记信息一致。该方法适用于各种生物信息数据库、生物样品保藏中心以及细胞或器官捐献数据库等,设计合理、使用便捷,既能保护样品提供者的权益、又能满足样品请求者的需求。

Description

分布式云样本管理方法及系统
技术领域
本发明属于样本管理技术领域,特别涉及一种分布式云样本管理方法及系统。
背景技术
目前对于各种生物信息数据库、生物样品保藏中心以及细胞或器官捐献数据库等海量样品的管理平台而言,查找样品时往往是通过一个或数个标签作为关键词同时进行匹配,由于样品信息的数据过于庞大,在查找过程中需要耗费大量的时间和算力,对于计算机等设备而言大量的计算也会造成严重负荷,因此需要提供一种更加精简、能有效缩小范围、降低运算量的查找方法。另外,除细胞或器官捐献数据库以外,其余数据中所有与样品相关的信息均是公开的,对于隐私的管理尚不够完备。再者,很多数据库中的样本信息是永久性的、除非提供者主动进行修改,而生物样品经过长时间的保存后,不具有遗传活性的样品(蛋白质或其他代谢产物)的理化性质可能发生变化、导致其生理活性与保存初期存在差异,而具有遗传活性的样品(动植物细胞、微生物菌种等)由于仍然需要定期培养活化、遗传特性可能发生变异,如果不强制进行生理活性和遗传稳定性的复检,很难保证样品特性与其登记信息始终相符,从而会严重影响数据库的可靠性。
发明内容
为了解决上述技术问题,本发明提供了一种分布式云样本管理及数据处理方法。
本发明具体技术方案如下:
本发明一方面提供了一种分布式云样本管理,包括如下步骤:
录入样本信息的用户终端分别为每个待录入的样本创建一个项目,并在所述项目中写入样本的若干项属性信息以及至少两个用于对所述样本进行分类的分类标签,由云管理平台按照所述分类标签的层次将所有所述项目进行至少两级分类,得到至少两个级别的列表,且最小分类级别的列表中每个所述样本的所述属性信息的类目均相同;
请求查找目标样本的用户终端向所述云管理平台提交至少一个目标样本的索取请求,所述索取请求中包含所述目标样本的至少两项属性信息以及至少两个所述分类标签;所述云管理平台根据所述分类标签在所有所述样本中按照分类情况逐级查找、找到最小分类级别的列表,并根据所述属性信息查找所述目标样本;当存在所述目标样本时,所述云管理平台通知创建该项目的用户终端,获得所述创建该项目的用户终端的授权后、根据授权范围将所述目标样本对应的项目中的信息发送给发起请求的所述用户终端。
本发明另一方面提供了一种分布式云样本管理系统,其特征在于,包括云管理平台,所述云管理平台包括创建部、管理部和查找部,所述创建部被配置为:
根据用户终端的请求,为每个待录入的样本创建一个项目,并将所述用户终端录入的所述样本的若干项属性信息以及至少两个用于对所述样本进行分类的分类标签写入所述项目中;
所述查找部被配置为:
获取请求查找目标样本的用户终端的至少一个索取请求,所述索取请求中包含所述目标样本的至少两项属性信息以及至少两个所述分类标签;
根据所述索取请求中的所述分类标签在所有所述样本中按照分类情况主机查找,找到最小分类级别的列表,并根据所述属性信息查找所述目标样本;
所述管理部被配置为:
根据写入所述项目中的所述分类标签的层次将所有所述项目进行至少两级分类,得到至少两个级别的列表,且最小分类级别的列表中每个所述样本的所述属性信息的类目均相同;
当所述查找部查找到所述目标样本时,通知创建该项目的用户终端,获得所述创建该项目的用户终端的授权后、根据授权范围将所述目标样本对应的项目中的信息发送给发起请求的所述用户终端。
本发明的有益效果如下:本发明提供了一种分布式云样本管理方法及运行该方法的系统,能根据多重标签对样本进行多级分类,查找时根据标签逐级查找、缩小范围,然后利用根据特征指标生成的特征标签在最小分类级别的列表中进行精确查找。通过上述方式,可有效提高降低查找的工作量、提高查找精度;同时,将属性信息分为保密信息和开放信息,根据创建样本的用户的授权情况选择性地发送给发起请求的用户终端,可有效保护捐赠者/采集者以及录入者的隐私。另外,该方法中还设置了复核环节,通过定期更新样本的复核信息、及时确认样本的特征指标的稳定情况,以确保查找到的目标样本与其登记信息一致,使发起请求的用户能获得所需的资源。该方法适用于各种生物信息数据库、生物样品保藏中心以及细胞或器官捐献数据库等,设计合理、使用便捷,既能保护样品提供者的权益、又能满足样品请求者的需求。
附图说明
图1为实施例1所述的一种分布式云样本管理方法的流程图;
图2为实施例2所述的一种分布式云样本系统的结构示意图。
具体实施方式
下面结合附图和以下实施例对本发明作进一步详细说明。
实施例1
如图1所示,本发明实施例1提供了一种分布式云样本管理方法,包括如下步骤:
录入样本信息的用户终端分别为每个待录入的样本创建一个项目,并在项目中写入样本的多个属性信息以及来源(具体的生物体名称;捐献或采集)、样本类别(可用于科研用途的人体血液或细胞样品;动植物细胞或组织样品;微生物菌种;细胞分泌物、核酸、蛋白质样品等)、采集地点、采集时间等用于对样本进行分类的分类标签,由云管理平台按照分类标签的层次将所有项目进行至少两级分类(例如,首先根据样本类别对所有项目进行分类、创建多个第一列表,然后根据样本来源对分别对每个第一列表中的项目进行分类、创建多个第二列表,之后还可再根据采集地点在每个第二列表内部进行分类、创建多个第三列表;标签的层次可根据情况进行调整,分类方式也随之变化),得到至少两个级别的列表,且最小分类级别的列表(例如本实施例中的第三列表)中每个样本的属性信息的类目(例如该第三列表是X植物-Y蛋白-Z市,其属性信息的类目为a片段+b片段+q片段)均相同;
请求查找目标样本的用户终端向云管理平台提交至少一个目标样本的索取请求,索取请求中包含目标样本的至少两项属性信息(例如a片段+q片段)以及至少两个分类标签(例如X植物-Y蛋白);云管理平台根据分类标签在所有样本中按照分类情况逐级查找(先找X植物的第一列表、再找X植物-Y蛋白的第二列表)、找到最小分类级别的列表(可以由多个,例如X植物-Y蛋白-Z市、X植物-Y蛋白-C市、X植物-Y蛋白-F市),并根据属性信息查找目标样本;当存在目标样本(可以是多个)时,云管理平台通知创建该项目的用户终端,获得创建该项目的用户终端的授权后、根据授权范围将所有目标样本对应的项目中的信息发送给发起请求的用户终端。
在一些实施例中,属性信息包括样本的信息源(捐赠者/采集者以及录入者的身份信息)和至少两项特征指标,索取请求中的属性信息为特征指标;录入样本的用户终端在项目中写入样本的属性信息以及分类标签后,由云管理平台设置信息公开级别,信息源为保密信息,特征指标为开放信息,云管理平台在最小分类级别的列表(即第三列表)中根据特征指标查找目标样本;当存在目标样本时,云管理平台将目标样本对应的开放信息发送给发起请求的用户终端,同时根据创建目标样本的用户终端的授权范围、确定是否将保密信息一并发送。
在一些实施例中,云管理平台对项目进行分类后,还包括如下步骤:
在每个最小分类级别的列表中,根据样本的特征指标分别为每个项目赋予一个唯一的特征标签,特征标签包括若干字段,每个字段包含且仅包含一项特征指标,并且所有字段按照特征指标类目的顺序进行排列;每个最小分类级别的列表分别按照一个唯一的编写规则编制特征标签(例如,上述实施例的编写规则为a片段(名称+特征序列)+q片段(名称+特征序列)+b片段(名称+特征序列))。
此时,在最小分类级别的列表中根据属性信息查找样本的方法如下:
云管理平台根据索取请求中提交的特征指标,按照查找到的最小分类级别的列表中字段的编写规则以及特征指标类目的顺序,编制一个请求标签(例如a片段(名称+特征序列)+q片段(名称+特征序列)+b片段的空缺字段(用其他字符代替,例如用0占位)),并与最小分类级别的列表中所有项目的特征标签进行比对,查找重合率超过预设阈值(根据样品类别和属性信息进行设置,特征指标类目越多、这一阈值可相应降低,例如特征指标为3个时、该阈值为66.7%,而当特征指标为10个时,该阈值为50%)的特征标签,并将特征标签对应的样本作为目标样本。
在一些实施例中,录入样本的用户终端在项目中写入样本的属性信息以及分类标签后,还包括如下步骤:
用户终端定期向项目中写入样本的复核信息(定期对样本进行重检,检验样品的生物活性、遗传稳定性等指标,并将重检的结果按照项目原有的格式进行填写),云管理平台对复核信息进行审核(审核是否缺少项目,或是否有与原信息严重不符之处,例如某指标从阳性变成阴性),审核通过则保留在原有的最小分类级别的列表中,同时根据复核信息重新生成特征标签;审核不通过或逾期未收到复核信息则标记为异常,并将项目从最小分类级别的列表中移除。
当存在目标样本时,如果距离上次写入复核信息的时间不超过预设的时间阈值(根据样品类别和属性信息进行设置,样品来源的生物生理结构复杂程度越高、这一阈值可相应延长,例如细菌菌种的该阈值为90d,人体细胞的该阈值可以为180d),则直接将目标样本对应的项目中的信息发送给发起请求的用户终端;如超过时间阈值,此时样本的各项指标可能发生变化、不再符合发起请求的用户终端的要求,此时云管理平台应首先通知创建该项目的用户终端写入最新的复核信息、并对复核信息进行审核,审核通过后重新生成特征标签、并与请求标签进行比对,比对成功则将目标样本的对应的项目中的信息发送给发起请求的用户终端,比对失败则重新根据索取请求进行查找。
本实施例提供了一种分布式云样本管理方法,能根据多重标签对样本进行多级分类,查找时根据标签逐级查找、缩小范围,然后利用根据特征指标生成的特征标签在最小分类级别的列表中进行精确查找。通过上述方式,可有效提高降低查找的工作量、提高查找精度;同时,将属性信息分为保密信息和开放信息,根据创建样本的用户的授权情况选择性地发送给发起请求的用户终端,可有效保护捐赠者/采集者以及录入者的隐私。另外,该方法中还设置了复核环节,通过定期更新样本的复核信息、及时确认样本的特征指标的稳定情况,以确保查找到的目标样本与其登记信息一致,使发起请求的用户能获得所需的资源。该方法适用于各种生物信息数据库、生物样品保藏中心以及细胞或器官捐献数据库等,设计合理、使用便捷,既能保护样品提供者的权益、又能满足样品请求者的需求。
实施例2
如图2所示,本发明实施例2提供了一种运行实施例1方法的分布式云样本管理系统,包括云管理平台,云管理平台包括创建部1、管理部2和查找部3,其中创建部1被配置为:
根据用户终端的请求,为每个待录入的样本创建一个项目,并将用户终端录入的样本的若干项属性信息以及至少两个用于对样本进行分类的分类标签写入项目中;
查找部3被配置为:
获取请求查找目标样本的用户终端的至少一个索取请求,索取请求中包含目标样本的至少两项属性信息以及至少两个分类标签;
根据索取请求中的分类标签在所有样本中按照分类情况主机查找,找到最小分类级别的列表,并根据属性信息查找目标样本;
管理部2被配置为:
根据写入项目中的分类标签的层次将所有项目进行至少两级分类,得到至少两个级别的列表,且最小分类级别的列表中每个样本的属性信息的类目均相同;
当查找部3查找到目标样本时,通知创建该项目的用户终端,获得创建该项目的用户终端的授权后、根据授权范围将目标样本对应的项目中的信息发送给发起请求的用户终端。
在一些实施例中,属性信息包括样本的信息源和至少两项特征指标,索取请求中的属性信息为特征指标;此时,创建部1还被配置为:
为属性信息设置信息公开级别,信息源为保密信息,特征指标为开放信息;
查找部3还被配置为:
在最小分类级别的列表中根据特征指标查找目标样本;
管理部2还被配置为:
当查找部3查找到目标样本时,将目标样本对应的开放信息发送给发起请求的用户终端,同时根据创建目标样本的用户终端的授权范围、确定是否将保密信息一并发送。
在一些实施例中,创建部1还被配置为:
在每个最小分类级别的列表中,根据样本的特征指标分别为每个项目赋予一个唯一的特征标签,特征标签包括若干字段,每个字段包含且仅包含一项特征指标,并且所有字段按照特征指标类目的顺序进行排列;每个最小分类级别的列表分别按照一个唯一的编写规则编制特征标签;
此时,查找部3还被配置为:
根据索取请求中提交的特征指标,按照查找到的最小分类级别的列表中字段的编写规则以及特征指标类目的顺序,编制一个请求标签,并与最小分类级别的列表中所有项目的特征标签进行比对,查找重合率超过预设阈值的特征标签,并将特征标签对应的样本作为目标样本。
在一些实施例中,创建部1还被配置为:
接收用户终端定期发送的样本的复核信息、写入项目中,并由管理部2对复核信息进行审核,审核通过则将项目保留在原有的最小分类级别的列表中,同时由创建部1根据复核信息重新生成特征标签;审核不通过或逾期未收到复核信息则标记为异常,并将项目从最小分类级别的列表中移除;
管理部2还被配置为:
对写入项目中的复核信息进行审核;
当查找部3查找到目标样本时,对目标样本的复核信息的有效性进行判断,如果距离上次写入复核信息的时间不超过预设的时间阈值,则直接将目标样本对应的项目中的信息发送给发起请求的用户终端;如超过时间阈值,则通知创建该项目的用户终端写入最新的复核信息、并对复核信息进行审核;审核通过后根据创建部1重新生成的特征标签、与请求标签进行比对,比对成功则将目标样本的对应的项目中的信息发送给发起请求的用户终端,比对失败则通知查找部3重新根据索取请求进行查找。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种分布式云样本管理方法,其特征在于,包括如下步骤:
录入样本信息的用户终端分别为每个待录入的样本创建一个项目,并在所述项目中写入样本的若干项属性信息以及至少两个用于对所述样本进行分类的分类标签,由云管理平台按照所述分类标签的层次将所有所述项目进行至少两级分类,得到至少两个级别的列表,且最小分类级别的列表中每个所述样本的所述属性信息的类目均相同;
请求查找目标样本的用户终端向所述云管理平台提交至少一个目标样本的索取请求,所述索取请求中包含所述目标样本的至少两项属性信息以及至少两个所述分类标签;所述云管理平台根据所述分类标签在所有所述样本中按照分类情况逐级查找、找到最小分类级别的列表,并根据所述属性信息查找所述目标样本;当存在所述目标样本时,所述云管理平台通知创建该项目的用户终端,获得所述创建该项目的用户终端的授权后、根据授权范围将所述目标样本对应的项目中的信息发送给发起请求的所述用户终端。
2.如权利要求1所述的分布式云样本管理方法,其特征在于,所述属性信息包括所述样本的信息源和至少两项特征指标,所述索取请求中的所述属性信息为所述特征指标;所述录入样本的用户终端在所述项目中写入所述样本的属性信息以及所述分类标签后,由所述云管理平台设置信息公开级别,所述信息源为保密信息,所述特征指标为开放信息,所述云管理平台在所述最小分类级别的列表中根据所述特征指标查找所述目标样本;当存在所述目标样本时,所述云管理平台将所述目标样本对应的所述开放信息发送给发起请求的所述用户终端,同时根据创建所述目标样本的用户终端的授权范围、确定是否将所述保密信息一并发送。
3.如权利要求2所述的分布式云样本管理方法,其特征在于,所述云管理平台对所述项目进行分类后,还包括如下步骤:
在每个最小分类级别的列表中,根据所述样本的所述特征指标分别为每个所述项目赋予一个唯一的特征标签,所述特征标签包括若干字段,每个所述字段包含且仅包含一项所述特征指标,并且所有所述字段按照所述特征指标类目的顺序进行排列;每个所述最小分类级别的列表分别按照一个唯一的编写规则编制特征标签。
4.如权利要求3所述的分布式云样本管理方法,其特征在于,在所述最小分类级别的列表中根据所述属性信息查找所述样本的方法如下:所述云管理平台根据所述索取请求中提交的所述特征指标,按照查找到的所述最小分类级别的列表中字段的编写规则以及所述特征指标类目的顺序,编制一个请求标签,并与所述最小分类级别的列表中所有所述项目的所述特征标签进行比对,查找重合率超过预设阈值的所述特征标签,并将所述特征标签对应的样本作为所述目标样本。
5.如权利要求3所述的分布式云样本管理方法,其特征在于,所述录入样本的用户终端在所述项目中写入所述样本的属性信息以及所述分类标签后,还包括如下步骤:
所述用户终端定期向所述项目中写入所述样本的复核信息,所述云管理平台对所述复核信息进行审核,审核通过则保留在原有的所述最小分类级别的列表中,同时根据所述复核信息重新生成特征标签;审核不通过或逾期未收到所述复核信息则标记为异常,并将所述项目从所述最小分类级别的列表中移除。
6.如权利要求5所述的分布式云样本管理方法,其特征在于,当存在所述目标样本时,如果距离上次写入所述复核信息的时间不超过预设的时间阈值,则直接将所述目标样本对应的项目中的信息发送给发起请求的用户终端;如超过所述时间阈值,则所述云管理平台通知创建该项目的用户终端写入最新的复核信息、并对所述复核信息进行审核,审核通过后重新生成特征标签、并与所述请求标签进行比对,比对成功则将所述目标样本的对应的项目中的信息发送给发起请求的用户终端,比对失败则重新根据所述索取请求进行查找。
7.一种运行权利要求1~6中任一项所述方法的分布式云样本管理系统,其特征在于,包括云管理平台,所述云管理平台包括创建部(1)、管理部(2)和查找部(3),所述创建部(1)被配置为:
根据用户终端的请求,为每个待录入的样本创建一个项目,并将所述用户终端录入的所述样本的若干项属性信息以及至少两个用于对所述样本进行分类的分类标签写入所述项目中;
所述查找部(3)被配置为:
获取请求查找目标样本的用户终端的至少一个索取请求,所述索取请求中包含所述目标样本的至少两项属性信息以及至少两个所述分类标签;
根据所述索取请求中的所述分类标签在所有所述样本中按照分类情况主机查找,找到最小分类级别的列表,并根据所述属性信息查找所述目标样本;
所述管理部(2)被配置为:
根据写入所述项目中的所述分类标签的层次将所有所述项目进行至少两级分类,得到至少两个级别的列表,且最小分类级别的列表中每个所述样本的所述属性信息的类目均相同;
当所述查找部(3)查找到所述目标样本时,通知创建该项目的用户终端,获得所述创建该项目的用户终端的授权后、根据授权范围将所述目标样本对应的项目中的信息发送给发起请求的所述用户终端。
8.如权利要求7所述的系统,其特征在于,所述属性信息包括所述样本的信息源和至少两项特征指标,所述索取请求中的所述属性信息为所述特征指标;此时,所述创建部(1)还被配置为:
为所述属性信息设置信息公开级别,所述信息源为保密信息,所述特征指标为开放信息;
所述查找部(3)还被配置为:
在所述最小分类级别的列表中根据所述特征指标查找所述目标样本;
所述管理部(2)还被配置为:
当所述查找部(3)查找到所述目标样本时,将所述目标样本对应的所述开放信息发送给发起请求的所述用户终端,同时根据创建所述目标样本的用户终端的授权范围、确定是否将所述保密信息一并发送。
9.如权利要求8所述的系统,其特征在于,所述创建部(1)还被配置为:
在每个最小分类级别的列表中,根据所述样本的所述特征指标分别为每个所述项目赋予一个唯一的特征标签,所述特征标签包括若干字段,每个所述字段包含且仅包含一项所述特征指标,并且所有所述字段按照所述特征指标类目的顺序进行排列;每个所述最小分类级别的列表分别按照一个唯一的编写规则编制特征标签;
此时,所述查找部(3)还被配置为:
根据所述索取请求中提交的所述特征指标,按照查找到的所述最小分类级别的列表中字段的编写规则以及所述特征指标类目的顺序,编制一个请求标签,并与所述最小分类级别的列表中所有所述项目的所述特征标签进行比对,查找重合率超过预设阈值的所述特征标签,并将所述特征标签对应的样本作为所述目标样本。
10.如权利要求10所述的系统,其特征在于,所述创建部(1)还被配置为:
接收所述用户终端定期发送的所述样本的复核信息、写入所述项目中,并由所述管理部(2)对所述复核信息进行审核,审核通过则将所述项目保留在原有的所述最小分类级别的列表中,同时由所述创建部(1)根据所述复核信息重新生成特征标签;审核不通过或逾期未收到所述复核信息则标记为异常,并将所述项目从所述最小分类级别的列表中移除;
所述管理部(2)还被配置为:
对写入所述项目中的所述复核信息进行审核;
当所述查找部(3)查找到所述目标样本时,对所述目标样本的复核信息的有效性进行判断,如果距离上次写入所述复核信息的时间不超过预设的时间阈值,则直接将所述目标样本对应的项目中的信息发送给发起请求的用户终端;如超过所述时间阈值,则通知创建该项目的用户终端写入最新的复核信息、并对所述复核信息进行审核;审核通过后根据所述创建部(1)重新生成的特征标签、与所述请求标签进行比对,比对成功则将所述目标样本的对应的项目中的信息发送给发起请求的用户终端,比对失败则通知所述查找部(3)重新根据所述索取请求进行查找。
CN202010037816.7A 2020-01-14 2020-01-14 分布式云样本管理方法及系统 Active CN111223537B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010037816.7A CN111223537B (zh) 2020-01-14 2020-01-14 分布式云样本管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010037816.7A CN111223537B (zh) 2020-01-14 2020-01-14 分布式云样本管理方法及系统

Publications (2)

Publication Number Publication Date
CN111223537A true CN111223537A (zh) 2020-06-02
CN111223537B CN111223537B (zh) 2023-06-06

Family

ID=70832320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010037816.7A Active CN111223537B (zh) 2020-01-14 2020-01-14 分布式云样本管理方法及系统

Country Status (1)

Country Link
CN (1) CN111223537B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111932166A (zh) * 2020-06-17 2020-11-13 戴纳智慧医疗科技有限公司 一种对样本转送物流信息的智能管理方法
CN112100454A (zh) * 2020-08-17 2020-12-18 百度在线网络技术(北京)有限公司 搜索方法、装置、电子设备和可读存储介质
CN116866312A (zh) * 2023-08-31 2023-10-10 济南中意维尔科技有限公司 一种粮谷检疫检验样品自动查找系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1659562A (zh) * 2002-04-12 2005-08-24 贝克顿·迪金森公司 用于收集、存储、呈现和分析免疫数据并且其远程站通过网络与疫苗和疾病数据库通信的系统
US20160224731A1 (en) * 2015-01-29 2016-08-04 Medexy Llc Method and system for aggregating health records
CN107016520A (zh) * 2017-04-10 2017-08-04 天津大学 基于合成生物学样本实体库的信息处理系统及方法
CN107533586A (zh) * 2015-03-23 2018-01-02 私有通道公司 用于加强生物信息学数据隐私和实现生物信息学数据广泛共享的系统、方法和设备
CN107610783A (zh) * 2017-09-11 2018-01-19 首都医科大学附属北京天坛医院 一种脑肿瘤信息平台
CN107682353A (zh) * 2017-10-25 2018-02-09 西安邮电大学 一种电子医疗云中的健康档案访问控制系统及方法
CN108011712A (zh) * 2017-11-13 2018-05-08 佛山科学技术学院 一种移动医疗系统隐私数据通信方法
CN109284353A (zh) * 2018-09-10 2019-01-29 平安科技(深圳)有限公司 医案检索方法、装置、计算机设备和存储介质
CN110148475A (zh) * 2019-04-03 2019-08-20 平安科技(深圳)有限公司 一种医疗信息共享方法、装置、可读存储介质及服务器
US20190371443A1 (en) * 2018-05-31 2019-12-05 Perthera, Inc. Outcome driven persona-typing for precision oncology

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1659562A (zh) * 2002-04-12 2005-08-24 贝克顿·迪金森公司 用于收集、存储、呈现和分析免疫数据并且其远程站通过网络与疫苗和疾病数据库通信的系统
US20160224731A1 (en) * 2015-01-29 2016-08-04 Medexy Llc Method and system for aggregating health records
CN107533586A (zh) * 2015-03-23 2018-01-02 私有通道公司 用于加强生物信息学数据隐私和实现生物信息学数据广泛共享的系统、方法和设备
CN107016520A (zh) * 2017-04-10 2017-08-04 天津大学 基于合成生物学样本实体库的信息处理系统及方法
CN107610783A (zh) * 2017-09-11 2018-01-19 首都医科大学附属北京天坛医院 一种脑肿瘤信息平台
CN107682353A (zh) * 2017-10-25 2018-02-09 西安邮电大学 一种电子医疗云中的健康档案访问控制系统及方法
CN108011712A (zh) * 2017-11-13 2018-05-08 佛山科学技术学院 一种移动医疗系统隐私数据通信方法
US20190371443A1 (en) * 2018-05-31 2019-12-05 Perthera, Inc. Outcome driven persona-typing for precision oncology
CN109284353A (zh) * 2018-09-10 2019-01-29 平安科技(深圳)有限公司 医案检索方法、装置、计算机设备和存储介质
CN110148475A (zh) * 2019-04-03 2019-08-20 平安科技(深圳)有限公司 一种医疗信息共享方法、装置、可读存储介质及服务器

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
S KRISHNAN,等: "An efficient Elman neural network classifier with cloud supported internet of things structure for health monitoring system", 《COMPUTER NETWORK》 *
曹曼曼,等: "关于分布式数据库准确分类仿真研究", 《计算机仿真》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111932166A (zh) * 2020-06-17 2020-11-13 戴纳智慧医疗科技有限公司 一种对样本转送物流信息的智能管理方法
CN112100454A (zh) * 2020-08-17 2020-12-18 百度在线网络技术(北京)有限公司 搜索方法、装置、电子设备和可读存储介质
CN116866312A (zh) * 2023-08-31 2023-10-10 济南中意维尔科技有限公司 一种粮谷检疫检验样品自动查找系统
CN116866312B (zh) * 2023-08-31 2023-11-17 济南中意维尔科技有限公司 一种粮谷检疫检验样品自动查找系统

Also Published As

Publication number Publication date
CN111223537B (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
US10783168B2 (en) Systems and methods for probabilistic data classification
US10025904B2 (en) Systems and methods for managing a master patient index including duplicate record detection
CN111223537A (zh) 分布式云样本管理方法及系统
Gardner et al. HIDE: an integrated system for health information DE-identification
US10572461B2 (en) Systems and methods for managing a master patient index including duplicate record detection
CN102947832A (zh) 患者记录的身份匹配
CN1629826A (zh) 存储系统中的数据保持方法及装置
Deselaers et al. Automatic medical image annotation in ImageCLEF 2007: Overview, results, and discussion
CN111813905A (zh) 语料生成方法、装置、计算机设备及存储介质
CN112132624A (zh) 医疗理赔数据预测系统
CN110991530A (zh) 缺失数据处理方法及装置、电子设备和存储介质
Gómez‐Núñez et al. Updating the SCI mago journal and country rank classification: A new approach using W ard's clustering and alternative combination of citation measures
US11914621B2 (en) Determining an association metric for record attributes associated with cardinalities that are not necessarily the same for training and applying an entity resolution model
WO2023164601A1 (en) Converting tabular demographic information into an export entity file
WO2023164599A1 (en) A fault tolerant method for processing data with human intervention
US20200104046A1 (en) Opportunistic data content discovery scans of a data repository
Ebrahimi et al. Analysis of Persian Bioinformatics Research with Topic Modeling
CN113849520B (zh) 异常sql的智能识别方法、装置、电子设备及存储介质
WO2018220688A1 (ja) 辞書生成装置、辞書生成方法、及びプログラム
Falter et al. Using natural language processing for automated classification of disease and to identify misclassified ICD codes in cardiac disease
Azman Efficient identity matching using static pruning q-gram indexing approach
CN117009439B (zh) 数据处理方法、装置、电子设备及存储介质
Le Mignot et al. Avoiding doubles in distributed nominative medical databases: optimization of the Needleman and Wunsch algorithm
Palacio et al. Infoxication in the Genomic Data Era and Implications in the Development of Information Systems
WO2022129605A1 (en) Method of processing data from a data source, apparatus and computer program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant