CN116648701A - 医学样本数据和/或样本数据库的搜索查询处理方法和搜索平台设备 - Google Patents

医学样本数据和/或样本数据库的搜索查询处理方法和搜索平台设备 Download PDF

Info

Publication number
CN116648701A
CN116648701A CN202080107876.XA CN202080107876A CN116648701A CN 116648701 A CN116648701 A CN 116648701A CN 202080107876 A CN202080107876 A CN 202080107876A CN 116648701 A CN116648701 A CN 116648701A
Authority
CN
China
Prior art keywords
data
search
samples
sample
avatar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080107876.XA
Other languages
English (en)
Inventor
海科·齐默尔曼
安德烈亚斯·库尔茨
安东尼·富尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Universitaet des Saarlandes
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Universitaet des Saarlandes
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV, Universitaet des Saarlandes filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN116648701A publication Critical patent/CN116648701A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pathology (AREA)
  • Bioethics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

一种用于处理对包含多个人的医学样本数据和/或样本的数据库的搜索查询的方法,包括以下步骤:向AI处理器装置中输入包含需求概述的搜索查询,旨在找到至少一个包含具有预定的查询搜索参数的样本数据的样本;利用所述AI处理器装置搜索至少一个选定的样本,其中,所述至少一个选定的样本至少以规定的概率满足所述需求概述;以及输出所述至少一个选定的样本的识别数据。还提供了一种搜索平台设备,其被配置用于处理发送给包含多个人的医学样本数据和/或样本的数据库的搜索查询。

Description

医学样本数据和/或样本数据库的搜索查询处理方法和搜索 平台设备
技术领域
本发明涉及一种用于处理对数据库的搜索查询的方法和一种搜索平台设备,该数据库包含来自许多人(尤其是患者)的医学样本数据和/或样本。本发明尤其是涉及用于构建智能的自动学习平台的应用的方法以及设备,其一方面在数据库(例如实验室、生物库和/或诊所)和其样本数据和/或样本存储在数据库中的人、以及另一方面研究实体(如制药行业和(生物)医学研究机构)之间提供多方向的中介服务。例如在运行包含许多人的样本数据和/或样本的数据库时,和/或在尤其是通过机器学习和/或人工智能(AI)处理搜索查询时,存在本发明的许多应用场合。
背景技术
在进行调查时,例如出于研究或研学的目的,感兴趣的研究实体(单位),像是例如制药行业的公司和/或(生物)医学研究机构,依赖于来自受试者群体的样本和数据。受试者群体包括针对某些研究具有特定特征(参数)的受试者,像是例如具有某种特定的、共同的疾病状况和/或特定的基因共同点。
来自潜在适合纳入某个群体的受试者的样本和数据存在于医学实验室设施和/或生物库中。然而迄今为止,对于寻找受试者的实体来说,彻底搜索大量的医学实验室和生物库中所需的数据和患者是非常耗时费力的。此外还存在法律限制:未经授权,实体不得访问或使用个人数据,例如患者的个人数据。
商业运作的医学实验室和生物库对将其拥有的样本和数据出售给提出查询的研究机构有着浓厚的兴趣。然而,对于某些样本的销售,需要对样本材料进行基因测序,因为只有这样,研究机构才能确定相应样本与自身研究的相关性。然而,完整的基因测序对于各个实验室或生物库来说成本高且耗时。因此,只有当相应的样本也能引起研究的兴趣,进行基因全测序才是值得的。
因此,人们对一种能够预测的工具感兴趣,该工具可以帮助拥有这些样本和数据的机构确定,哪些样本值得昂贵的测序或其他方式的样本处理。
众所周知,一些搜索引擎具有特殊的过滤系统,在这些系统的帮助下,公司和研究机构可以找到合适的患者样本,像是例如商业供应商iSPECIMEN。然而,这样的搜索引擎只能使用特殊数据库中的标准化数据,无法做出预测性的结论。提出查询的研究机构只能找到那些已经被提供标志(被标记)并已进行过基因组测序的样本。
因此,传统的搜索引擎既不能帮助实验室/生物库选择哪些样本可能会引起研究机构的兴趣(尤其是是否值得进行昂贵的基因组测序),也不能为研究机构的查询生成信息,使研究机构更容易进行群体研究,并就哪些样本值得标记向实验室/生物库提供反馈。
发明内容
本发明的任务是提供一种用于处理对包含多个人的样本数据和/或样本的数据库的搜索查询的改进方法和/或提供一种相应的、用来避免传统技术的缺点的搜索平台设备。对数据库的搜索查询进行处理尤其是应该使得能够以更快的速度和/或更少的工作量来识别出令人感兴趣的样本。此外,对数据库的搜索查询的处理还要尤其是能够提供对样本数据和/或样本的加速的和/或简化的访问,和/或保护样本数据和/或样本所属个人的隐私。
所述任务通过一种用于处理对数据库的搜索查询的方法和一种搜索平台设备得以实现,该方法和该搜索平台设备具有独立权利要求所述的特征。本发明的有利实施方式和应用由从属权利要求中得出。
根据本发明的第一个一般方面,通过一种用于处理对包含多个人的医学样本数据和/或样本的数据库的搜索查询的方法来实现上述任务,所述方法执行以下步骤:向AI处理器装置中输入包含需求概述的搜索查询,旨在找到至少一个包含具有预定的查询搜索参数的样本数据的样本;利用所述AI处理器装置搜索至少一个选定的样本,其中,所述至少一个选定的样本满足上述的需求概述;以及输出所述至少一个选定的样本的识别数据。该数据库例如通过医学机构、实验室和/或生物样本的样本库(生物库)提供。上述需求概述优选地至少以规定的概率得到满足,该可能性由AI处理器装置的功能决定。
根据本发明的第二个一般方面,上述任务由一种搜索平台设备得以解决,该搜索平台设备被配置为用于处理对包含多个人的医学样本数据和/或样本的数据库的搜索查询,其中,该搜索平台设备包括输入装置,其被设置用于接收含有需求概述的搜索查询,其旨在找到至少一个包含具有预定的查询搜索参数的样本数据的样本,还包括与输入装置耦合并被配置用于搜索至少一个选定样本的AI处理器装置,其中,所述至少一个选定的样本满足所述需求概述,并且还包括被输出装置,其设置成用于输出所述至少一个选定的样本的识别数据。优选地,所述搜索平台设备或者它的其中一种实施方式被设置用于执行根据本发明的第一个一般方面或其实施方式之一的方法。
本发明的技术有利地提供了比传统搜索引擎更多的功能。它是一种具有集成人工智能的、能够自动学习的预测性工具。根据本发明的技术例如可以帮助制药行业/(生物)医学研究机构寻找适合研究的患者群体,另一方面还帮助数据库设施(像是例如实验室/生物库)评估,哪些样本值得投入尤其是工作时间和成本进行样本处理、例如进行基因组测序。反之,研究实体又可以通过他们的查询内容对由该平台的、自主学习的人工智能(AI)进行的评估产生直接的影响。
利用本发明,有利地将研究实体的查询内容数字化,并由AI处理器装置处理。所述AI处理器装置包括计算机设备,其被设置用于例如通过至少一个人工神经网络应用基于机器学习的程序。AI处理器装置这个概念在下文中也被称为由计算机设备提供的人工智能。用于构建AI的方法在专利文件WO 2020/233850Al(“人工学习单元的递归耦合”)和WO2020/235851Al(“多个人工学习单元与投影层级的耦合”)中进行了描述,其中,除了构建由多个AI单元组成的学习系统外,还引入了AI系统对伦理原则/规则的存储和自主应用。
AI处理器设备通过单独的训练和/或优选地通过对寻址到AI处理器装置的查询的评估和数据库的相对应的识别结果进行学习。
根据本发明的一种优选实施方式,利用所述AI处理器装置搜索一组选定的样本,其中,所有选定的样本至少以规定的概率满足需求概述。所选定的这组样本有利地相对于各种多样的存储数据提供有限数量的样本,这些样本可以针对相应的查询请求被进一步处理、检查或输出,由此大大简化了运行数据库的工作量。
根据本发明的方法或搜索平台设备优选地满足以下两个功能中的至少一个:
(a)根据研究的相关性自动生成样本的排序;
(b)对研究机构感兴趣的参数(患者的哪些数据与研究相关)进行自动评估(评级)。
根据第一个功能,优选地将这组选定的样本的识别数据与排序信息(定位信息)一起输出,该排序信息为每个选定的样本分配满足需求概述的命中概率。
根据第二个功能,优选地输出额外的评级搜索参数,这些参数与搜索查询匹配,使得可以选出一组以更高的命中概率满足需求概述的样本。特别优选地,评级搜索参数包括基因图谱、关于临床治疗的数据、病史、家庭疾病倾向、个人诊断结果、生活方式习惯的特征、饮食习惯、消费行为、运动和锻炼特征、关于吸食药品或其他麻醉品的数据、关于药物摄入的数据、关于辐射暴露的数据、表观遗传学数据、地理信息、年龄、性别、种族、过敏和/或精神疾病。
传统的搜索引擎无法通过实体(像是例如研究机构)查询特定的样本情况而受到影响,而且也无法将这些信息转发给实验室/生物库,与传统的搜索引擎不同,所述AI处理器装置可以通过查询请求受到影响,尤其是受到训练。此外,传统的搜索引擎也无法独立评估(评级)患者数据的哪些参数是研究感兴趣的。
根据本发明的一种优选实施方式,研究实体的需求概述旨在找到一组包含样本数据的样本,其中,属于该样本组的人构成受试者群体。有利地,由此可以直接响应该查询请求来生成受试者群体。
根据本发明的另一有利实施方式,所述AI处理器装置处理来自专业文献的信息、来自工业部门的商业市场信息、尤其是关于医药品的信息、和/或来自关于医药品的批准数据库的信息。
所述平台通过向实验室/生物库转发搜索查询,因此有利地构成了对于研究机构具有高的实用价值的搜索门户,用于寻找合适的患者群体。例如来自制药行业的查询可以利用该平台的AI生成样本评级。为了生成这份评级,该平台的AI不仅可以参考制药行业的查询内容,还可以参考科学文献。不仅制药公司可以通过该平台连接到合适的样本材料,学术的、非营利的研究机构也可以使用该平台。反过来,他们又将信息保留在这些研究分支将受到热捧的平台上。除了科学出版物,来自工业部门的信息也可能有人感兴趣:例如,哪些药物是作为新品进入市场的,或者可以从批准数据库中读取药物研究的哪些趋势。所有这些机构(制药公司、非营利研究机构、相关出版机构、新药的开发等)都会根据设备中AI内的相关性影响患者样本排序中的权重(见图1)。有了这些信息的帮助,该平台甚至可以更成功地向实验室/生物库(基于其独立生成的排序)提供建议,对哪些患者样本进行昂贵的基因组测序可能是值得的。所述设备的AI是在从当前的研究趋势和来自研究机构的查询生成的样本排序的基础上给出建议的。在这种分析的帮助下,实验室/生物库降低了其初始的测序成本。
优选地,设计将搜索查询通过编码函数转换为分段的搜索查询。该转换优选地利用与AI处理器装置和输入装置的编码装置来实现。
为了满足数据保护的要求,优选地实现以下特征:个人信息,如其基因组的临床数据或测序数据,不得自由访问。它们受到数据保护。然而,可能需要搜索患者档案的特定特征,以便平台能够最佳地工作并在双方之间进行调解。这种搜索可以通过使用编码函数来完成,例如使用哈希函数:平台本身对患者的基因数据没有深入了解,但可以在实验室的数据库中通过哈希在加密数据中搜索对于研究实体来说合适的基因档案,而不知道具体的遗传信息。编码函数的应用尤其可以根据DE 10 2019 135 380.7(“用于处理遗传数据的方法和数据处理装置”,在本公开的优先权日尚未公开)中描述的技术来实现,其中,可以以加密的方式(例如通过哈希)在不公开的数据中(如个人的基因信息)进行搜索,而不必披露数据的所有信息。DE 10 2019 135 380.7通过引用结合到本公开中,尤其是就遗传数据的处理而言。
在数据库中,对于这种类型的应用程序,优选地安装“安全飞地”,通过安全飞地,平台可以通过编码函数(例如哈希)转发制药行业/研究机构关于特定样本的查询请求。像是例如实验室/生物库这样的数据库在不披露任何个人数据的情况下确认或否认存在合适的样本。以这种方式,平台也没有必要占有患者的个人数据或单个样本/患者的中央ID系统。取而代之,每个当前相关的样本都去中心地且临时地以加密(哈希)的方式被存储起来(如在疾病警告应用程序中)。所述设备不存储特定样本的具体基因数据、临床患者数据或其他的患者档案信息。这些个人数据保留在实验室/生物库或医生和病人那里。该平台以使用编码函数转换查询请求的形式,尤其是使用“哈希”,转发搜索内容,这样它就不需要获得直接访问这些个人数据的权限。
根据本发明的一种优选实施方式,提出相关人员同意使用数据和/或样本的请求。特别优选地,通过使用问卷和/或知情同意书和/或由虚拟化身(Avatar)设备来请求同意。
优选地,此外还可以输出信息,尤其是向其样本数据存储在数据库中的人输出信息,其中,这些输出的信息特别优选地涉及医药品、疾病、研究结果和/或行动建议。
结合搜索平台设备及其实施方式公开的特征同样也构成根据本发明所述的方法的优选特征,反之亦然。因此,上述各个方面以及具有新颖性的和优选的特征,尤其是就搜索平台设备的构建方式以及结合搜索平台设备描述的各个组件的功能和配置而言,也适用于本发明所述的方法。本发明的上述优选实施方式、变型和特征可以相互组合。
附图说明
下面参照附图描述本发明的更多细节和优点。图中示意性地示出:
图1:具有根据本发明的优选实施方式的特征的搜索平台设备和搜索方法的总览图;
图2:根据本发明的优选实施方式的搜索平台设备和搜索方法的功能的更多细节;
图3:对在实践中应用本发明的优点的说明;
图4:具有根据本发明的优选实施方式的特征的虚拟化身设备的总览图;
图5:虚拟化身设备与其环境(外部世界)之间的通信和对该通信进行控制的示意图;
图6:第一和第二存储装置的应用的示意图;以及
图7:具有根据本发明的优选实施方式的特征的虚拟化身方法的总览图。
具体实施例
接下来就所述搜索平台设备和可选地与该搜索平台设备耦合的虚拟化身设备的配置和功能对本发明的实施方式的特征进行描述。对传统技术中已知的、有关AI处理器装置的细节不再进行描述。AI处理器装置尤其是可以像在WO 2020/233850 A1(“人工学习单元的递归耦合”)和WO 2020/235851 A1(“多个人工学习单元与投影层级的耦合”)中所描述的那样进行配置。WO 2020/233850 A1和WO 2020/235851 A1的内容,尤其是关于AI处理器装置及其外围设施(如输入和输出装置和存储器)的配置的内容通过引用并入本文。
搜索平台设备以及用于运行该设备的方法
图1示出了搜索平台设备的AI处理器装置与研究机构、监管机构和科学院校的交互。与输入和输出装置(未示出)耦合的AI处理器装置不仅通过来自制药行业或其他研究机构的查询请求还通过访问当前的科学出版物、新药和/或样品信息来学习,哪些对于研究工作来说特别令人感兴趣以及因此可以获得多大的权重。此外,AI处理器装置还以同样的方式学习进行评估,哪些参数对于研究工作是重要的,像是例如相关人士的基因组特征、年龄、性别、生活方式、病史和诸如此类。发出查询请求的实体通过其查询在排序和评级方面影响权重。
图2示出了搜索平台设备的AI处理器装置与数据库(如实验室/生物库、医生/患者)的交互。通过评估研究实体的查询(图1),AI处理器装置可以为实验室和生物库提供信息(识别信息),预测对哪些样本进行基因组测序是有价值的,以及哪些参数对于研究实体来说令人感兴趣。患者或医生也可以直接从搜索平台设备中获悉目前的研究重点。搜索平台设备和数据库之间的通信可以完全匿名地实现,和/或在使用编码函数(尤其是哈希功能)的情况下通过实验室/生物库内的安全飞地实现。下面对照图4至图7描述的伦理化身可以用作个人的数字代表,以帮助搜索平台设备回应查询请求(预测合适的样本),例如,确定特定的患者是否可用于参与研究。
有利地,搜索平台设备能够借助数据库(实验室/生物库)的肯定的或否定的回答,或者说借助研究机构对特定档案的搜索查询,生成样本的排序(例如从“感兴趣”到“不感兴趣”或借助概率)并确定对于研究工作来说令人感兴趣的参数。除了患者的基因图谱之外,这些参数例如还可以包括关于患者的临床治疗、病史和家庭疾病倾向、个人诊断结果、生活方式的改变、饮食习惯、消费行为、运动和锻炼、药品使用、药物摄入、可能的辐射暴露、表观遗传学数据、地理信息,年龄、性别、种族、过敏和/或精神疾病。搜索平台设备不仅有助于实验室/生物库猜测其样本中哪些对于研究工作来说具有较高的当前价值,还有助于评估那些对于研究工作来说令人感兴趣的、提取出来同样对实验室/生物库也有价值的参数(见图2)。
为了使用患者数据/样本(如适用),需要相关患者的自愿同意。为了便于获得同意声明,可以使用伦理化身。这种虚拟化身是一种学习真人的道德观念并且可以模拟真人的智能工具。借助该虚拟化身,所述平台就能够为制药公司就特定数据/样本的伦理背景而言进行预选:不必联系真人来询问他们对他们的数据/样本的特定应用和用途的态度,而是通过咨询他们的伦理化身完成显然更快的预选。于是,所述平台不仅帮助制药公司(或非营利的科学机构)找到具有合适基因和医学特征的患者,还可以预先出这些患者中哪些极有可能愿意参与研发。伦理化身是基于其个人价值观或宗教信仰或文化背景预测患者参与研究工作意愿的预测单元。
然而,在没有“伦理化身”的情况下,也可以通过平台的AI对相应的问卷或知情同意书进行评估来预测患者原则上是否对参与研究工作抱有开放的态度。
搜索平台设备的工作方式为相关方面带来了以下优势:
对于存储样本和样本数据的人、尤其是患者的优势
所述平台的工作方式遵守数据保护的所有要求,因为无需在平台上存储患者相关的数据(请参阅上文:通过哈希搜索)。因此,患者在保护其数据和隐私方面的利益得到了最佳保障。
搜索平台设备的高效工作使得患者有机会参与对他来说可能很重要的研究工作(例如,因为这些研究涉及到他们的病症)。该平台还可以将患者与他们服用的药物等重要信息来源联网,或提供有关其所患疾病的最新研究结果等。
如果感兴趣,患者还可以直接联系平台并分享个人信息(如行为或环境数据),例如通过允许他们访问各种健身应用程序的数据。由此可以将他们与他们适合作为志愿者的研究项目联系起来。所有这些都需要患者一方的高度自愿性,但可以让他更多地参与最新的研究结果,并更个性化地获得涉及他个人的相关医疗创新,从而使他受益。
对于数据库、尤其是实验室/生物库的优势
所述搜索平台设备的AI处理器装置处理大量数据(来自研究机构的请求、当前的科学出版物状况、批准进程、当前的新药),评估这些数据,从而能够预测哪些样本可能对于研究工作是相关的。这些预后的结果对于实验室/生物库具有重要价值,因为它们可以猜测,它们所拥有的哪些样本值得进行昂贵的基因组全测序。主要是测序过的样本对于制药行业和(生物)医学研究机构具有价值,因此对于实验室/生物库来说非常重要的是,首先对后来会被研究机构购买的样本进行测序。于是,所述平台有助于在实验室/生物库和潜在样本买家之间充当中介。然而,它也帮助实验室/生物库猜测应该收集哪些样本参数,才会让研究机构对其感兴趣(除了临床或诊断数据,还可以包括年龄、性别等上述信息)。通过平台的排序,实验室/生物库可以猜测,哪些样本的SNP粗测序可能是可取的,以及哪些样本相关性很强,以至于值得进行全基因组测序(因为该样本很可能可以出售)。
对于查询实体、特别是制药行业/(生物)医学研究机构的优势
该平台通过向适当的实验室/生物库转发研究机构对特定样本的查询请求,协助研究机构将合适的患者群体集中在一起。通过它们的查询,研究机构不仅对样本排序中的权重、而且对平台的AI的评估工作都有影响,评估哪些样本参数(例如患者的辐射暴露、他以前的病史、他的药物滥用等诸如此类)会引起兴趣。于是,研究机构可以通过所述平台影响实验室/生物库的测序行为,并同时影响它们对特定的、符合它们目的的样品参数的关注。
不仅是对个人患者数据的保护通过平台得到了保障(见上文),而且制药公司的内部研究(通过它们的查询请求在某种程度上被公开)也受到了保密对待。这些公司肯定不愿意公开他们目前正在研究的领域,从而招致不必要的竞争。
图3示出了借助商业计划书应用所述搜索平台设备的优势。来自制药行业的搜索平台设备的用户为平台的使用支付一定金额的费用,例如每个用户100000欧元。为此,用户由平台介绍给拥有符合用户所查询的需求概述的样本的实验室/生物库,并且该样本排序的权重由此受到影响。该排序直接影响实验室/生物库对哪些样本进行测序。对于特殊的、与研究相关的样本,搜索平台设备可能会支付部分的测序成本。科学的、非营利性的研究机构可以免费使用该平台。搜索平台设备的AI从查询中获利,因为它可以以此为基础根据当前的研究兴趣点调整它的排序。参与科研或愿意共享个人数据的患者作为回报可以连接到与他们相关的网络,例如与他们的疾病有关的网络。
例如,基因组测序花费实验室/生物库约500欧元。实验室/生物库仅仅为它们的大约1%的样本支付这个成本。执行粗测序法(如SNPs)或进行诊断检查的成本约为每个50欧元。通过搜索平台设备的预测功能,实验室/生物库可以获得有价值的信息,指引哪些样本可能对于研究机构来说是相关的,因此可以更快地完成测序,还可以更有效地投资测序成本。
发出查询请求的制药公司或其他商业组织必须为向平台提出查询请求存入基金(以“参与费”的形式),因为每一个查询请求都会影响平台的排序工作和对参数的评估。非营利机构,如大学或其他非营利(生物)医学研究机构可以免费查询。这些查询对平台的价值在于它们携带的信息:通过每个查询,平台的AI系统都会学习到哪些样本目前处于研究趋势,并可以调整其排序,从而调整其预测结果。
如果被查询的实验室/生物库对排序中被评为与研究特别相关的特定样本进行测序,并做出特定的、提供对于研究工作来说令人感兴趣的参数的诊断,则它们将获得平台基金的财政支持。通过这种方式,实验室/生物库被鼓励对特定样本进行测序,这反过来又符合提出查询请求的制药行业/(生物)医学研究机构的利益,因此这些机构能够获得有吸引力的样本集。此外,平台基金中的资金还被用于平台的运营(商业计划概述见图3)。
进行购买的研究机构对单个样本的支付直接在实验室和研究机构之间进行。在这件事里,搜索平台设备不再参与。
用于与搜索平台设备结合使用的虚拟化身设备和方法
本发明还涉及一种虚拟化身设备(“伦理化身”),其用于代表个人并用于处理此人的个人数据,并且还涉及一种具有多个虚拟化身设备的虚拟化身系统,虚拟化身设备的用途,以及一种用于运行虚拟化身设备的虚拟化身方法。本发明尤其是涉及一种用于生成个人的虚拟代表的方法和一种用于创建个人的虚拟代表的设备,该虚拟代表在本文中也被称为伦理化身或者虚拟化身设备,其中,所述虚拟化身设备例如能够学习并自主模拟个人的道德态度、伦理原则、价值观和/或此人的其他观念和利益。本发明的应用例如包括在运行包含个人数据的数据库时和/或者在处理个人数据时,尤其是通过机器学习和/或人工智能(AI),和/或在处理对本发明的上述搜索平台设备提出的查询时。
不仅在(生物)医学研究中而且在对个人(患者和/或受试者)的医学检查和治疗期间,都会产生涉及这些患者或受试者的大量个人数据的积累;有可能是通过捐献生物组织(人体组织样品、体细胞和干细胞样品)或者在对病症进行治疗的过程中(提取活组织、肿瘤或者诸如此类)。这些个人数据例如涉及到患者/受试者的基因信息、他们的病史和/或他们暴露的环境可能造成的影响。
管理和保护这些数据带来大量的信息技术工作,同时在处理这些数据时首先要优先注意遵守伦理标准(参见数据保护和知情同意法规)。
迄今为止,需要获得个人的书面同意声明,并通过匿名或假名化患者/受试者身份来保护敏感数据免受未经授权的访问。这种必要的程序使得到事后再询问当事人的情况变得非常困难,甚至不可能。如果情况发生变化、新的研究领域出现、或者当事人的意见或利益出现不确定性,由此产生的问题就无法或者很难对当事人进行澄清。
此外,在舆论研究、社会学或人口统计分析时,在大数据研究(数据科学)过程中以及在工业/商业领域,都必须尽快处理大量的个人数据,同时保护当事人的隐私——目前为止,这项工作都非常耗时且昂贵。
在个性化医疗领域,已经有了将人体功能和身体实体数字化的方法(例如参见“蓝色大脑项目”或虚拟心脏模拟)。越来越多的人体部位的数字版本被开发出来:细胞、器官甚至整个个体都有望通过虚拟的形式呈现。这个概念被称为“数字孪生”——生成生物对应物的数字复制品。
目前的方法仅限于模拟人类的生理过程。迄今为止尚未考虑到此人心理反应特征,像是例如道德态度、观点、个人价值观和伦理原则等。
本发明的涉及这个方面的任务是,提供一种更好的、基于数据的个人数字代表和/或应用该数字代表的方法,其中,避免了传统技术的缺陷。个人的数字代表尤其是要使得能够提供有关此人的附加信息和/或在更广的类别中的信息,像是例如非生理学的信息,并且/或者提供更广泛的应用。个人的数字代表此外还尤其要加速和/或简化访问个人意见的过程,并且/或者提供对个人隐私的保护。
为此,根据本发明使用一种虚拟化身设备、一种包含多个虚拟化身设备的虚拟化身系统、虚拟化身设备的用途和一种具有下文所述特征的、用于运行虚拟化身设备的虚拟化身方法。
优选地使用一种虚拟化身设备,其被设置用于代表个人并且用于处理此人的个人数据。所述虚拟化身设备包括AI处理器设备,其被设置用于通过数据训练对此人的个体心理反应特征进行机器学习,依据心理反应特征生成语义回答问题(尤其是至少一个句子或单个单词,例如是或否),还包括耦合到AI处理器设备上并被布置用于存储此人的心理反应特征的第一存储器设备(个人存储器),还包括耦合到AI处理器设备上并且被配置为与人交互和/或接收与此人有关的问题的输入装置,以及被配置为用于输出代表由AI处理器装置生成的问题的信号的输出装置。
根据本发明的另一个方面,优选地提供了所述虚拟化身设备或其实施方式之一的用途,其中,所述用途包括至少以下之一:创建用于将医学实验室和/或生物库与工业企业和/或科学研究机构连接的多方向平台;创建用于社会研究、观念研究和/或大数据分析的平台;创建用于提供患者声明(尤其是同意使用个人数据的声明)的平台;创建数据保护平台;生成患者意愿;为合成生物学过程提供输入信息;以及控制技术装置。
根据本发明的另一个方面,使用一种用于运行个人的虚拟化身设备的虚拟化身方法,其包括以下步骤:接收关于此人的至少一个问题、用AI处理器装置处理该问题,以及针对该至少一个问题输出语义回答。
根据本发明的另一个方面,使用一种虚拟化身系统,该系统包括多个虚拟化身设备,其中,每个虚拟化身设备都适应另一种用途。
利用所述虚拟化身设备,有利地数字化和/或通过AI处理器装置模拟人的心理反应特征。所述AI处理器装置包括计算机设备,其被设置用于应用基于机器学习的程序,像是例如来自至少一个人工神经网络的程序。AI处理器装置这个概念在下文中也被称为由计算机设备提供的人工智能。
所述虚拟化身设备有利地提供该虚拟化身设备所代表的人的数字孪生,其中,该虚拟化身设备代表例如真人的个人观点、利益和/或道德态度。所述虚拟化身设备有利地允许简化和/或加速对个人数据的管理。与此同时,所述虚拟化身设备使得可以保护当事人的隐私,并最大程度上考虑他们的利益。
根据本发明的虚拟化身设备有利地是一种智能的、数字的且可预测的可用辅助工具,其可以充当真人的代表。所述虚拟化身设备例如可以用作个人与诸如研究机构或研究院或公司之类的查询实体之间的咨询链接,其中,保护当事人的匿名性(不再需要与此人直接接触),同时能够代表此人相对于他人的利益。这些优点将在下文中尤其是参照附图进行说明。
有利的是,所述虚拟化身设备是一种工具,其可以用于预测它所代表的真实对象的表达、尤其是意见,并且可以用在各种类型的、在此之前必须耗时耗力地对成千上万的人进行调查询问的数据库/分析中。
伦理化身代表一种人工智能(AI),它能够由个人进行训练,尤其是针对他们的道德态度,然后基于这些训练预测新问题的答案。在这个训练过程中,虚拟化身的AI了解这个人的道德态度、价值观、利益和原则。通过学习和联想AI,它现在可以在回答新的(道德)问题时应用这些原则/价值观/态度。因此,所述虚拟化身设备不仅能够再现所学内容,而且能够以智能的和创造性的方式将所学内容应用于新的环境中。它可以根据对当事人的了解,智能地预测当事人在某个特定的新条件下的意思,以及在被问及时会做出什么判断。
优选地,AI处理器装置被设置用于个体心理反应特征的机器学习,所述个体心理反应特征包括个人的道德态度、观点、意见、价值观、利益和/或伦理原则。反应特征包括此人的主观特征,这些特征代表了此人如何对某个问题、事实、经历、情况、另一个人、社会群体和/或想法做出反应,其中,反应可能包括例如陈述、影响和/或行为方式。
根据本发明的一种优选实施方式,所述第一存储装置被配置为以规则目录、微契约和/或区块链的形式存储心理反应特征。然而,本发明的实施却不限于这些变型,而是可以采用其他的可数字化格式。
优选地,所述第一存储装置被设置用于存储与心理反应特征相关的个人附加数据,并且这些数据尤其是包括此人的宗教信仰、团体归属、协会成员身份和/或党派成员身份。
根据本发明的另一有利实施方式,所述AI处理器装置被配置为理解和应用道德相关的概念。
优选地,还设计一个第二存储装置(公共存储器、共享存储器),其被设置用于存储代表心理反应特征的相关知识的一般附加数据。特别优选地,该第二存储装置与更新装置耦合,利用该更新装置可以对一般的附加数据进行更新。
根据本发明的另一有利实施方式,所述虚拟化身设备(尤其是输入装置)具有通信信道,该通信信道被设置用于所述虚拟化身设备和人之间的通信。有利地,这允许个人访问所述虚拟化身设备,例如检查其功能、训练AI处理器装置或修改存储的数据。
因此,所述虚拟化身设备不仅由当事人训练,而且由它模拟其道德态度的真人此外还优选地在任何时候都可以检查并在必要时纠正他们的伦理化身的陈述和尤其是决定,继续对其进行训练,或者修改已存储的价值观/利益/道德原则。然而,这个人也可以选择将决策权完全转移给他们的虚拟化身,并完全由它代表自己。
有利的是,真人的自主权不受限制,因为虚拟化身只充当辅助代理,它总是处于此人的控制之下,并且仅基于此人的心理反应特征(例如个人观念和利益)提供咨询功能。
根据本发明的另一有利的变型,所述输入装置配置有授权装置,该授权装置被设置为仅接收来自事先指定的授权实体(例如制药公司和/或研究机构)的、对此人的询问,或者仅接收关于事先指定的允许内容的询问。特别优选地,所述授权装置包含通信认证存储器和标准通信协议功能。
在本实施方式中,对个人数据的保护尤为重要:虚拟化身不允许未经授权的人访问数据,并且在回答咨询的问题时也仅在有限的范围内且仅向授权机构提供个人数据。
优选地,所述虚拟化身设备此外还包括密码存储器,其被设置用于存储访问密钥。有利地,这使得可以以高的可靠性限制对虚拟化身设备的访问。
根据本发明的另一有利实施方式,所述虚拟化身设备有协议存储器,其被设置用于存储第一和/或第二存储装置的内容的变化过程。
此外,还可以有利地设置定时器装置,其被设置为用于为虚拟化身设备的功能提供时间尺度。
特别优选地,所述虚拟化身设备包括被设计用于与人联系和/或通信的通信装置。有利地,由此例如可以对AI处理器装置提供的语义回答进行认证。
结合虚拟化身设备及其实施方式公开的特征同样也是根据本发明的方法的优选特征,反之亦然。因此,上文所述的各个方面以及创造性的和优选的特征(尤其是关于虚拟化身设备的结构以及结合虚拟化身设备描述的各个组件的功能和配置)也适用于所述方法。本发明的上述优选实施方式、变型和特征可以相互组合。
下面对照虚拟化身设备的配置和功能来描述所述虚拟化身设备的实施例的特征。AI处理器装置的那些本身从传统技术中已知的细节在此不再说明。
图4示出了所述虚拟化身设备及其运作方式的一种实施例,其中,图4中所示的区段(步骤和/或组件)a至g具有以下含义。区段a包括存储已经学到的内容和/或访问已经学到的内容,区段b包括记录训练单元的时间点,区段c是对第二存储装置的访问,以使调查可以更智能,并将其与定时器装置(时钟系统)进行协调一致,区段d包括密钥管理和认证存储之间的交互,区段e定义谁被授权询问和/或提供咨询,区段f包括影响激活或阻止与周围环境的通信,尤其是包括通信协议,而区段g指的是由人对AI进行训练的信道、对AI提问和/或由AI提供信息。
根据图5,所述虚拟化身设备与其周围环境(外部世界,尤其是指提出询问的实体或对虚拟化身进行训练的真人)之间的通信(见图7)和对该通信的控制包括以下步骤。步骤a是真人的通信。在步骤b,AI处理器装置使用其密码存储器来验证此人是否被授权在个人存储器中进行修改和/或与它通信。在步骤c,决定是/否允许进行训练,和/或是/否提供信息。步骤d是某个实体(如研究机构)对指定主题的深入调查。在步骤e中,虚拟化身的AI处理器装置通过存储在其通信认证存储器中的所有授权实体的目录来检查,其是否被授权向该实体提供信息,以及被授权针对哪些主题向其提供信息,在这个过程中,尤其是用到通信认证存储器中的通信协议。在步骤f,提供测试的结果。
在图6中,阐述了在第一存储装置(个人存储器)上进行数据存储和数据检索,同时结合使用第二存储装置(共享的公共存储器),用于按时间顺序安排训练内容。伦理化身的AI处理器装置不仅能够在个人存储器中存储和访问(当收到经授权的询问时,见图2)真人当前的心理反应特征,例如道德态度/意见/利益,但也可以将真人的心理反应特征的旧版本存储在历史记录日志中,并通过时钟系统在时间上对其进行绝对归类。这种按时间顺序的匹配也使得与第二存储装置进行协调一致成为可能。第二存储装置也可以使用AI处理器装置来使真人的训练更加智能,例如通过让AI处理器装置询问此人的宗教信仰,并通过访问第二存储装置来理解答案“基督”的意思,因为在第二存储装置中已经了解到,“身为基督徒”在特定时间点意味着什么样的道德态度。
所述虚拟化身设备具有以下在图4中所示的特征:
·所述虚拟化身设备包含(1)学习组件,其可以通过真人的个人训练来学到他们的道德态度,其中
·(2)该训练的结果被存储在第一存储装置中,并且虚拟化身的AI可以访问这些信息(第一存储器设备不是公共的,也就是说,来自虚拟化身设备的周围环境的访问是被阻止的)。人的心理反应特征(像是道德信仰)可以以规则目录、微契约和/或区块链的形式存储在虚拟化身的第一个存储装置中。)。在第一存储装置中,还可以存储关于个人的宗教信仰或团体/协会/党派成员资格的信息,伦理化身能够从中得出关于个人意见的结论(通过访问单独的存储器(第二存储装置,见(4))。
·此外,(3)虚拟化身设备被设置为,在面对新问题(输入)时,独立地基于其中存储的、关于此人心理反应特征(例如态度)的知识生成新的答案(输出)。这样的虚拟化身优选地能够理解和应用与伦理相关的概念,这通过相应的本体论(尤其是实体的系统化的、形式化的表示,像是例如具体的和抽象的的对象、属性、事实、事件、过程)而成为可能。
·除了用于个人道德态度的第一存储装置外,虚拟化身(4)优选地还可以访问独立的第二存储装置,其中,(通过之前的专业训练)存储了更基本的、对于反应特征(例如道德)相关的知识。在此,例如可能是关于不同伦理理论及其含义的知识,关于宗教或其他群体(如政党或协会)及其准则和规则的知识,但是也包括关于与伦理相关的概念和在道德哲学中已知的和讨论过的伦理困境的知识。该第二存储装置(公共存储器,例如与其他虚拟化身系统共享)可以由虚拟化身设备在真人对其进行训练期间使用,以使对此人的询问更智能,使人对特定的问题更敏感,并能够对人的回答进行分类。虚拟化身只有在训练期间才会应用这些普遍的常识,而不会在后来代替真人回答伦理问题时应用。在这种情况下,它只根据它对其心理反应特征的了解做出决定,尤其是个人的价值观/利益/原则。第二存储装置可以定期更新,为此在虚拟化身内使用时钟系统(参见(9))。
·(5)在伦理化身及其真正的对应者之间提供通信渠道,以便他们训练虚拟化身,并最好可以随时监控其数字代理的行为,并且如果他们愿意,可以随时重新开始训练。与提出询问的实体的通信也因此成为可能,但优选地受到限制。优选地,只允许已授权的实体询问授权主题范围内的问题。授权的完成是通过
·(6)包括标准通信协议功能的通信认证存储器。在这里是允许虚拟化身与之通信的实体的列表,以及关于提出询问的实体的问题允许涉及的、可以得到回答的背景条件。授权可以由真人本人给予,也可以由中央机构给予。只有授权的实体才能在明确限制的框架内提供信息:例如,授权的医疗机构可以对虚拟化身提问,但只允许提出与医疗相关的问题(图5中示出了虚拟化身与外部世界之间的通信)。
·通过(7)用于管理访问密钥的密码存储器,虚拟化身优选地可以检查,哪个实体在哪个范围内具有哪些询问权限。通过这些密钥此外还确保了,只有真人被授权对虚拟化身的个人存储器进行更改。
·由于伦理化身不是仅能由真人训练一次,而是此人优选地可以在任何时候对个人存储器的内容进行更改,因此虚拟化身(8)优选地包含存储器(协议存储器),其中存储了更改的历史记录(例如通过区块链等)。在此,所述虚拟化身具备
·(9)时钟系统,以便能够对不同的训练过程在绝对时间点进行估计,并且能够与第二存储装置针对一般的、与道德相关的知识进行协调一致。通过这种方式,可以将某个训练过程的时间点tx与当时存储在公共共享存储器中的一般知识状态(见(4))对应起来。这可能对于理解当前训练单元的内容非常重要:例如,一个真人在某个时间点tx表示觉得自己有义务遵守某个社会团体的准则,但是当该准则进行了改革时,那么此人在时间点tx+n就可能做出不同的选择。两个准则(时间点tx时的旧版本和时间点tx+n时的修改版本)都与相应的时间点关联起来地存储在第二存储装置(4)中,就像存放在个人存储器(2)中的训练单元经由时钟系统与训练时间点关联起来一样。由此使得可以将此人的个人态度与绝对的时间点对应起来(如图6所示)。
·伦理化身此外还可以(10)具有如下的单元,该单元涉及到真人在原则上的可访问性、链接可能的联系方式或提供关于此人的可联系性的信息。
在实施本发明时,尤其是存在以下可能性:
a)某个真人刚好有一个对应的虚拟化身设备(伦理化身),优选地具有同等的身份标签,不同的实体可以向其提出请求。关于这个人的所有信息都是通过虚拟化身设备处理的。
b)某个真人可以被分配多个在不同的应用区域中生成的虚拟化身设备(虚拟化身系统)。不同的虚拟化身与个体的成功同步可以通过以下方式实现:虚拟化身的标识号(由虚拟化身信息机构提供)、全球唯一标识符(如患者ID或生物样本ID)或(被哈希的)个人标识符(如图像[例如开发了“Gravatar”这个概念;Gravatar是伴随用户从一个网站到另一个网站的图像,被用作标识符(请参阅:https://de.gravatar.com).]或遗传“指纹”,如SNPs—单核苷酸多态性—或STR—短串联重复序列)。如果一个人有多个虚拟化身,则优选地让这些化身彼此同步,从而使得所有参与的虚拟化身就它们所共同代表的真人的心理反应内容(例如态度和意见)而言保持最新状态。真人的不同虚拟化身之间的协调一致应得到保障。
具体实施例和应用的更多细节
1.在大数据分析/数据科学中的实施例
虚拟化身作为多方向平台的一部分,该平台被用作医学实验室/生物库和制药公司之间的综合链接:医学(商业)实验室可以访问与患者的临床信息、诊断结果和遗传信息有关的大量数据。它们对将这些数据用于研究和经济感兴趣。另一方面,制药行业和科学机构在研究中依赖于从非常特定的患者群体获得数据。在传统技术中,在这两个领域之间进行通信非常复杂,但可以通过具有至少一个集成的虚拟化身设备的平台来促进。该平台将双方的信息捆绑在一起:它分析哪些患者在实验室接受测试,并通过询问患者档案从研究的角度了解来自实验室的哪些数据/样本对研究有用。因此,该平台可以支持双方:它为实验室提供建议,哪些样本/数据值得进行昂贵的基因组全测序(研究所需)(因为它知道,哪些样本/数据对研究/经济有用),并可以帮助研究工作将合适的人群资料集中在一起。患者的伦理化身可以在这个预选过程中提供帮助,还因为它们了解真实患者的道德态度。使用患者数据/样本需要征得相关患者的同意。为了更方便地获取这些同意声明,可以使用伦理化身(见下文)。
社会科学研究:虚拟化身可以在预选中提供帮助,原则上哪些人可能对哪些研究主题和调查内容感兴趣,或者哪些人可能会立即反对。
→优点:快速并合适地预选社会学群体/调查小组
意见研究/大数据分析:为了能够以简单、快速的方式收集和分析许多人的意见,伦理化身可能是有利的-它们不仅可以在回答意见研究机构的具体问题时提供帮助,它们还可以在事前评估它们所代表的人是否适合进行相应的调查时提供帮助(通过在预选时提供帮助)。
2.在临床领域和生物医学研究中应用可能性
在寻求知情同意时提供建议:虚拟化身了解此人对各种同意声明的回答,因此能够预测他对新问题的态度,并代替他做出回答。虚拟化身扮演的角色是此人的顾问代表,它已经学会在自己所代表的人的立场上做出回答。
→优点:在询问其同意声明时,不再需要与当事人直接联系,在考虑到当事人的利益和意见的同时,保护此人的隐私。
知情同意程序的标准化:在伦理化身的帮助下,获得同意声明的程序可以标准化。通过像伦理化身这种可以国际适用的标准化工具,可以克服当前各种同意书文件的多样性和混乱性。
→优点:这类文件的国际分发和接收过程将得到简化,国际通用的词汇和程序将成为可能,这将极大地促进国际合作。
动态的病人意志:虚拟化身可以在当事人不具备表达能力时起到照顾作用。如果一个人处于昏迷状态或类似的情况下,此时他们无法为自己说话,那么一个受过适当训练的伦理化身就可以对亲属或法定监护人有很大的帮助,因为他们可以向这个虚拟化身询问这个人的意愿、利益和道德态度。
→优点:当事人可以放心依赖,当他们自己没有能力时,他们训练的伦理化身可以预测符合他们自己利益的决定。
不可预见的未来研究领域/应用领域:通过对虚拟化身进行更广泛的训练,除了“知情同意”的具体问题外,虚拟化身还可以学会当事人的更普遍的个人道德态度/价值观/原则,并且在未来甚至面对超出知情同意书范围的问题时预测当事人的回答。
→优点:快速参与新的研究领域成为可能,最大限度地利用现有的细胞捐赠。
为生物医学研究进行群体分层:在这里介绍的虚拟化身能够代替患者/受试者做出行动,而无需公布他们的敏感数据。在此,尤其是可以使用在DE 10 2019 135 380.7(“用于处理基因数据的方法和数据处理装置”,在本公开的优先权日尚未公开)中描述的技术,其中,可以以加密的方式(通过哈希)在不可访问的数据(例如某人的基因信息)中进行搜索,而不必公开数据的所有信息。DE 10 2019 135 380.7,尤其是关于基因数据的处理的内容通过引用结合到本公开文本中。在这种情况下,虚拟化身就将可以访问相应的哈希,可以用是/否回答问题,而不必知道加密的信息。这一做法在集中具有某些共同特征的患者/受试者群体时尤其有用。例如,为了研究目的,通常需要其捐赠者具有特定的相似性(例如基因相似性)的细胞系。在这种情况下,相应的虚拟化身可以根据请求确认或不确认其所代表的捐赠者的细胞系的适合性,而不披露其真实的对应人的基因信息。
有利的是,搜寻合适的患者/受试者可以非常快(回答关于某人的特定基因特征的问题),此外,虚拟化身还可以在预选过程中提供帮助,而不会泄露其背后的、当事人的敏感数据。
→优点:在回答相关问题的同时保护敏感数据,为研究工作快速进行群体分层,到目前为止,这些只能通过付出大量的辛劳和大量的时间消耗来完成。
合成生物学:未来,可能仅根据基因信息制造合成生物单元、细胞或类器官,在这种情况下也可以考虑使用伦理化身作为真人(包括基因信息)和研究机构之间的代理实体。虚拟化身可以代表此人针对什么可以合成或者什么不可以合成表达同意或禁止。
→优点:在新的研究领域和应用领域中,个人将在其身份受到保护的情况下被代表,可以快速且对于当事人来说保证安全的情况下由提供咨询的虚拟化身回答问题。
3.在法律适用背景下的应用
在验证某人的可指责性提供支持:某人是否有能力承担法律责任,除其他外,还取决于,他们的观点是否稳定一致,以及他们最近是否经常以自相矛盾的方式改变意见。所有这一切都是可以通过虚拟化身实施,该虚拟化身不仅知道某人当前的观点,还可以研究他们的观点的“变化过程”,并且如果必要的话,还可以研究不同观点之间的矛盾关系。虚拟化身可以成为司法机构和心理评估师评估一个人精神状态的工具。这也有可能在医学背景下的心理评估中相关:观点的不稳定一致可能表明此人的疯癫/痴呆症加剧。
→优点:评估师不仅仅可以对某人的当前状态进行评估,还可以查看他们的观点随着时间的变化过程、随着时间的动态性。
4.技术设备控制中的实施例
应用于技术设备:虚拟化身可能有助于让技术设备实现用户的愿望和利益:例如通过控制各种互联网搜索引擎上的过滤系统,从而让此人只看到想要的内容,而排除其他内容,虚拟化身还可以起到对未成年人的保护作用,即通过注意不将成人内容显示给未成年人。
→促进有针对性地使用技术设备,以符合用户意愿/兴趣和道德态度。
在自动驾驶汽车中的道德实施:到目前为止,在为自动驾驶汽车寻找合适的道德体系时,找到了常识性的解决方案(实施普遍的道德态度),但也有可能的是:每个驾驶员都可以对其自动驾驶的车辆实施自己的道德态度,即在其伦理道德化身的帮助下。那么,虚拟化身就充当车辆的个人良知,就像人类驾驶员在驾驶非自动驾驶汽车时那样。
→优点:驾驶员不必屈从于普遍的道德要求,而是可以在道路交通中(当然是在合法的范围内)实施他的个人伦理价值观(做出他在亲自驾驶时一样的行为)。
5.其他的实施例
在假名的个人数据中管理/保管访问密钥:为了保护个人权利和隐私,他们的数据在各种各样的应用领域通过加密受到保护。因此,对密钥的管理非常重要。个人的遗忘或疏忽可能会导致访问密钥丢失。伦理化身在这种情况下可以帮助相关人员保管此密钥,并保护其免受未经授权者访问。
→优点:通过伦理化身的帮助支持此人承担责任,密钥会得到专业管理和保管,不太可能丢失。
数据保护的监控:虚拟化身是个人与(医疗)机构或研究机构之间进行通信的链接环节。
→优点:不必与此人直接接触,他们的身份得到保护,同时最大限度地参与与他们及其利益有关的事务。此外,虚拟化身还可以在不必披露敏感数据的情况下回答问题(见上文)。
提供额外的道德哲学能力:伦理化身不仅可以了解从具体人物那里学到的价值观/道德态度/原则,而且还具有更深入的一般道德哲学知识(存储在与其他虚拟化身共享的单独存储器中)。借助这些知识,它可以在与此人的训练对话中使人对更深入的道德问题变得更加敏感,并更明智地提出问题。通过这种方式,虚拟化身将不仅仅是一个仅学习此人态度的、纯粹被动接受的实体。此外,它还将是一个有自己道德理解能力的对象,然而,只有在此人对它进行训练的过程中,它才会动用这种道德能力。当它在训练完成后回答关于它所代表的真人的道德态度的问题时,它将忠实于此人的表述,而不动用它自己的一般道德哲学知识。
→优点:许多人最初并不知道自己的道德态度能够解决问题的程度。伦理化身的道德能力使它们能够在训练对话期间对这些人明智地提问,而不会损害他们的决策自主权。此外,通过这种途径(通过与他们的虚拟化身进行对话)还可以鼓励感兴趣的人对反应特征(如道德)进行深入思考,并训练自己的道德判断力。
对于在本发明的不同实施方案中实现本发明而言,在以上说明书、附图和权利要求中公开的本发明的特征可以单独地、以组合的方式或以部分组合的方式构成本发明的重要内容。

Claims (20)

1.一种用于处理对包含多个人的医学样本数据和/或样本的数据库的搜索查询的方法,包括以下步骤:
向AI处理器装置中输入包含需求概述的搜索查询,旨在找到至少一个包含具有预定的查询搜索参数的样本数据的样本,
利用所述AI处理器装置搜索至少一个选定的样本,其中,所述至少一个选定的样本至少以规定的概率满足所述需求概述,以及
输出所述至少一个选定的样本的识别数据。
2.根据权利要求1所述的方法,其中,利用所述AI处理器装置搜索一组选定的样本,其中,所有选定的样本都至少以规定的概率满足所述需求概述。
3.根据权利要求2所述的方法,其中,将这组选定的样本的识别数据与排序信息(定位信息)一起输出,所述排序信息为每个选定的样本分配满足需求概述的命中概率。
4.根据以上权利要求中任一项所述的方法,包括步骤:
输出额外的评级搜索参数,评级搜索参数与搜索查询匹配,使得能够选出一组以更高的命中概率满足需求概述的样本。
5.根据权利要求4所述的方法,其中,评级搜索参数包括基因图谱、关于临床治疗的数据、病史、家庭疾病倾向、个人诊断结果、生活方式习惯的特征、饮食习惯、消费行为、运动和锻炼特征、关于吸食药品或其他麻醉品的数据、关于药物摄入的数据、关于辐射暴露的数据、表观遗传学数据、地理信息、年龄、性别、种族、过敏和/或精神疾病。
6.根据以上权利要求中任一项所述的方法,其中,所述需求概述旨在找到一组包含样本数据的样本,其中,属于这一组样本的人构成受试者群体。
7.根据以上权利要求中任一项所述的方法,其中,所述AI处理器装置处理来自专业文献的信息、来自工业部门的商业市场信息、尤其是关于医药品的信息、和/或来自关于医药品的批准数据库的信息。
8.根据以上权利要求中任一项所述的方法,包括以下步骤:
利用编码函数将搜索查询转换为分段的搜索查询。
9.根据以上权利要求中任一项所述的方法,包括以下步骤:
请求相关人员同意使用数据和/或样本。
10.根据权利要求9所述的方法,其中,通过使用问卷和/或知情同意书和/或由虚拟化身设备来请求同意。
11.根据以上权利要求中任一项所述的方法,包括以下步骤:
输出信息,尤其是向其样本数据存储在数据库中的人输出信息,其中,输出的信息涉及医药品、疾病、研究结果和/或行动建议。
12.一种搜索平台设备,其被配置用于处理包含多个人的医学样本数据和/或样本的数据库的搜索查询,包括:
输入装置,其被设置用于接收含有需求概述的搜索查询,旨在找到至少一个包含具有预定的查询搜索参数的样本数据的样本,
AI处理器装置,其与输入装置耦合并被配置用于搜索至少一个选定样本,其中,所述至少一个选定的样本至少以规定的概率满足所述需求概述,以及
输出装置,其设置成用于输出所述至少一个选定的样本的识别数据。
13.根据权利要求12所述的搜索平台设备,其中,所述AI处理器装置被设置用于搜索一组选定的样本,其中,所有选定的样本都至少以规定的概率满足需求概述。
14.根据权利要求13所述的搜索平台设备,其中,所述AI处理器装置被设置用于生成这组选定的样本的识别数据,包括排序信息,排序信息为每个选定的样本分配满足需求概述的命中概率。
15.根据权利要求12至14中任一项所述的搜索平台设备,其中,所述AI处理器装置被设置用于生成额外的评级搜索参数,评级搜索参数与搜索查询匹配,使得能够选出一组以更高的命中概率满足需求概述的样本。
16.根据权利要求15所述的搜索平台设备,其中,评级搜索参数包括基因图谱、关于临床治疗的数据、病史、家庭疾病倾向、个人诊断结果、生活方式习惯的特征、饮食习惯、消费行为、运动和锻炼特征、关于吸食药品或其他麻醉品的数据、关于药物摄入的数据、关于辐射暴露的数据、表观遗传学数据、地理信息、年龄、性别、种族、过敏和/或精神疾病。
17.根据权利要求12至16中任一项所述的搜索平台设备,其中,所述AI处理器装置被设置用于处理来自专业文献的信息、来自工业部门的商业市场信息、尤其是关于医药品的信息、和/或来自关于医药品的批准数据库的信息。
18.根据权利要求12至17中任一项所述的搜索平台设备,包括:编码装置,其被设置用于将搜索查询通过编码函数转换为分段的搜索查询。
19.根据权利要求12至18中任一项所述的搜索平台设备,其中,所述AI处理器装置被设置用于请求相关人员同意使用数据和/或样本。
20.根据权利要求19所述的搜索平台设备,其中,所述AI处理器装置被设置用于通过使用问卷和/或知情同意书和/或由虚拟化身设备来请求同意。
CN202080107876.XA 2020-12-11 2020-12-11 医学样本数据和/或样本数据库的搜索查询处理方法和搜索平台设备 Pending CN116648701A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2020/085818 WO2022122172A1 (de) 2020-12-11 2020-12-11 Verfahren und suchplattform-vorrichtung zur verarbeitung von suchanfragen an eine datenbank, die medizinische probendaten und/oder proben enthält

Publications (1)

Publication Number Publication Date
CN116648701A true CN116648701A (zh) 2023-08-25

Family

ID=74125148

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080107876.XA Pending CN116648701A (zh) 2020-12-11 2020-12-11 医学样本数据和/或样本数据库的搜索查询处理方法和搜索平台设备

Country Status (6)

Country Link
US (1) US20240004887A1 (zh)
EP (1) EP4260327A1 (zh)
JP (1) JP2024501194A (zh)
KR (1) KR20230156302A (zh)
CN (1) CN116648701A (zh)
WO (1) WO2022122172A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10796781B2 (en) * 2015-12-07 2020-10-06 Clarapath, Inc. Spatial genomics with co-registered histology
WO2020233851A1 (de) 2019-05-21 2020-11-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kopplung von mehreren künstlich lernenden einheiten mit einer projektionsebene

Also Published As

Publication number Publication date
EP4260327A1 (de) 2023-10-18
KR20230156302A (ko) 2023-11-14
WO2022122172A1 (de) 2022-06-16
JP2024501194A (ja) 2024-01-11
US20240004887A1 (en) 2024-01-04

Similar Documents

Publication Publication Date Title
Balkin et al. Counseling research: A practitioner-scholar approach
JP6951585B2 (ja) 個人、オミックス、およびフェノタイプデータのコミュニティ集約プラットフォーム
Gaziano et al. Million Veteran Program: A mega-biobank to study genetic influences on health and disease
US8010400B2 (en) System and method for using psychological significance pattern information for matching with target information
Kim et al. Norms of data sharing in biological sciences: The roles of metadata, data repository, and journal and funding requirements
CN107533586A (zh) 用于加强生物信息学数据隐私和实现生物信息学数据广泛共享的系统、方法和设备
US20130101970A1 (en) System and method for using psychological significance pattern information for matching with target information
US20140100874A1 (en) Method for displaying linked family health history on a computing device
M’charek et al. Equal before the law: On the machinery of sameness in forensic DNA practice
Burke et al. Informed consent in translational genomics: insufficient without trustworthy governance
Müller et al. Conversational agents in healthcare: using QCA to explain patients’ resistance to chatbots for medication
US20030073124A1 (en) System, method, and apparatus for submitting genetic samples and receiving genetic testing results anonymously
Koyuncugil et al. Donor research and matching system based on data mining in organ transplantation
Neigel et al. The role of trust and automation in an intelligence analyst decisional guidance paradigm
Nelson et al. The social life of DTC genetics: The case of 23andMe
CN116648701A (zh) 医学样本数据和/或样本数据库的搜索查询处理方法和搜索平台设备
McMillan Boyles et al. Representations of clinical practice guidelines and health equity in healthcare literature: An integrative review
US20240005580A1 (en) Avatar apparatus and method for representing a person and for processing person-related data of the person
PARK et al. A study of bioethical knowledge and perceptions in Korea
Tibbetts Should Individuals Share Their Genomic Profiles? Researchers and patient advocates wrestle with privacy and ethical concerns.
Mittos Analyzing the privacy and societal challenges stemming from the rise of personal genomic testing
Farber et al. The future of mental health informatics
Dakubo et al. Ethical considerations in biomarker development
AU2001277263A1 (en) System and method for using psychological significance pattern information for matching with target information
Espérance Comparison of artificial intelligence and health data usage in healthcare public services between France and Sweden

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination