CN113257377A - 确定目标用户的方法、装置、电子设备及存储介质 - Google Patents

确定目标用户的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113257377A
CN113257377A CN202110625940.XA CN202110625940A CN113257377A CN 113257377 A CN113257377 A CN 113257377A CN 202110625940 A CN202110625940 A CN 202110625940A CN 113257377 A CN113257377 A CN 113257377A
Authority
CN
China
Prior art keywords
nano
information
user
determining
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110625940.XA
Other languages
English (en)
Other versions
CN113257377B (zh
Inventor
杨铭
时雷
陆峰
高也
蔡彬睿
乔臻
褚文东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lianren Healthcare Big Data Technology Co Ltd
Original Assignee
Lianren Healthcare Big Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lianren Healthcare Big Data Technology Co Ltd filed Critical Lianren Healthcare Big Data Technology Co Ltd
Priority to CN202110625940.XA priority Critical patent/CN113257377B/zh
Publication of CN113257377A publication Critical patent/CN113257377A/zh
Application granted granted Critical
Publication of CN113257377B publication Critical patent/CN113257377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Databases & Information Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明实施例公开了一种确定目标用户的方法、装置、电子设备及存储介质,所述方法包括:获取多个待选择用户的病历信息,并基于预先生成的目标纳排规则确定与每个病历信息相关联的至少一个病症描述标签;其中,纳排规则是基于各个待研发项目所对应的文本内容确定的;将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息;其中,所述待确定用户关联信息中包括用户标识、用户基本信息、与所述用户标识相对应的病历信息以及所述病历信息的病症描述标签;根据预设待匹配标签信息和所述至少一个待确定用户关联信息,确定目标用户,提高确定目标用户的准确性和效率。

Description

确定目标用户的方法、装置、电子设备及存储介质
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种确定目标用户的方法、装置、电子设备及存储介质。
背景技术
随着现今药物技术和医疗技术的飞速发展,临床试验的需求逐渐增加,使得对临床试验的受试者需求越来越多。
目前,在受试者招募过程中,通过需要医生推荐、或者通过查找受试者在医院的病历信息等确认与临床试验相匹配的受试者。
医生推荐是指医生根据自己的经验,确定受试者并推荐给与临床试验项目相关的研究人员。受试者的确定带有一定的主观性,相同的临床试验项目,由不同医生推荐的受试者可能不相同,因此,由医生推荐的方式可能导致受试者与临床试验项目匹配的不够准确。通过查找病历信息,需要查阅大量患者的病历信息,耗时长,由于是人工查找病历信息,人工成本较高,并且人为查找病历信息造成病历信息与临床试验项目匹配的误差较大。
发明内容
本发明实施例提供一种确定目标用户的方法、装置、电子设备及存储介质,以实现确定医院中临床试验项目的目标用户,提高目标用户确定的效率和准确性。
第一方面,本发明实施例提供了一种确定目标用户的方法,所述方法包括:
获取多个待选择用户的病历信息,并基于预先生成的目标纳排规则确定与每个病历信息相关联的至少一个病症描述标签;其中,纳排规则是基于各个待研发项目所对应的文本内容确定的;
将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息;其中,所述待确定用户关联信息中包括用户标识、用户基本信息、与所述用户标识相对应的病历信息以及所述病历信息的病症描述标签;
根据预设待匹配标签信息和所述至少一个待确定用户关联信息,确定目标用户。
第二方面,本发明实施例还提供了一种确定目标用户的装置,所述装置包括:
病历信息获取模块,用于获取多个待选择用户的病历信息,并基于预先生成的目标纳排规则确定与每个病历信息相关联的至少一个病症描述标签;其中,纳排规则是基于各个待研发项目所对应的文本内容确定的;
用户关联信息确定模块,用于将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息;其中,所述待确定用户关联信息中包括用户标识、用户基本信息、与所述用户标识相对应的病历信息以及所述病历信息的病症描述标签;
目标用户确定模块,用于根据预设待匹配标签信息和所述至少一个待确定用户关联信息,确定目标用户。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例任一所述的确定目标用户的方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例任一所述的确定目标用户的方法。
本发明实施例的技术方案,通过获取多个待选择用户的病历信息,基于预先生成的目标纳排规则确定与每个病历信息相关联的至少一个病症描述标签,将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息,根据预设待匹配标签信息和至少一个待确定用户关联信息,确定目标用户。通过本发明实施例的技术方案实现根据标签筛选模型对待选择用户进行初步筛选,确定待确定用户,根据预设待匹配标签信息和待确定用户关联信息,确定目标用户,提高了目标用户确定的准确性和效率。
附图说明
为了更加清楚地说明本发明示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本发明所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
图1为本发明实施例一中的一种确定目标用户的方法的流程示意图;
图2为本发明实施例一中的一种待确定用户关联信息显示的示意图;
图3为本发明实施例二中的一种确定目标用户的方法的流程示意图;
图4为本发明实施例二中的一种确定待处理纳排指标的示意图;
图5为本发明实施例二中的一种确定目标纳排规则的示意图;
图6为本发明实施例三中的一种确定目标用户的方法的流程示意图;
图7为本发明实施例四中的一种确定目标用户的方法的流程示意图;
图8为本发明实施例五中的一种确定目标用户的方法的流程示意图;
图9为本发明实施例五中的一种确定目标纳排规则的流程示意图;
图10为本发明实施例五中的一种生成数据存储模型的示意图;
图11为本发明实施例五中的一种确定目标用户的方法的流程示意图;
图12为本发明实施例五中的一种确定诊断名称的方法流程示意图;
图13为本发明实施例六中的一种确定目标用户的装置的结构示意图;
图14为本发明实施例七中的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例所提供的一种确定目标用户的方法的流程示意图,本实施例可适用于对临床试验项目进行患者招募的情况,该方法可以由确定目标用户的装置来执行,该装置可以通过软件和/或硬件的形式实现。
在阐述本发明实施例的技术方案之前,先对本发明实施例的应用场景进行简单说明:
本发明实施例适用于对临床试验项目的患者进行招募的场景,临床试验是指通过受试人体进行药物的系统性研究,以确定试验药物的疗效和安全性。受试人体是指病人的病历、身体状况、年纪等都符合临床试验项目要求的患者。在本发明实施例中是指目标用户。通过本发明实施例的技术方案可以通过待选择用户的病历信息确定与临床项目相符合的目标用户,提高确定目标用户的准确性和高效性。
如图1所述,本发明实施例的确定目标用户的方法,具体包括如下步骤:
S110、获取多个待选择用户的病历信息,并基于预先生成的目标纳排规则确定与每个病历信息相关联的至少一个病症描述标签。
其中,待选择用户是指在医院中具有就诊记录的患者。病历信息是指待选择用户在医院中就诊的信息,比如电子病历系统(Electronic Medical Record,EMR)中待选择用户的病历记录、医院信息系统(Hospital Information System,HIS)中的患者的就诊信息、影像归档和通信系统(Picture Archiving and Communication Systems,PACS)中存储的待选择用户的各种医学影像数据等。纳排规则是基于各个待研发项目所对应的文本内容确定的。待研发项目也就是临床试验项目。文本内容是指与待研发项目相关联的内容,比如待研发项目的研究内容、待研发项目对于患者的要求等。目标纳排规则是指与当前的目标研发项目相对应的纳排规则。病症描述标签是指基于待选择用户的病历信息确定的描述待选择用户的病症情况的标签。比如,高血糖、胰岛素等。需要说明的是,这里的病症描述标签,不局限于待选择用户的病症信息,还有待选择用户的用药信息、治疗信息以及治疗后的身体状况信息等。
具体的,获取多个待选择用户的病历信息。可选的,可以基于医院中的不同的系统(EMR、HIS、PACS等)获取待选择用户的病历信息。这样获取到的病历信息可以更加全面的表征待选择用户的病症状态以及当前的身体状况。进而与病历信息相关联的至少一个病症描述标签可以更加准确的描述待选择用户的病症情况。使得基于病症描述标签确定的目标用户更加准确。
S120、将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息。
其中,标签筛选模型属于二分类模型,用于根据病症描述标签确定待确定用户,将病症描述标签输入至标签筛选模型中,输出结果可以是待确定用户的标识(比如是)以及不是待确定用户的标识(比如否)。待确定用户关联信息中包括用户标识、用户基本信息、与所述用户标识相对应的病历信息以及所述病历信息的病症描述标签。用户标识是指可以将区分不同待确定用户的标识。用户标识的具体表现形式可以是数字、英文字母、特殊字符等。用户基本信息是指用户的年纪、学历、性别、家庭住址等。用户基本信息用于对待确定用户进行分类,比如,可以通过用户基本信息中的年纪,将待确定用户分为不同年纪组,针对每个年纪组确定不同的预设待匹配标签信息,以确定各个年纪阶段的目标用户,或者,根据当前项目需求,有针对性的对不同年纪组的目标用户进行不同的临床试验(比如,不同的用药量、试验周期等),使得临床试验项目的试验数据更加全面更加有针对性。
具体的,将与每个病历信息相关联的至少一个病症描述标签输入至标签筛选模型中,得到至少一个待确定用户关联信息。可选的,可以在显示界面上显示待确定用户关联信息,以供研究人员或者医生对待确定用户关联信息进行确认。图2为示例性的待确定用户关联信息的显示内容,在显示界面中显示有当前项目:盐酸替扎尼定预防性治疗偏头痛的临床研发项目,在当前项目下显示有待确定用户关联信息包括:用户标识、用户基本信息(性别、年纪、联系电话)以及对应的病历信息的病症描述标签。可选的,病历信息可以是点击病历信息获取按键时,在当前页面中弹出一个对话框,用于显示对应的待确定用户的病历信息。
S130、根据预设待匹配标签信息和所述至少一个待确定用户关联信息,确定目标用户。
需要说明的是,在对标签筛选模型进行设置时,基于当前项目需求(或者与当前项目对应的人文内容)设置了对应的标签信息,包括预设待匹配标签信息。预设待匹配标签信息包括设置了权重的标签信息、从标签信息中挑选出来的一部分标签信息(根据专家经验确定的)等中的任意一项。预设待匹配标签信息包括用户基本信息标签、既往史标签以及类别标签中的至少一种。用户基本信息标签是指用户的学历标签、性别标签、年纪标签等。既往史标签是指用户以往的身体健康信息和过去的患病信息。类别标签是指用户的病历属于的类别,比如,心血管类、血液类、神经类等。目标用户是指与当前项目相匹配的用户。
具体的,根据预设待匹配标签信息和至少一个待确定用户关联信息确定目标用户的方式,可以是将预设待匹配标签信息和至少一个待确定用户关联信息以向量的形式进行表示,基于欧式距离、余弦距离、曼哈顿距离、切比雪夫距离等计算向量之间的距离,以根据预设待匹配标签信息对应的向量和每个待确定用户关联信息的向量之间的距离确定二者的匹配度。
本发明实施例的技术方案,通过获取多个待选择用户的病历信息,基于预先生成的目标纳排规则确定与每个病历信息相关联的至少一个病症描述标签,将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息,根据预设待匹配标签信息和至少一个待确定用户关联信息,确定目标用户。通过本发明实施例的技术方案实现根据标签筛选模型对待选择用户进行初步筛选确定待确定用户,根据预设待匹配标签信息和待确定用户关联信息,最终确定目标用户,提高了目标用户确定的准确性和高效性。
在上述技术方案的基础上,本发明实施例的技术方案还包括:获取不同病症信息所对应的诊断标准,得到诊断规则,以基于所述诊断规则确定各病历信息所对应的目标诊断结果;基于所述目标诊断结果,更新所述目标用户。
其中,病症信息是指患者患有疾病时,在身体上表现出来的身体表征信息(外表表现的症状信息以及通过仪器测出来的信息)。应当理解,不同疾病的病症信息存在差异,诊断标准是指根据病症信息确定对应的疾病名称、严重程度的标准。诊断规则是指根据不同病症信息对应的诊断标准,确定的规则,用于确定病历信息对应的诊断结果。诊断结果包括疾病名称、严重程度等。
具体的,获取不同病症信息所对应的诊断标准,可以从医院的系统中获取,或者基于医生的经验进行总结。根据诊断标准确定诊断规则。基于诊断规则确定各病历信息对应的目标诊断结果,也就是疾病的名称,严重程度等信息,在临床试验过程中,诊断结果可以更加直观的描述用户的病症情况,所以可以基于目标诊断结果更新目标用户,以使确定的目标用户更加准确。
实施例二
图3是本发明实施例提供的一种确定目标用户的方法的流程示意图,本发明实施例在上述实施例的可选方案的基础上增加了生成目标纳排规则的步骤,具体增加的内容将在本发明实施例中进行详细的叙述。其中,与上述实施例相同或者相似的技术术语将不再赘述。
如图3所述,本发明实施例所提供的确定目标用户的方法具体包括如下步骤:
S210、获取与各个待研发项目相对应的待处理纳排文本。
其中,待处理纳排文本与待研发项目的项目内容相匹配,比如待研发项目可以是盐酸替扎尼定预防性治疗偏头痛的临床研发项目,此时,待处理纳排文本可以表示为:符合2018年国际学会的头痛分类法第三版(ICHD-3)先兆偏头痛和无先兆偏头痛诊断标准和2016年中国偏头痛防治指南偏头痛预防性治疗、头颅、电子计算机断层扫描(CT)或者磁共振成像(MRI)阴性、神经查体(—)性等。应当理解,不同的研发项目对应的待处理纳排文本可以相同也可以不同。
具体的,获取与各个待研发项目相对应的待处理纳排文本,为后续进行待处理纳排指标的确定做准备工作。
在本发明实施例中,所述获取与各个待研发项目相对应的待处理纳排文本,包括:根据每个待研发项目的项目名称,确定与所述待研发项目相对应的文本信息,并将所述文本信息作为待处理纳排文本。
其中,与待研发项目相对应的文本信息与上述实施例的步骤110中的文本内容含义相同,具体解释详见上述实施例,这里不做具体说明。
具体的,根据待研发项目的项目名称,确定与之相对应的文本信息,将该文本信息作为待处理纳排文本,以基于待处理纳排文本确定的纳排规则更加符合待研发项目的项目需求。
S220、通过对各待处理纳排文本进行拆解处理,得到与每个待处理纳排文本相对应的至少一个待处理纳排指标。
其中,待处理纳排指标是指待处理纳排文本中关键词,比如,头痛、神经查体结果为阴性等。
具体的,将各待处理纳排文本进行拆解处理,拆解处理的方式可以是根据预先设置的拆解算法对纳排文本进行拆解。预先设置纳排指标的命名规范,比如,结合专家经验或者从网上获取的纳排指标的命名规范。之后基于预先设置的拆解算法对纳排文本进行拆解,并基于命名规范对纳排文本进行重新命名。可选的,通过获取临床试验的纳排标准,建立原始知识库,原始知识库中包括纳排指标对应的同义词和/或多义词,词语之间的上下级关系等,根据拆解算法对待处理纳排文本进行拆解后,基于原始知识库和纳排指标的命名规范确定每个待处理文本相对应的至少一个待处理纳排指标。比如,待处理纳排文本可以表示为:符合2018年国际学会的头痛分类法第三版(ICHD-3)先兆偏头痛和无先兆偏头痛诊断标准和2016年中国偏头痛防治指南偏头痛预防性治疗、头颅、电子计算机断层扫描(CT)或者磁共振成像(MRI)阴性、神经查体(—)性。与该待处理纳排文本相对应的待处理纳排指标包括:1、患有偏头痛;2、头颅CT阴性且神经查体阴性,参见图4。
在本发明实施例中,所述通过对各待处理纳排文本进行拆解处理,得到与每个待处理纳排文本相对应的至少一个待处理纳排指标,包括:获取与不同待研发项目相对应的纳排标准,并通过对纳排标准中的文本进行拆分处理,得到与每个纳排标准相对应的至少一个关联词汇;其中,所述至少一个关联词汇中包括同义词汇以及上下位词汇;基于与每个纳排标准相对应的至少一个关联词汇,确定原始知识库;通过对各待处理纳排文本进行分词处理,得到至少一个待使用词汇,基于所述原始知识库中的关联词汇对各待处理纳排文本进行标注,并按照预设命名规范,得到与每个待处理纳排文本相对应的纳排指标。
其中,纳排标准是指现有的确定临床试验项目对应用户的选择标准。随着医学的发展,现有的纳排标准已无法实现有针对性的对多种多样的临床试验项目进行目标用户的确定,因此,需要对纳排标准进行处理,得到每个纳排标准的关联词汇,基于关联词汇形成原始知识库,根据原始知识库确定纳排指标。纳排标准的获取方式可以在相应的网站上进行爬取。原始知识库中存储有与纳排标准对应的至少一个关联词汇。关联词汇包括同义词汇、上下位词汇等,与纳排标准对应的关联词汇的确定方式包括但不限于神经网络算法,决策树分类算法等。应当理解,原始知识库的存储的内容可以随时进行更新,比如,在预设周期内,在网站上进行重复的爬取操作,得到纳排标准,并得到与纳排标准相对应的至少一个关联词汇,以基于纳排标准和对应的至少一个关联词汇更新原始知识库。预设命名规范是指纳排指标的命名规范,可以是基于专家经验设置的,也可以是在相应的网站上获取的命名规范。
具体的,获取与不同待研发项目相对应的纳排标准,对纳排标准中的文本进行拆分处理,得到与每个纳排标准相对应的至少一个关联词汇。对纳排标准中的文本进行拆分的方式,可以通过现有技术中的文本拆分算法。根据关联词汇确定原始知识库。对待处理纳排文本进行分词处理后,得到至少一个待使用词汇,根据原始知识库中的关联词汇对各待使用词汇进行标注,按照预设命名规范,得到与每个待处理纳排文本相对应的纳排指标。
S230、通过对每个待处理纳排指标进行规则化处理,得到与所述待处理纳排指标相对应的目标纳排规则。
具体的,对每个待处理纳排指标进行规则化处理方式,根据纳排规则书写规范,对待处理纳排指标进行拆分,得到待处理纳排规则片段并对待处理纳排规则片段按照预设片段组合方式进行排列组合,得到与待处理纳排指标对应的目标纳排规则。待处理纳排指标拆解为目标纳排规则的示例性显示,参见图5。
S240、获取多个待选择用户的病历信息,并基于预先生成的目标纳排规则确定与每个病历信息相关联的至少一个病症描述标签。
S250、将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息。
S260、根据预设待匹配标签信息和所述至少一个待确定用户关联信息,确定目标用户。
本发明实施例的技术方案,通过获取与各个待研发项目相对应的待处理纳排文本,并对各待处理纳排文本进行拆解处理,得到与每个待处理纳排文本相对应的至少一个待处理纳排指标,通过对每个待处理纳排指标进行规则化处理,得到与待处理纳排文本相对应的目标纳排规则,基于目标纳排规则确定每个待选择用户的病历信息相关联的至少一个病症描述标签。将各病历信息的至少一个病症描述标签输入至与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息,根据预先设置的待匹配标签信息和至少一个待确定用户关联信息,确定目标用户。本发明实施例的技术方案通过获取与当前项目的文本信息相匹配的待处理纳排文本,确定待处理纳排指标,以进一步确定目标纳排规则,提高了目标纳排规则的针对性。基于目标纳排规则确定病历信息对应的至少一个病症描述标签可以更加符合当前项目的需求,进而从整体上提高了目标用户确定的准确性。
实施例三
图6是本发明实施例提供的一种确定目标用户的方法的流程示意图,本发明实施例在上述实施例的可选方案的基础上增加了对步骤210的细化过程,具体的细化过程将在本发明实施例中进行详细的叙述。其中,与上述实施例相同或者相似的技术术语将不再赘述。
如图6所述,本发明实施例所提供的确定目标用户的方法具体包括如下步骤:
S310、获取与各个待研发项目相对应的待处理纳排文本。
S320、通过对各待处理纳排文本进行拆解处理,得到与每个待处理纳排文本相对应的至少一个待处理纳排指标。
S330、确定每个待处理纳排指标的至少一个待处理纳排规则,并确定所述至少一个待处理纳排规则所对应的类别标识。
其中,类别包括基本信息、诊断类、用药类、检验类、症状类等,类别标识用于区分不同类别。类别标识的表现形式可以是数字、英文字母、特殊字符等。
具体的,待处理纳排规则包括至少一个待处理纳排指标,有些待处理纳排规则中包括相同的待处理纳排规则,因此通过每个待处理纳排指标可以确定至少一个待处理纳排规则。并确定至少一个待处理纳排规则对应的类别标识,为后续确定目标纳排规则做准备工作。
S340、针对每个类别标识,确定与当前类别标识相对应的待处理纳排规则的至少一种规范片段和片段组合方式。
其中,规范片段是指根据不同类别标识,确定与当前类别标识对应的待处理纳排规则的片段。片段组合方式是指至少一个规范片段进行排列组合的方式,比如先后顺序等。
具体的,确定与当前类别标识对应的待处理纳排规则的至少一个规范片段和片段组合方式。确定规范片段的方式可以是通过预先设置的规则书写规范来确定规范片段。
S350、基于各片段组合方式对相应的至少一个规范片段进行组合,得到所述目标纳排规则。
具体的,根据片段组合方式和对应的至少一个规范片段进行组合,得到目标纳排规则,使不同的待研发项目对应着不同的纳排规则,提高纳排规则确定的准确性。
在本发明实施例中,在基于各片段组合方式对相应的至少一个规范片段进行组合之后,得到所述目标纳排规则之前,还包括:确定与不同类别标识相对应的SQL书写规范,将基于各片段组合方式对相应的至少一种规范片段按照相应的SQL书写规范进行组合书写,得到SQL规范;基于所述SQL规范,确定所述目标纳排规则。
其中,SQL书写规范是指将待处理规则转换为SQL语音的书写规范。需要说明的是,为了提高计算机的处理速度,进而设置了SQL书写规范。SQL书写规范可以是字母大小写、表名和/或列名的书写顺序等。SQL规范是指根据片段组合方式和对应的至少一个规范片段确定的规范。
具体的,确定与不同类别标识对应的SQL书写规范,根据片段组合方式对相对应的至少一个规范片段进行处理,并将处理的结果进行SQL书写规范化处理,得到SQL规范;或者,在根据片段组合方式对相对应的至少一个规范片段进行处理时,按照SQL书写规范进行组合书写,直接得到SQL规范。之后根据SQL规范得到目标纳排规则。通过SQL规范的方式可以提高计算机的处理速度,进而从整体上提高目标用户的确定速度。
在本发明实施例中,本发明实施例的技术方案还包括:建立所述规范片段、片段组合方式以及预先创建的数据存储模型之间的对应关系,以基于所述对应关系从所述数据存储模型中确定目标用户。
其中,数据存储模型是指对用户的病历信息进行存储的模型。数据存储模型可以是基于概念数据模型(Conceptual Data Model,CDM)构建的。规范片段、片段组合方式和预先创建的数据存储模型之间的对应的关系可以是对应关系,设置映射表,表中包括规范片段的标识、片段组合方式的标识以及数据存储模型中存储的待确定用户的病历信息的位置信息。
具体的,建立规范片段、片段组合方式和预先创建的数据存储模型之间的对应的关系,基于当前项目确定规范片段和片段组合方式,以基于规范片段和片段组合方式以及对应关系,从数据存储模型中存储的待确定用户的病历信息中确定目标用户。
在本发明实施例中,所述建立所述规范片段、片段组合方式以及预先创建的数据存储模型之间的对应关系,包括:获取多个医疗平台的医疗数据,基于预先设置的结构化模板对所述医疗数据进行处理,得到标准化医疗数据,并将所述标准化医疗数据按照预设字段存储至相应的存储空间,得到所述数据存储模型;建立所述规范片段、片段组合方式以及所述数据存储模型中预设字段之间的对应关系,以基于所述对应关系从所述数据存储模型中获取目标用户。
其中,医疗平台是指电子病历系统(Electronic Medical Record,EMR)、医院信息系统(Hospital Information System,HIS)、影像归档和通信系统(Picture Archivingand Communication Systems,PACS)、实验室信息管理系统(Laboratory InformationManagement System,HIS)、计算机化医生医嘱录入系统(computerized physician orderentry,CPOE)等。医疗数据包括医疗影像数据、诊断证明、电子病历数据等。结构化模板用于对医疗数据进行数据映射、归一化、结构化等处理,统一医疗数据的格式。存储空间是指在CDM中的存储区域,将标准化医疗数据进行存储后,得到数据存储模型。预设字段是指预先设置的每个存储空间中存储的字段的大小。
具体的,通过获取多个医疗平台的医疗数据,得到每个待处理用户对应的多个医疗数据。之后基于预先设置的结构化模板对医疗数据进行处理,得到标准化医疗数据。由于不同医院的医疗平台中对于数据的存储的格式,数据的表现形式有所不同,所以进行结构化处理,统一医疗数据的格式,为后续处理做准备工作。将标准化医疗数据按照预设字段存储至相应的存储空间中,设置每个存储空间存储的字段大小,便于整理标准化医疗数据。建立规范片段、片段组合和数据存储模型中预设字段之间的对应关系,基于对应关系可以准确的从数据存储模型提取出需要的目标用户,由于对应关系是规范片段、片段组合方式和预设字段的对应关系,提高可确定目标用户的准确性和高效性。
S360、获取多个待选择用户的病历信息,并基于预先生成的目标纳排规则确定与每个病历信息相关联的至少一个病症描述标签。
S370、将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息。
S380、根据预设待匹配标签信息和所述至少一个待确定用户关联信息,确定目标用户。
本发明实施例的技术方案,通过获取与各个待研发项目相对应的待处理纳排文本,并对各待处理纳排文本进行拆解处理,得到与每个待处理纳排文本相对应的至少一个待处理纳排指标,确定每个待处理纳排指标的至少一个待处理纳排规则,确定至少一个待处理纳排规则对应的类别标识,针对每个类别标识,确定与当前类别标识相对应的待处理纳排规则的至少一个规范片段和片段组合方式,基于各片段组合方式对相应的至少一个规范片段进行组合,得到目标纳排规则,基于目标纳排规则确定每个待选择用户的病历信息相关联的至少一个病症描述标签。将各病历信息的至少一个病症描述标签输入至与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息,根据预先设置的待匹配标签信息和至少一个待确定用户关联信息,确定目标用户。本发明实施例的技术方案通过获取与当前项目的文本信息相匹配的待处理纳排文本,确定待处理纳排指标以及确定每个待处理纳排指标的至少一个待处理纳排规则,基于知乎搜啊一个待处理纳排规则确定目标纳排规则,提高了目标纳排规则的针对性,基于目标纳排规则确定的病历信息对应的至少一个病症描述标签可以更加符合当前项目的需求,进而提高了目标用户确定的准确性和高效性。
实施例四
图7是本发明实施例提供的一种确定目标用户的方法的流程示意图,本发明实施例在上述实施例的可选方案的基础上增加了对步骤110和120的细化过程,具体的细化过程将在本发明实施例中进行详细的叙述。其中,与上述实施例相同或者相似的技术术语将不再赘述。
如图7所述,本发明实施例所提供的确定目标用户的方法具体包括如下步骤:
S410、获取多个待选择用户的病历信息。
S420、根据预先生成的目标纳排规则,确定每个病历信息所对应的纳排规范;基于所述纳排规范确定与每个病历信息相关联的至少一个病症描述标签。
其中,纳排规范是指目标纳排规则中包括的纳排信息。应当理解,待选择用户的病历信息在数据存储模型中进行存储时,是以预设字段的形式进行存储的,并且,病历信息的字段(包括病症描述标签)与纳排规范之间存在对应关系,根据纳排规范和对应关系可以确定病历信息中的字段。
具体的,根据目标纳排规则确定每个病历信息对应的纳排规范,基于纳排规范确定与病历信息相关联的至少一个病症描述标签,可以是根据纳排规范和纳排规范与病历信息之间的对应关系,从数据存储模型中获取与病历信息相关联的至少一个病症描述标签。通过纳排规范确定病历信息对应的病症描述标签的方式可以提高病症描述标签的准确性和针对性。
S430、将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到与各病历信息相对应的实际输出值;基于各实际输出值和预设输出值,确定至少一个待确定用户关联信息。
其中,标签筛选模型的实际输出值可以是数字、字符等。比如,0、1,或者0.8,0.1等。预设输出值与实际输出值的格式相同。
具体的,将各病历信息的至少一个病症描述标签输入至与当前项目相匹配的标签筛选模型中,得到与各病历信息相对应的实际输出值,当实际输出值与预设输出值相同或者匹配度值大于预设值时,确定该实际输出值对应的待选择用户为待确定用户,并确定待确定用户关联信息。当预设输出值和实际输出值的表现形式为字符形式时,判断实际输出值和预设输出值相同时,确定实际输出值对应的待选择用户为待确定用户。当预设输出值和实际输出值的表现形式为数字的形式时,判断实际输出值和预设输出值的匹配度值大于预设值时(或者预设输出值为一个范围,当实际输出值在预设输出范围内时),确定实际输出值对应的待选择用户为待确定用户。
S440、根据预设待匹配标签信息和所述至少一个待确定用户关联信息,确定目标用户。
在本发明实施例中,所述根据预设待匹配标签信息和所述至少一个待确定用户关联信息,确定目标用户,包括:根据预设待匹配标签信息和每个待确定用户关联信息中病症描述标签之间的相似度值,确定目标用户。
具体的,预设待匹配标签信息和每个待确定用户关联信息中病症描述标签之间的相似度确定方式,可以将预设待匹配标签信息和至少一个待确定用户关联信息以向量的形式进行表示,基于欧式距离、余弦距离、曼哈顿距离、切比雪夫距离中的任意一项计算方式,计算向量之间的距离,以根据向量之间的距离确定预设待匹配标签信息和每个待确定用户关联信息的相似度值,当相似度值大于预设值时,确定对应的待确定用户为目标用户。
在本发明实施例中,所述根据预设待匹配标签信息和每个待确定用户关联信息中病症描述标签之间的相似度值,确定目标用户,包括:根据预设待匹配标签信息所对应的权重值以及预设待匹配标签信息和每个待确定用户关联信息中病症描述标签之间的相似度值,确定目标用户。
其中,预先将预设待匹配标签信息设置对应的权重值,至少一个预设待匹配标签信息的权重值与其他的预设待匹配标签信息的权重值不同。
具体的,根据每个预设待匹配标签信息对应的权重值和病症描述标签之间的相似度值,确定目标用户,在计算预设待匹配标签信息和每个待确定用户关联信息中病症描述标签之间的相似度值,将预设待匹配标签信息添加上对应的权重,这样计算出来的相似度值,更加具有符合当前项目的需求。可选的,将目标用户按照相似度值从高到低排列,并显示在显示界面上,同时在显示界面上显示有目标用户对应的病历信息、用户基本信息、与病历信息对应的病症描述标签等,供研究人员查看。
本发明实施例的技术方案,通过获取多个待选择用户的病历信息,根据预先生成的目标纳排规则,确定每个病历信息所对应的纳排规范,基于纳排规范确定与每个病历信息相关联的至少一个病症描述标签。将各病历信息的至少一个病症描述标签输入与当前项目相匹配的标签筛选模型中,得到与各病历信息相对应的实际输出值,基于各实际输出值和预设输出值,确定至少一个待确定用户关联信息。根据预设待匹配标签信息和至少一个待确定用户关联信息,确定目标用户。通过本发明实施例的技术方案实现根据标签筛选模型对待选择用户进行初步筛选确定待确定用户,根据预设待匹配标签信息和待确定用户关联信息,最终确定目标用户,提高了目标用户确定的准确性和高效性。
实施例五
图8是本发明实施例提供的一种确定目标用户的方法的流程示意图。本发明实施例上述实施例的一种可选方案,本发明实施例的确定目标用户的方法,首先获取医院的医疗数据和临床数据中心的受试者的信息,通过临床研究管理系统(现有技术中的管理系统)确定与临床试验项目相关的文本信息。之后,基于各临床试验项目信息和待选择用户的医疗数据建立数据存储模型,基于当前项目确定对应的数据存储模型,之后对待选择用户进行筛选,确定目标用户,并将目标用户通过移动终端或者显示界面显示的方式,推送相关的医疗人员。可选的,将目标用户、与目标用户相对应的病历信息,与目标用户对应的项目的文本信息等发送至临床研究管理系统,进行备案。下面将对本发明实施例进行详细的介绍:
1、确定纳排规则:首先确定纳排文本,将纳排文本拆解为纳排指标,之后将纳排指标拆解为纳排规则。
首先,确定各种临床试验项目的文本信息,这些文本信息也就是纳排文本。对纳排文本进行拆解,在拆解纳排文本前,需要先确定纳排指标的命名规范,结合医学专家和研究者的知识和经验制定。可以实现充分匹配,自我解释性,含义清晰确定,较好复用性,较好可读性。并建立原始知识库,首先爬取临床试验登记网站,获取临床试验的纳排标准,对纳排标准进行同义词和多义词的确定,以确定与纳排标准对应的至少一个关联词汇,将关联词汇存储在原始知识库中。
其次,通过预先设置的文本拆解算法对纳排文本进行拆解,得到至少一个待使用词汇,之后基于原始知识库中的关联词汇对各待使用词汇进行标注,按照命名规范对待使用词汇进行处理,得到每个纳排文本对应的纳排指标。需要说明的是,这里的文本拆解算法是对纳排文本进行分词处理,可以预先爬取临床试验登记网站,获取临床试验的纳排标准,对纳排文本进行标注,分词,确定词类,确定词语之间的修饰关系等,以对纳排文本进行拆解,确定待使用词汇。
最后,将纳排指标拆解为待处理纳排规则,构建标准数据模型(CDM),包括标准数据模型中医疗数据的存储空间的设置,以及在存储空间中医疗数据的预设字段。确定每个纳排指标对应的至少一个待处理纳排规则,之后确定每个待处理纳排规则对应的类别,比如基本信息、诊断类、用药类、检验类、症状类等,根据不同的类别标识确定待处理纳排规则对应的至少一个规范片段和对应的片段组合方式,根据片段组合方式和对应的至少一个规范片段的组合,得到待转换纳排规则,根据SQL书写规范将带转换纳排规则转换为SQL规范,基于SQL规范确定当前项目对应的目标纳排规则,参见图9。基于此,确定每个项目对应的纳排规则。
可选的,获取多个医院平台中的医疗数据,医疗平台包括但不限于EMR、HIS、PACS、HIS、CPOE。对这些医疗数据进行数据映射、归一化处理、结构化处理等,并处理后得到的标准化医疗数据按照预设字段存储在相应的存储空间中,得到数据存储模型,建立规范片段、数据存储模型中的预设字段以及片段组合方法的对应关系,确定目标用户。对标准数据模型中添加医疗数据,生成数据存储模型。参照CDISC和OHDIS标准,结合临床试验通用特性和中国医疗数据书写习惯,构建多个业务域,多个通用字段,建立标准数据模型。针对医院的医疗数据来自于不同的医疗平台,存在术语不统一,医疗平台之间无法关联的问题,现对接医疗平台,抽取医疗数据,进行数据映射、归一化、结构化等治理,构建临床试验通用的标准数据模型(CDM),将标准化医疗数据存储至CDM中,形成数据存储模型。数据存储模型的示意图参见图10。
在本发明实施例中,对于确定目标用户,可以基于待选择用户的病例信息,确定目标用户,参见图11,具体的,基于纳排规则确定与每个待选择用户的病例信息对应的至少一个病症描述标签,之后基于预先生成的与当前项目相关的标签筛选模型对至少一个病症描述标签进行处理,得到至少一个待处理用户的关联信息,包括用户标识、用户基本信息和用户的病症描述标签,在显示界面上进行显示,供相关的医疗人员选择。并将医疗人员选择的目标用户作为训练数据,对于当前项目对应的标签筛选模型进行迭代优化。或者,基于预设待匹配标签信息和每个待确定用户关联信息中病症描述标签之间的相似度值,确定目标用户。需要说明的是,在进行确定病例信息的至少一个病症描述标签之前,需要确定当前项目对应的文本内容,比如医疗人员的职务、所属科室、需要患者的病种、既往史信息等。通过录入的当前项目的文本内容确定目标纳排规则。
在本发明实施例中,还可以通过诊断名称更新目标用户。具体的,由于临床试验中,患者的诊断为重要的筛选条件,最直观的诊断来自于诊断名称,但实际操作中,患者的入院诊断往往不够精确,存在一定的滞后性,因此往往需要结合其余的临床信息进一步明确。首先获取不同病症信息对应的诊断标准,得到诊断规则(将诊断规则转换为SQL语言),基于诊断规则判断对各种病例信息进行处理,判断是否可以得到对应的目标诊断结果,若是,基于目标诊断结果更新目标用户。若否,对该用户的电子病历数据与同一家医院的明确的电子病历数据进行相似度计算,输出病历信息的相似度值,以供医生根据相似度值确定该用户是否为目标用户,参见图12。
本发明实施例的技术方案,通过基于纳排文本生成的纳排规则,从数据存储模型中确定用户,或者根据纳排规则确定与待选择用户的病历信息对应的至少一个病症描述标签,并基于与当前项目相对应的标签筛选模型对多个病症描述标签的处理,得到至少一个待处理用户的关联信息,根据待处理关联信息与预设标签确定目标用户,也可以根据医疗人员对待处理用户的选择确定目标用户。本发明实施例的技术方案,提高了目标用户确定的准确性和高效性。
实施例六
图13为本发明实施例提供的一种确定目标用户的装置的结构示意图,本发明实施例所提供的确定目标用户的装置可执行本发明任意实施例所提供的确定目标用户的方法,具备执行方法相应的功能模块和有益效果。该装置包括:病历信息获取模块610、用户关联信息确定模块620和目标用户确定模块630;其中:
病历信息获取模块610,用于获取多个待选择用户的病历信息,并基于预先生成的目标纳排规则确定与每个病历信息相关联的至少一个病症描述标签;其中,纳排规则是基于各个待研发项目所对应的文本内容确定的;用户关联信息确定模块620,用于将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息;其中,所述待确定用户关联信息中包括用户标识、用户基本信息、与所述用户标识相对应的病历信息以及所述病历信息的病症描述标签;目标用户确定模块630,用于根据预设待匹配标签信息和所述至少一个待确定用户关联信息,确定目标用户。
进一步的,所述装置还包括:
目标纳排规则生成模块,用于生成所述目标纳排规则;
所述目标纳排规则生成模块,包括:
待处理纳排文本获取子模块,用于获取与各个待研发项目相对应的待处理纳排文本;其中,所述待处理纳排文本与待研发项目的项目内容相匹配;待处理纳排文本拆解子模块,用于通过对各待处理纳排文本进行拆解处理,得到与每个待处理纳排文本相对应的至少一个待处理纳排指标;目标纳排规则生成子模块,用于通过对每个待处理纳排指标进行规则化处理,得到与所述待处理纳排指标相对应的目标纳排规则。
进一步的,所述待处理纳排文本获取子模块还用于:
根据每个待研发项目的项目名称,确定与所述待研发项目相对应的文本信息,并将所述文本信息作为待处理纳排文本。
进一步的,所述待处理纳排文本拆解子模块还用于:
获取与不同待研发项目相对应的纳排标准,并通过对纳排标准中的文本进行拆分处理,得到与每个纳排标准相对应的至少一个关联词汇;其中,所述至少一个关联词汇中包括同义词汇以及上下位词汇;基于与每个纳排标准相对应的至少一个关联词汇,确定原始知识库;通过对各待处理纳排文本进行分词处理,得到至少一个待使用词汇,基于所述原始知识库中的关联词汇对各待使用词汇进行标注,并按照预设命名规范,得到与每个待处理纳排文本相对应的纳排指标。
进一步的,所述目标纳排规则生成子模块还用于:
确定每个待处理纳排指标的至少一个待处理纳排规则,并确定所述至少一个待处理纳排规则所对应的类别标识;针对每个类别标识,确定与当前类别标识相对应的待处理纳排规则的至少一个规范片段和片段组合方式;基于各片段组合方式对相应的至少一个规范片段进行组合,得到所述目标纳排规则。
进一步的,所述装置还包括:
SQL书写规范确定模块,用于确定与不同类别标识相对应的SQL书写规范,将基于各片段组合方式对相应的至少一种规范片段按照相应的SQL书写规范进行组合书写,得到SQL规范;基于所述SQL规范,确定所述目标纳排规则。
进一步的,所述装置还包括:
关系建立模块,用于建立所述规范片段、片段组合方式以及预先创建的数据存储模型之间的对应关系,以基于所述对应关系从所述数据存储模型中确定目标用户。
进一步的,所述关系建立模块还用于:
获取多个医疗平台的医疗数据,基于预先设置的结构化模板对所述医疗数据进行处理,得到标准化医疗数据,并将所述标准化医疗数据按照预设字段存储至相应的存储空间,得到所述数据存储模型;建立所述规范片段、片段组合方式以及所述数据存储模型中预设字段之间的对应关系,以基于所述对应关系从所述数据存储模型中获取目标用户。
进一步的,所述病历信息获取模块610包括:
纳排规范确定子模块,用于根据预先生成的目标纳排规则,确定每个病历信息所对应的纳排规范;基于所述纳排规范确定与每个病历信息相关联的至少一个病症描述标签,其中,所述病症描述标签与所述目标纳排规则中的纳排指标相对应。
进一步的,所述用户关联信息确定模块620包括:
实际输出值确定模块,用于将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到与各病历信息相对应的实际输出值;基于各实际输出值和预设输出值,确定至少一个待确定用户关联信息。
进一步的,所述目标用户确定模块630包括:
目标用户确定子模块,用于根据预设待匹配标签信息和每个待确定用户关联信息中病症描述标签之间的相似度值,确定目标用户。
进一步的,所述目标用户确定子模块还用于:
根据预设待匹配标签信息所对应的权重值以及所述预设待匹配标签信息和每个待确定用户关联信息中病症描述标签之间的相似度值,确定目标用户。
进一步的,所述预设待匹配标签信息包括用户基本信息标签、既往史标签以及类别标签中的至少一种。
进一步的,所述装置还包括:
目标用户更新模块,用于获取不同病症信息所对应的诊断标准,得到诊断规则,以基于所述诊断规则确定各病历信息所对应的目标诊断结果;基于所述目标诊断结果,更新所述目标用户。
本发明实施例的技术方案,通过获取多个待选择用户的病历信息,基于预先生成的目标纳排规则确定与每个病历信息相关联的至少一个病症描述标签,将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息,根据预设待匹配标签信息和至少一个待确定用户关联信息,确定目标用户。通过本发明实施例的技术方案实现根据标签筛选模型和预设待匹配标签信息的双重筛选,确定目标用户,提高了目标用户确定的准确性和高效性。
值得注意的是,上述装置所包括的各个模块和子模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。
实施例七
图14为本发明实施例提供的一种电子设备的结构示意图。图14示出了适于用来实现本发明实施例实施方式的示例性电子设备130的框图。图14显示的电子设备130仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图14所示,电子设备130以通用计算设备的形式表现。电子设备130的组件可以包括但不限于:一个或者多个处理器或者处理单元1301,系统存储器1302,连接不同系统组件(包括系统存储器1302和处理单元1301)的总线1303。
总线1303表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备130典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备130访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器1302可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)1304和/或高速缓存存储器1305。电子设备130可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统1306可以用于读写不可移动的、非易失性磁介质(图14未显示,通常称为“硬盘驱动器”)。尽管图14中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线1303相连。存储器1302可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块1307的程序/实用工具1308,可以存储在例如存储器1302中,这样的程序模块1307包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块1307通常执行本发明所描述的实施例中的功能和/或方法。
电子设备130也可以与一个或多个外部设备1309(例如键盘、指向设备、显示器1310等)通信,还可与一个或者多个使得用户能与该电子设备130交互的设备通信,和/或与使得该电子设备130能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1311进行。并且,电子设备130还可以通过网络适配器1312与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1312通过总线1303与电子设备130的其它模块通信。应当明白,尽管图14中未示出,可以结合电子设备130使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元1301通过运行存储在系统存储器1302中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的确定目标用户的方法。
实施例八
本发明实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种确定目标用户的方法,所述方法包括:
获取多个待选择用户的病历信息,并基于预先生成的目标纳排规则确定与每个病历信息相关联的至少一个病症描述标签;其中,纳排规则是基于各个待研发项目所对应的文本内容确定的;将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息;其中,所述待确定用户关联信息中包括用户标识、用户基本信息、与所述用户标识相对应的病历信息以及所述病历信息的病症描述标签;根据预设待匹配标签信息和所述至少一个待确定用户关联信息,确定目标用户。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (17)

1.一种确定目标用户的方法,其特征在于,包括:
获取多个待选择用户的病历信息,并基于预先生成的目标纳排规则确定与每个病历信息相关联的至少一个病症描述标签;其中,纳排规则是基于各个待研发项目所对应的文本内容确定的;
将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息;其中,所述待确定用户关联信息中包括用户标识、用户基本信息、与所述用户标识相对应的病历信息以及所述病历信息的病症描述标签;
根据预设待匹配标签信息和所述至少一个待确定用户关联信息,确定目标用户。
2.根据权利要求1所述的方法,其特征在于,还包括:生成所述目标纳排规则;
所述生成所述目标纳排规则,包括:
获取与各个待研发项目相对应的待处理纳排文本;其中,所述待处理纳排文本与待研发项目的项目内容相匹配;
通过对各待处理纳排文本进行拆解处理,得到与每个待处理纳排文本相对应的至少一个待处理纳排指标;
通过对每个待处理纳排指标进行规则化处理,得到与所述待处理纳排指标相对应的目标纳排规则。
3.根据权利要求2所述的方法,其特征在于,所述获取与各个待研发项目相对应的待处理纳排文本,包括:
根据每个待研发项目的项目名称,确定与所述待研发项目相对应的文本信息,并将所述文本信息作为待处理纳排文本。
4.根据权利要求2所述的方法,其特征在于,所述通过对各待处理纳排文本进行拆解处理,得到与每个待处理纳排文本相对应的至少一个待处理纳排指标,包括:
获取与不同待研发项目相对应的纳排标准,并通过对纳排标准中的文本进行拆分处理,得到与每个纳排标准相对应的至少一个关联词汇;其中,所述至少一个关联词汇中包括同义词汇以及上下位词汇;
基于与每个纳排标准相对应的至少一个关联词汇,确定原始知识库;
通过对各待处理纳排文本进行分词处理,得到至少一个待使用词汇,基于所述原始知识库中的关联词汇对各待使用词汇进行标注,并按照预设命名规范,得到与每个待处理纳排文本相对应的纳排指标。
5.根据权利要求2所述的方法,其特征在于,所述通过对每个待处理纳排指标进行规则化处理,得到与所述待处理纳排指标相对应的目标纳排规则,包括:
确定每个待处理纳排指标的至少一个待处理纳排规则,并确定所述至少一个待处理纳排规则所对应的类别标识;
针对每个类别标识,确定与当前类别标识相对应的待处理纳排规则的至少一个规范片段和片段组合方式;
基于各片段组合方式对相应的至少一个规范片段进行组合,得到所述目标纳排规则。
6.根据权利要求5所述的方法,其特征在于,在基于各片段组合方式对相应的至少一种规范片段进行组合之后,得到所述目标纳排规则之前,还包括:
确定与不同类别标识相对应的SQL书写规范,将基于各片段组合方式对相应的至少一种规范片段按照相应的SQL书写规范进行组合书写,得到SQL规范;
基于所述SQL规范,确定所述目标纳排规则。
7.根据权利要求5或6所述的方法,其特征在于,还包括:
建立所述规范片段、片段组合方式以及预先创建的数据存储模型之间的对应关系,以基于所述对应关系从所述数据存储模型中确定目标用户。
8.根据权利要求7所述的方法,其特征在于,所述建立所述规范片段、片段组合方式以及预先创建的数据存储模型之间的对应关系,包括:
获取多个医疗平台的医疗数据,基于预先设置的结构化模板对所述医疗数据进行处理,得到标准化医疗数据,并将所述标准化医疗数据按照预设字段存储至相应的存储空间,得到所述数据存储模型;
建立所述规范片段、片段组合方式以及所述数据存储模型中预设字段之间的对应关系,以基于所述对应关系从所述数据存储模型中获取目标用户。
9.根据权利要求1所述的方法,其特征在于,所述基于预先生成的目标纳排规则确定与每个病历信息相关联的至少一个病症描述标签,包括:
根据预先生成的目标纳排规则,确定每个病历信息所对应的纳排规范;
基于所述纳排规范确定与每个病历信息相关联的至少一个病症描述标签,其中,所述病症描述标签与所述目标纳排规则中的纳排指标相对应。
10.根据权利要求1所述的方法,其特征在于,所述将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息,包括:
将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到与各病历信息相对应的实际输出值;
基于各实际输出值和预设输出值,确定至少一个待确定用户关联信息。
11.根据权利要求1所述的方法,其特征在于,所述根据预设待匹配标签信息和所述至少一个待确定用户关联信息,确定目标用户,包括:
根据预设待匹配标签信息和每个待确定用户关联信息中病症描述标签之间的相似度值,确定目标用户。
12.根据权利要求11所述的方法,其特征在于,所述根据预设待匹配标签信息和每个待确定用户关联信息中病症描述标签之间的相似度值,确定目标用户,包括:
根据预设待匹配标签信息所对应的权重值以及所述预设待匹配标签信息和每个待确定用户关联信息中病症描述标签之间的相似度值,确定目标用户。
13.根据权利要求1-6和8-9中任一所述的方法,其特征在于,所述预设待匹配标签信息包括用户基本信息标签、既往史标签以及类别标签中的至少一种。
14.根据权利要求1所述的方法,其特征在于,还包括:
获取不同病症信息所对应的诊断标准,得到诊断规则,以基于所述诊断规则确定各病历信息所对应的目标诊断结果;
基于所述目标诊断结果,更新所述目标用户。
15.一种确定目标用户的装置,其特征在于,包括:
病历信息获取模块,用于获取多个待选择用户的病历信息,并基于预先生成的目标纳排规则确定与每个病历信息相关联的至少一个病症描述标签;其中,纳排规则是基于各个待研发项目所对应的文本内容确定的;
用户关联信息确定模块,用于将各病历信息的至少一个病症描述标签输入至预先训练好的与当前项目相匹配的标签筛选模型中,得到至少一个待确定用户关联信息;其中,所述待确定用户关联信息中包括用户标识、用户基本信息、与所述用户标识相对应的病历信息以及所述病历信息的病症描述标签;
目标用户确定模块,用于根据预设待匹配标签信息和所述至少一个待确定用户关联信息,确定目标用户。
16.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-14中任一所述的确定目标用户的方法。
17.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-14中任一所述确定目标用户的方法。
CN202110625940.XA 2021-06-04 2021-06-04 确定目标用户的方法、装置、电子设备及存储介质 Active CN113257377B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110625940.XA CN113257377B (zh) 2021-06-04 2021-06-04 确定目标用户的方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110625940.XA CN113257377B (zh) 2021-06-04 2021-06-04 确定目标用户的方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113257377A true CN113257377A (zh) 2021-08-13
CN113257377B CN113257377B (zh) 2024-05-24

Family

ID=77186491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110625940.XA Active CN113257377B (zh) 2021-06-04 2021-06-04 确定目标用户的方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113257377B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113707335A (zh) * 2021-09-06 2021-11-26 挂号网(杭州)科技有限公司 确定目标接诊用户的方法、装置、电子设备和存储介质
CN113948165A (zh) * 2021-12-20 2022-01-18 易临云(深圳)科技有限公司 受试者筛选方法、系统、设备及计算机可读存储介质
CN114822858A (zh) * 2021-12-30 2022-07-29 四川大学华西医院 影像科研究用前瞻性病例筛选方法、装置及存储介质
CN115618850A (zh) * 2022-09-30 2023-01-17 广东亿佛手健康科技有限公司 基于穴位医疗微服务的局部语法表达方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001055942A1 (en) * 2000-01-28 2001-08-02 Acurian, Inc. Systems and methods for selecting and recruiting investigators and subjects for clinical studies
US20080052259A1 (en) * 2001-04-02 2008-02-28 Saul Shiffman Operation and method for prediction and management of the validity of subject reported data
CN110223784A (zh) * 2019-06-17 2019-09-10 无码科技(杭州)有限公司 临床试验患者匹配方法
CN111145846A (zh) * 2019-12-30 2020-05-12 天津开心生活科技有限公司 临床试验患者招募方法及装置、电子设备和存储介质
CN111667891A (zh) * 2020-06-08 2020-09-15 中国医学科学院医学信息研究所 应用于专病临床试验的队列识别方法及装置
CN112365941A (zh) * 2020-10-16 2021-02-12 零氪科技(北京)有限公司 受试者招募的方法及系统
CN112489774A (zh) * 2020-11-30 2021-03-12 中国人民解放军陆军军医大学第二附属医院 一种临床试验受试者招募系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001055942A1 (en) * 2000-01-28 2001-08-02 Acurian, Inc. Systems and methods for selecting and recruiting investigators and subjects for clinical studies
US20080052259A1 (en) * 2001-04-02 2008-02-28 Saul Shiffman Operation and method for prediction and management of the validity of subject reported data
CN110223784A (zh) * 2019-06-17 2019-09-10 无码科技(杭州)有限公司 临床试验患者匹配方法
CN111145846A (zh) * 2019-12-30 2020-05-12 天津开心生活科技有限公司 临床试验患者招募方法及装置、电子设备和存储介质
CN111667891A (zh) * 2020-06-08 2020-09-15 中国医学科学院医学信息研究所 应用于专病临床试验的队列识别方法及装置
CN112365941A (zh) * 2020-10-16 2021-02-12 零氪科技(北京)有限公司 受试者招募的方法及系统
CN112489774A (zh) * 2020-11-30 2021-03-12 中国人民解放军陆军军医大学第二附属医院 一种临床试验受试者招募系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113707335A (zh) * 2021-09-06 2021-11-26 挂号网(杭州)科技有限公司 确定目标接诊用户的方法、装置、电子设备和存储介质
CN113948165A (zh) * 2021-12-20 2022-01-18 易临云(深圳)科技有限公司 受试者筛选方法、系统、设备及计算机可读存储介质
CN114822858A (zh) * 2021-12-30 2022-07-29 四川大学华西医院 影像科研究用前瞻性病例筛选方法、装置及存储介质
CN115618850A (zh) * 2022-09-30 2023-01-17 广东亿佛手健康科技有限公司 基于穴位医疗微服务的局部语法表达方法及系统
CN115618850B (zh) * 2022-09-30 2023-11-10 广东亿佛手健康科技有限公司 基于穴位医疗微服务的局部语法表达方法及系统

Also Published As

Publication number Publication date
CN113257377B (zh) 2024-05-24

Similar Documents

Publication Publication Date Title
Spasic et al. Clinical text data in machine learning: systematic review
Shi et al. Semantic health knowledge graph: semantic integration of heterogeneous medical knowledge and services
CN113257377B (zh) 确定目标用户的方法、装置、电子设备及存储介质
CN108920453B (zh) 数据处理方法、装置、电子设备及计算机可读介质
US8700589B2 (en) System for linking medical terms for a medical knowledge base
US8600772B2 (en) Systems and methods for interfacing with healthcare organization coding system
CN107408156A (zh) 用于从临床文档进行语义搜索和提取相关概念的系统和方法
JP2014505950A (ja) 撮像プロトコルの更新及び/又はリコメンダ
CN111627512A (zh) 一种相似病历的推荐方法、装置,电子设备及存储介质
Kaswan et al. AI-based natural language processing for the generation of meaningful information electronic health record (EHR) data
Ramalho et al. The use of artificial intelligence for clinical coding automation: a bibliometric analysis
CN111061835B (zh) 查询方法及装置、电子设备和计算机可读存储介质
Liu et al. DQueST: dynamic questionnaire for search of clinical trials
Agrawal et al. Detecting modeling inconsistencies in SNOMED CT using a machine learning technique
Carvalho et al. Knowledge Graph Embeddings for ICU readmission prediction
JP2021536636A (ja) 医療記録を分類する方法
Li et al. Chip2022 shared task overview: Medical causal entity relationship extraction
JP7473314B2 (ja) 医療情報管理装置及び医療レポートのメタデータ付加方法
Nair et al. Automated clinical concept-value pair extraction from discharge summary of pituitary adenoma patients
Savova et al. Natural language processing: applications in pediatric research
US20210133627A1 (en) Methods and systems for confirming an advisory interaction with an artificial intelligence platform
Tran et al. Scaling out and evaluation of obsecan, an automated section annotator for semi-structured clinical documents, on a large VA clinical corpus
WO2021159054A1 (en) Method and system for incorporating patient information
Bissoyi et al. Mapping clinical narrative texts of patient discharge summaries to UMLS concepts
Fritz et al. Medical diagnosis as a linguistic game

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant