CN110931136B - 事件的搜索方法及装置、计算机介质和电子设备 - Google Patents
事件的搜索方法及装置、计算机介质和电子设备 Download PDFInfo
- Publication number
- CN110931136B CN110931136B CN202010068184.0A CN202010068184A CN110931136B CN 110931136 B CN110931136 B CN 110931136B CN 202010068184 A CN202010068184 A CN 202010068184A CN 110931136 B CN110931136 B CN 110931136B
- Authority
- CN
- China
- Prior art keywords
- target
- event
- index data
- index
- contrast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000005259 measurement Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 4
- 208000005718 Stomach Neoplasms Diseases 0.000 description 19
- 206010017758 gastric cancer Diseases 0.000 description 19
- 238000002271 resection Methods 0.000 description 19
- 201000011549 stomach cancer Diseases 0.000 description 19
- 238000004364 calculation method Methods 0.000 description 13
- 210000000265 leukocyte Anatomy 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000012360 testing method Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 239000003814 drug Substances 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002980 postoperative effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开提供了一种事件的搜索方法及装置、计算机可读介质和电子设备,涉及数据处理技术领域。该方法包括:获取目标事件的搜索主题,以及根据搜索主题确定目标用户集;获取目标事件的对比时间区间,其中,对比时间区间至少包括两个子区间;获取目标事件的对比指标,以及对于目标用户集中每个用户标识,获取在每个子区间内生成的关于对比指标的指标数据集;根据每个子区间对应的指标数据集,确定目标用户集中每个用户标识对应的关于对比指标的对比值,以完成对目标事件的搜索。本技术方案能够有效提升时间搜索效率。
Description
技术领域
本公开涉及数据处理技术领域,具体而言,涉及一种事件的搜索方法及装置,以及实现上述事件的搜索方法的计算机可读介质和电子设备。
背景技术
事件搜索是指搜索请求者通过设置事件发生的条件,来搜索出符合相关条件的用户集合,进一步地,还可以得到关于该用户集合的多种指标值。其中,在设置事件发生的条件时,可以具体设置事件发生的顺序、事件发生的时间等。事件搜索可以有效地提升搜索请求者在回顾性科研分析中获取用户各指标的效率。
在医学领域,医疗事件搜索可以有效地提升用户在回顾性科研分析中的患者搜索的效率。然而,医学数据较为复杂,例如包含一个患者术前各相关症状、术前各相关身体指标、术后各相关症状、术后各相关身体指标等。同时,需研究患者用药前后、手术前后相关身体指标的变化情况。因而,医疗事件搜索具有较高的复杂度。
现有技术中,但是针对经历过某个医疗事件(如使用某种药物或者经过一项手术)后,某特定检验指标前后有一定程度的变化率,如白细胞数量提升25%,这类需求目前没有便捷的工具为医生实现,临床中此类需求需要医生对海量的患者病历进行人工复查,从而找到相关的病历,对医生人力来讲有较大的耗费。
因此,亟需一种搜索效率较高的事件搜索方案来解决上述问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开实施例的目的在于提供一种事件的搜索方法、事件的搜索装置,以及实现上述方法的计算机可读介质和电子设备,进而至少在一定程度上提升了事件搜索效率。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的第一方面,提供了一种事件的搜索方法,该方法包括:
获取目标事件的搜索主题,以及根据上述搜索主题确定目标用户集;
获取上述目标事件的对比时间区间,其中,上述对比时间区间至少包括两个子区间;
获取上述目标事件的对比指标,以及对于上述目标用户集中每个用户标识,获取在每个上述子区间内生成的关于上述对比指标的指标数据集;
根据每个上述子区间对应的指标数据集,确定上述目标用户集中每个用户标识对应的关于上述对比指标的对比值,以完成对上述目标事件的搜索。
在本公开的一种实施例中,基于前述方案,在上述根据上述搜索主题确定目标用户集之后,上述方法还包括:
切分上述目标用户集为多个子集合,以对上述多个子集合进行分布式数据处理。
在本公开的一种实施例中,基于前述方案,上述对比时间区间包括第一子区间和第二子区间;
上述获取在每个上述子区间内生成的关于上述对比指标的指标数据集,包括:
获取在上述第一子区间内生成的关于上述对比指标的第一指标数据集,获取在上述第二子区间内生成的关于上述对比指标的第二指标数据集。
在本公开的一种实施例中,基于前述方案,在获取在上述第一子区间内生成的关于上述对比指标的第一指标数据集,获取在上述第二子区间内生成的关于上述对比指标的第二指标数据集之后,上述方法还包括:
获取上述目标事件的度量方式;
基于上述度量方式,在上述第一指标数据集中确定上述第一子区间对应的第一目标指标数据,在上述第二指标数据集中确定上述第二子区间对应的第二目标指标数据。
在本公开的一种实施例中,基于前述方案,上述度量方式包括:最大值、最小值、平均值或众数值;其中,
上述基于上述度量方式,在上述第二指标数据集中确定上述第二子区间对应的第二目标指标数据,包括:
在上述第二指标数据集中确定最大值、最小值或平均值,得到上述第二子区间对应的第二目标指标数据;或,在上述第二指标数据集中确定任意一个众数值,得到上述第二子区间对应的第二目标指标数据。
在本公开的一种实施例中,基于前述方案,上述根据每个上述子区间对应的指标数据集,确定上述目标用户集中每个用户标识对应的关于上述对比指标的对比值,包括:
将上述第二目标指标数据和上述第一目标指标数据的比值确定为上述对比值。
在本公开的一种实施例中,基于前述方案,上述方法还包括:
获取对比值阈值;
获取大于上述对比值阈值的对比值对应的用户标识作为目标用户标识,并存储上述目标用户标识和上述目标用户标识对应的事件发生时间。
根据本公开实施例的第二方面,提供了一种事件的搜索装置,该装置包括:目标用户集获取模块、时间区间获取模块、指标数据集获取模块和对比值确定模块。
其中,上述目标用户集获取模块,被配置为:获取目标事件的搜索主题,以及根据上述搜索主题确定目标用户集;
上述时间区间获取模块,被配置为:获取上述目标事件的对比时间区间,其中,上述对比时间区间至少包括两个子区间;
上述指标数据集获取模块,被配置为:获取上述目标事件的对比指标,以及对于上述目标用户集中每个用户标识,获取在每个上述子区间内生成的关于上述对比指标的指标数据集;以及,
上述对比值确定模块,被配置为:根据每个上述子区间对应的指标数据集,确定上述目标用户集中每个用户标识对应的关于上述对比指标的对比值,以完成对上述目标事件的搜索。
根据本公开实施例的第三方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例第一方面任意一种技术方案所述的事件的搜索方法。
根据本公开实施例的第四方面,提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例第一方面任意一种技术方案所述的事件的搜索方法。
本公开实施例提供的技术方案可以包括以下有益效果:
一方面,在本公开的一些实施例中,通过多时间区间之间的指标数据对比,自动地为搜索请求者提供检验项目在事件前后变化幅度,从而高效率地满足对设定条件的人群的搜索功能,有利于提升科研分析效率。
另一方面,在本公开的一些实施例中,本技术方案提供的试验样本的确定方案能够自动化地搜索符合临床试验所关注条件的样本,而不受限于人工的经验,从而有效提升处理效率并降低了降低人力和时间成本。将用户线下的操作以在线自动化的形式进行,针对事件前后对比的需求,能有效的提升用户此类患者搜集的效率和准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出本公开示例性实施例中用于实现事件的搜索方法或装置的系统架构示意图;
图2示出了根据本公开的一实施例的事件的搜索方法的流程示意图;
图3示出了根据本公开的另一实施例的事件的搜索方法的流程示意图;
图4示出了根据本公开的又一实施例的事件的搜索方法的流程示意图;
图5a和图5b示出了根据本公开的再一实施例的事件的搜索方法的流程示意图;
图6示出了根据本公开的一实施例的事件的搜索装置的结构示意图;
图7示出本公开示例性实施例中计算机存储介质的结构示意图;以及,
图8示出本公开示例性实施例中电子设备的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本示例实施方式中首先提供了一种用于实现事件的搜索方法的系统架构,可以应用于各种数据处理场景。参考图1所示,该系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送请求指令等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如图片处理应用、购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如,服务器105获取搜索请求者利用终端设备101、102、103输入的关于目标事件的搜索主题、对比指标以及对比时间区间,其中,所述对比时间区间至少包括两个子区间。并根据所述搜索主题确定目标用户集(仅为示例)。服务器105可以对于所述目标用户集中每个用户标识,获取在每个所述子区间内生成的关于所述对比指标的指标数据集(仅为示例)。服务器105根据每个所述子区间对应的指标数据集,确定所述目标用户集中每个用户标识对应的关于所述对比指标的对比值,以完成对所述目标事件的搜索。
相关技术在大数据计算框架下,事件搜索可以快速的满足搜索者的搜索需求,具体地,对于搜索者提出的入组条件,事件搜索可以快速确定满足入组条件的患者人群,比如手术后几天内使用过几次某种药物的人群。
针对相关技术中所存在的上述一个或多个问题,本技术方案提供了一种事件的搜索方法及装置,计算机存储介质和电子设备。以下先对事件的搜索方法进行说明:
图2示出了根据本公开的实施例的事件的搜索方法的流程示意图。本实施例提供的事件的搜索方法,至少在一定程度上克服现有技术中存在的上述问题。
其中,本实施例提供的事件的搜索方法的执行主体可以是具有计算处理功能的设备,比如服务器等。
参考图2,本实施例提供的事件的搜索方法包括:
步骤S210,获取目标事件的搜索主题,以及根据所述搜索主题确定目标用户集;
步骤S220,获取所述目标事件的对比时间区间,其中,所述对比时间区间至少包括两个子区间;
步骤S230,获取所述目标事件的对比指标,以及对于所述目标用户集中每个用户标识,获取在每个所述子区间内生成的关于所述对比指标的指标数据集;以及,
步骤S240,根据每个所述子区间对应的指标数据集,确定所述目标用户集中每个用户标识对应的关于所述对比指标的对比值,以完成对所述目标事件的搜索。
在图2所示实施例提供的技术方案中,一方面,在本公开的一些实施例中,通过多时间区间之间的指标数据对比,自动地为搜索请求者提供检验项目在事件前后变化幅度,从而高效率地满足对设定条件的人群的搜索功能,有利于提升科研分析效率。
另一方面,在本公开的一些实施例中,本技术方案提供的试验样本的确定方案能够自动化地搜索符合临床试验所关注条件的样本,而不受限于人工的经验,从而有效提升处理效率并降低了降低人力和时间成本。将用户线下的操作以在线自动化的形式进行,针对事件前后对比的需求,能有效的提升搜索请求者此类用户搜集的效率和准确率。
以下对图2中所示事件的搜索方法实施例的技术方案的各个步骤的实现细节进行详细阐述:
在示例性的实施例中,以医疗事件搜索为例进行说明。其中,上述搜索请求者可以是医生,上述被搜索用户可以是患者。示例性的,第一个应用场景:医生想获取关于胃癌全切手术前后患者白细胞的变化情况。第二个应用场景:医生想获取关于胃癌全切手术前后患者白细胞增长率大于预设阈值的患者信息。以下通过具体实施例对执行上述应用场景进行解释说明。
在步骤S210中,获取目标事件的搜索主题,以及根据所述搜索主题确定目标用户集。
在示例性的实施例中,在医疗事件搜索过程中,上述搜索主题可以是治疗手段,例如:手术名、药品名等。从而,可以获取手术治疗前后/用药治疗前后患者身体指标的变化情况。
在示例性的实施例中,根据确定的搜索主题,可以从相关数据库中确定与该搜索主题对应的患者,从而确定上述目标用户集。其中,本实施例中,不同患者具备不同的患者标识。也就是说,本实施例中可以获取关于与该搜索主题对应患者的标识集。
在示例性的实施例中,上述目标用户集中的每个患者标识还对应一关于上述目标事件的发生时间。
示例性的,在上述应用场景中,上述搜索主题则为胃癌全切手术。获取到的目标用户集包含关于胃癌全切手术的患者标识,以及每个患者进行胃癌全切手术的事件发生时间。
在步骤S220中,获取所述目标事件的对比时间区间,其中,所述对比时间区间至少包括两个子区间。
在示例性的实施例中,鉴于本技术方案针对对比事件的搜索,因此在确定对比事件区间时,应以事件发生时间为基准,至少确定在上述事件发生时间之前的一个子时间区间,以及在上述事件发生时间之后的另一个子时间区间,以在两个子时间区间的指标数据之间进行比对。示例性的,上述每个时间区间的时间长度可以根据实际情况确定,例如可以是10天、5天或一天等。
示例性的,在上述应用场景中,包含两个时间区间。一个是胃癌全切手术之前的10天内,一个是胃癌全切手术之后的10天内。从而,可以在胃癌全切手术之后的10天内的某指标数据与胃癌全切手术之前的10天内的该指标数据之间进行比对。
在步骤S230中,获取所述目标事件的对比指标,以及对于所述目标用户集中每个用户标识,获取在每个所述子区间内生成的关于所述对比指标的指标数据集。
在示例性的实施例中,在医疗事件搜索过程中,上述对比指标可以是上述搜索主题相关的指标。示例性的,上述搜索主题为胃癌全切手术,则上述对比指标可以是:白细胞数量、血量值等。从而,可以获取手术治疗前后白细胞数量、血量值等身体指标的变化情况。
在示例性的实施例中,上述对比时间区间包括第一子区间和第二子区间。则获取在上述第一子区间内生成的关于上述搜索主题的对比指标。由于获取到的指标数据可能包含多个,则得到数据集并可以记作第一指标数据集。示例性的,在上述应用场景中,对于获取到的胃癌全切手术患者,获取其中每个患者在胃癌全切手术之前的10天内的白细胞数量作为第一指标数据集。
同理,获取在上述第二子区间内生成的关于上述对比指标的第二指标数据集。示例性的,在上述应用场景中,对于获取到的胃癌全切手术患者,获取其中每个患者在胃癌全切手术之后的10天内的白细胞数量作为第二指标数据集。
鉴于每个子区间对应的指标数据集中指标数据较多,则两个子区间之间的指标对比较为复杂。则需在指标数据集中确定出一目标指标数据,来减少每个指标数据集中指标数目,进而以完成对对比事件的搜索。
示例性的,图3示出了根据本公开的另一实施例的事件的搜索方法的流程示意图。参考图3,该图所示实施例包括步骤S310-步骤S330。
在步骤S310中,获取所述目标事件的度量方式;以及,在步骤S320中,基于所述度量方式,在所述第一指标数据集中确定所述第一子区间对应的第一目标指标数据,在所述第二指标数据集中确定所述第二子区间对应的第二目标指标数据。
在示例性的实施例中,为使得在指标数据集中确定出的目标指标数据能够反映整个数据集的整体情况,则度量方式包括:最大值、最小值、平均值或众数值。
进一步地,在上述第二指标数据集中确定最大值、最小值或平均值,得到上述第二子区间对应的第二目标指标数据;或,在上述第二指标数据集中确定任意一个众数值,得到上述第二子区间对应的第二目标指标数据。同理,并在上述第一指标数据集中确定最大值、最小值、平均值或任意一个众数值,得到所述第一子区间对应的第一目标指标数据。
示例性的,在上述应用场景中,每个患者在胃癌全切手术之前的10天内的白细胞数量对应的第一指标数据集中,获取其中的最大值M作为该数据集的第一目标指标数据,同时,每个患者在胃癌全切手术之后的10天内的白细胞数量对应的第二指标数据集中,获取其中的最大值N作为该数据集的第二目标指标数据。
在步骤S330中,将所述第二目标指标数据和所述第一目标指标数据的比值确定为所述对比值。
示例性的,在上述应用场景中,可以通过N/M来反映关于胃癌全切手术前后患者白细胞的变化情况。
对于上述第二种应用场景,即医生想获取关于胃癌全切手术前后患者白细胞增长率大于预设阈值的患者信息。现有技术提供的病历搜索功能无法支持检验指标符合设定变化幅度的患者的搜索功能,需要医生导出相关数据后,通过数据分析软件进行比对后才能获取到相关患者集合。
而本技术方案则可以通过图4所示实施例来进行上述事件搜索。参考图4,该图所示实施例包括:
步骤S410,获取对比值阈值;以及,步骤S420,获取大于所述对比值阈值的对比值对应的用户标识作为目标用户标识,并存储所述目标用户标识和所述目标用户标识对应的事件发生时间。
在示例性的实施例中,在上述应用场景中,若要获取关于胃癌全切手术前后患者白细胞增长率大于125%的患者信息,则可以将上述对比值阈值设置为125%。进一步地,将N/M大于125%的患者信息过滤处理,从而实现了获取关于胃癌全切手术前后患者白细胞增长率大于预设阈值的患者信息。
在示例性的实施例中,图5a和图5b示出了根据本公开的再一实施例的事件的搜索方法的流程示意图。参考图5a和图5b,该图所示实施例包括:
步骤S51,确定目标患者集,并计算患者总数。具体地,通过基于Lucene的搜索服务引擎ES(ElasticSearch)根据搜索主题确定目标患者集,并计算患者总数(即目标患者集中患者标识数)。示例性的,该搜索服务还可以由solr、lucene等来提供。
步骤S52,将上述目标患者集切分为S组(S为正整数,)得到多个子集合,以方便进一步对每个子集合进行分布式数据处理。
示例性的,每10000(该值可以任意设置)个患者为一组,将所有满足搜索条件的患者切分成多个组,每一次计算从ES中只搜索一组患者数据进行运算。
在本实施例中,基于分布式计算框架的事件搜索计算模型,在原有的计算框架下,能提高计算效率,辅助医生提升科研效率。创建基于大数据分布式计算框架下的事件搜索的高效计算模型,为搜索请求者提供设置检验指标事件前后对比变化幅度的功能操作。
在步骤S53中,针对S组中任意一子集合的数据,获取该组患者集中每个患者标识以及该患者关于目标事件的事件发生时间;以及,获取每个患者标识以及该患者关于目标指标的指标数据集。并存储至数据库501中。
在示例性的实施例中,上述事件发生时间和上述指标数据集分别被存储至不同的数据库中。
在步骤S54中,对于每个患者标识,将患者标识、与该患者标识对应的关于目标指标的事件发生时间,以及与该患者标识对应的关于目标指标的指标数据集进行合并,并将合并后得到的患者标识、与该患者标识对应的关于目标指标的事件发生时间,以及与该患者标识对应的关于目标指标的指标数据集进行关联,并存储至数据库502中。
进一步地,根据设置的两个“对比时间区间”及各自的度量方式。对于每个对比时间区间及其度量方式,在步骤S53和步骤S54中的结果中,先求出在此时间区间里的所有患者,然后,使用分治法一一算出每个患者的检验指标度量值(即目标指标数据),循环遍历步骤S53和步骤S54中所有的患者,即可得到所有“患者与对应的度量值”的集合。
具体的:在步骤S55中,获取对比时间区间以及时间区间对应的度量方式,并根据第一时间区间对应的度量方式度量第一时间子区间对应的第一目标指标数据,以及根据第二时间区间对应的度量方式度量第二时间子区间对应的第二目标指标数据。即在第一时间子区间对应的指标数据集中获取最大值/最小值/平均值/任意一个众数值得到该子区间的第一目标指标数据。并通过目标指标数据来代表上述指标数据集。
在步骤S56中,计算上述第二目标指标数据和上述第一目标指标数据的比值作为对比值。
在步骤S57中,获取对比值阈值;以及,获取大于所述对比值阈值的对比值对应的患者标识作为目标患者标识,并存储所述目标患者标识和所述目标患者标识对应的事件发生时间。
在步骤S58中,合并各个子集合得到的目标患者标识和所述目标患者标识对应的事件发生时间。
进一步地,在步骤S59中,获取合并后的目标患者标识和所述目标患者标识对应的事件发生时间,进一步将其存储至数据库503中。
示例性的,上述数据库可以采用mongodb、mysql或redis等。
在示例性的实施例中,对于存储至数据库如mongodb中的计算结果,在下一次需要使用时从mongodb中取出,以节省计算资源以及计算时间,有利于提升事件搜索效率。
本领域技术人员可以理解实现上述实施方式的全部或部分步骤被实现为由处理器,包含中央处理器(central processing unit,CPU)和图形处理器(GraphicsProcessing Unit GPU)执行的计算机程序。在该计算机程序被CPU或GPU执行时,执行本公开提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
此外,需要注意的是,上述附图仅是根据本公开示例性实施方式的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
以下介绍本公开的事件的搜索装置实施例,可以用于执行本公开上述实施例提供的事件的搜索方法。
图6示出了根据本公开的实施例的事件的搜索装置的结构示意图,参考图6,本实施例提供的事件的搜索装置600,包括:目标用户集获取模块601、时间区间获取模块602、指标数据集获取模块603和对比值确定模块604。
其中,上述目标用户集获取模块601,被配置为:获取目标事件的搜索主题,以及根据上述搜索主题确定目标用户集;
上述时间区间获取模块602,被配置为:获取上述目标事件的对比时间区间,其中,上述对比时间区间至少包括两个子区间;
上述指标数据集获取模块603,被配置为:获取上述目标事件的对比指标,以及对于上述目标用户集中每个用户标识,获取在每个上述子区间内生成的关于上述对比指标的指标数据集;以及,
上述对比值确定模块604,被配置为:根据每个上述子区间对应的指标数据集,确定上述目标用户集中每个用户标识对应的关于上述对比指标的对比值,以完成对上述目标事件的搜索。
在本公开的一种实施例中,基于前述方案,上述事件的搜索装置600还包括:切分模块。
其中,上述切分模块被配置为:在上述目标用户集获取模块601根据上述搜索主题确定目标用户集之后,切分上述目标用户集为多个子集合,以对上述多个子集合进行分布式数据处理。
在本公开的一种实施例中,基于前述方案,上述对比时间区间包括第一子区间和第二子区间;
上述指标数据集获取模块603,被具体配置为:获取在上述第一子区间内生成的关于上述对比指标的第一指标数据集,获取在上述第二子区间内生成的关于上述对比指标的第二指标数据集。
在本公开的一种实施例中,基于前述方案,上述事件的搜索装置600还包括:度量模块。
其中,上述度量模块被配置为:上述指标数据集获取模块603获取在上述第一子区间内生成的关于上述对比指标的第一指标数据集,获取在上述第二子区间内生成的关于上述对比指标的第二指标数据集之后:获取上述目标事件的度量方式;以及,基于上述度量方式,在上述第一指标数据集中确定上述第一子区间对应的第一目标指标数据,在上述第二指标数据集中确定上述第二子区间对应的第二目标指标数据。
在本公开的一种实施例中,基于前述方案,上述度量方式包括:最大值、最小值、平均值或众数值;其中,
上述基于上述度量方式,上述度量模块被具体配置为:在上述第二指标数据集中确定最大值、最小值或平均值,得到上述第二子区间对应的第二目标指标数据;或,在上述第二指标数据集中确定任意一个众数值,得到上述第二子区间对应的第二目标指标数据。
在本公开的一种实施例中,基于前述方案,上述对比值确定模块604,被具体配置为:将上述第二目标指标数据和上述第一目标指标数据的比值确定为上述对比值。
在本公开的一种实施例中,基于前述方案,上述事件的搜索装置600还包括:过滤模块。
其中,上述过滤模块被配置为:获取对比值阈值;以及,获取大于上述对比值阈值的对比值对应的用户标识作为目标用户标识,并存储上述目标用户标识和上述目标用户标识对应的事件发生时间。
由于本公开的示例性的实施例的事件的搜索装置的各个功能模块与上述事件的搜索方法的示例实施例的步骤对应,因此对于本公开事件的搜索装置实施例中未披露的细节,请参照本公开上述的事件的搜索方法的实施例。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
在本公开示例性实施方式中,还提供了一种能够实现上述方法的计算机存储介质。其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当上述程序产品在终端设备上运行时,上述程序代码用于使上述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
参考图7所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品700,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
上述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RandomAccess Memory,RAM)、只读存储器(Read-Only Memory,ROM)、可擦式可编程只读存储器(erasable programmable read-only memory,EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(Local AreaNetwork,LAN)或广域网(Wide Area Network,WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图8来描述实现上述事件的搜索方法的电子设备800。图8显示的电子设备800仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:至少一个处理单元810、至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830。
其中,上述存储单元存储有程序代码,上述程序代码可以被上述处理单元810执行,使得上述处理单元810执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,上述处理单元810可以执行如图2中所示的:步骤S210,获取目标事件的搜索主题,以及根据所述搜索主题确定目标用户集;步骤S220,获取所述目标事件的对比时间区间,其中,所述对比时间区间至少包括两个子区间;步骤S230,获取所述目标事件的对比指标,以及对于所述目标用户集中每个用户标识,获取在每个所述子区间内生成的关于所述对比指标的指标数据集;以及,步骤S240,根据每个所述子区间对应的指标数据集,确定所述目标用户集中每个用户标识对应的关于所述对比指标的对比值,以完成对所述目标事件的搜索。
示例性的,上述处理单元810还可以执行如图3至图5a/图5b中任意一图所示的事件的搜索方法。
存储单元820可以包括易失性存储单元形式的可读介质,例如:随机存取存储单元(Random Access Memory,RAM)8201和/或高速缓存存储单元8202,还可以进一步包括只读存储单元只读存储器(Read-Only Memory,ROM)8203。
存储单元820还可以包括具有一组(至少一个)程序模块8205的程序/实用工具8204,这样的程序模块8205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线830可以为几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备800也可以与一个或多个外部设备900(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(Input /Output,I/O)接口850进行。进一步地,I/O接口850与显示单元840连接,以通过I/O接口850将待显示内容传输至显示单元840,以供用户查看。
并且,电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网(Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器860通过总线830与电子设备800的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
Claims (10)
1.一种事件的搜索方法,其特征在于,包括:
获取目标事件的搜索主题,以及根据所述搜索主题确定目标用户集;
获取所述目标事件的对比时间区间,其中,所述对比时间区间至少包括两个子区间;
获取所述目标事件的对比指标,以及对于所述目标用户集中每个用户标识,获取在每个所述子区间内生成的关于所述对比指标的指标数据集;
根据每个所述子区间对应的指标数据集,确定所述目标用户集中每个用户标识对应的关于所述对比指标的对比值,以完成对所述目标事件的搜索。
2.根据权利要求1所述的方法,其特征在于,在所述根据所述搜索主题确定目标用户集之后,所述方法还包括:
切分所述目标用户集为多个子集合,以对所述多个子集合进行分布式数据处理。
3.根据权利要求1或2所述的方法,其特征在于,所述对比时间区间包括第一子区间和第二子区间;
所述获取在每个所述子区间内生成的关于所述对比指标的指标数据集,包括:
获取在所述第一子区间内生成的关于所述对比指标的第一指标数据集,获取在所述第二子区间内生成的关于所述对比指标的第二指标数据集。
4.根据权利要求3所述的方法,其特征在于,在获取在所述第一子区间内生成的关于所述对比指标的第一指标数据集,获取在所述第二子区间内生成的关于所述对比指标的第二指标数据集之后,所述方法还包括:
获取所述目标事件的度量方式;
基于所述度量方式,在所述第一指标数据集中确定所述第一子区间对应的第一目标指标数据,在所述第二指标数据集中确定所述第二子区间对应的第二目标指标数据。
5.根据权利要求4所述的方法,其特征在于,所述度量方式包括:最大值、最小值、平均值或众数值;其中,
所述基于所述度量方式,在所述第二指标数据集中确定所述第二子区间对应的第二目标指标数据,包括:
在所述第二指标数据集中确定最大值、最小值或平均值,得到所述第二子区间对应的第二目标指标数据;或,在所述第二指标数据集中确定任意一个众数值,得到所述第二子区间对应的第二目标指标数据。
6.根据权利要求4所述的方法,其特征在于,所述根据每个所述子区间对应的指标数据集,确定所述目标用户集中每个用户标识对应的关于所述对比指标的对比值,包括:
将所述第二目标指标数据和所述第一目标指标数据的比值确定为所述对比值。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取对比值阈值;
获取大于所述对比值阈值的对比值对应的用户标识作为目标用户标识,并存储所述目标用户标识和所述目标用户标识对应的事件发生时间。
8.一种事件的搜索装置,其特征在于,包括:
目标用户集获取模块,被配置为:获取目标事件的搜索主题,以及根据所述搜索主题确定目标用户集;
时间区间获取模块,被配置为:获取所述目标事件的对比时间区间,其中,所述对比时间区间至少包括两个子区间;
指标数据集获取模块,被配置为:获取所述目标事件的对比指标,以及对于所述目标用户集中每个用户标识,获取在每个所述子区间内生成的关于所述对比指标的指标数据集;
对比值确定模块,被配置为:根据每个所述子区间对应的指标数据集,确定所述目标用户集中每个用户标识对应的关于所述对比指标的对比值,以完成对所述目标事件的搜索。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的事件的搜索方法。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的事件的搜索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010068184.0A CN110931136B (zh) | 2020-01-21 | 2020-01-21 | 事件的搜索方法及装置、计算机介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010068184.0A CN110931136B (zh) | 2020-01-21 | 2020-01-21 | 事件的搜索方法及装置、计算机介质和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110931136A CN110931136A (zh) | 2020-03-27 |
CN110931136B true CN110931136B (zh) | 2020-06-19 |
Family
ID=69854785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010068184.0A Active CN110931136B (zh) | 2020-01-21 | 2020-01-21 | 事件的搜索方法及装置、计算机介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110931136B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112669085A (zh) * | 2021-01-04 | 2021-04-16 | 北京明略软件系统有限公司 | 一种目标事件数据的确定方法和装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7647353B2 (en) * | 2006-11-14 | 2010-01-12 | Google Inc. | Event searching |
CN105427217A (zh) * | 2014-12-17 | 2016-03-23 | 伊斯雷尔·巴肯 | 交互型图像电子医疗研究管理系统 |
CN106407190B (zh) * | 2015-07-27 | 2020-01-14 | 阿里巴巴集团控股有限公司 | 一种事件记录查询方法及装置 |
CN110633406B (zh) * | 2018-06-06 | 2023-08-01 | 北京百度网讯科技有限公司 | 事件专题的生成方法、装置、存储介质和终端设备 |
CN110109887B (zh) * | 2019-03-18 | 2021-06-08 | 张宁 | 数据检索方法、电子设备和计算机存储介质 |
-
2020
- 2020-01-21 CN CN202010068184.0A patent/CN110931136B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110931136A (zh) | 2020-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11232365B2 (en) | Digital assistant platform | |
US8930223B2 (en) | Patient cohort matching | |
EP2922018A1 (en) | Medical information analysis program, medical information analysis device, and medical information analysis method | |
CN110265099B (zh) | 用于输出病历的方法和装置 | |
US20190206529A1 (en) | Evaluating Completeness and Data Quality of Electronic Medical Record Data Sources | |
CN113782195A (zh) | 一种体检套餐定制方法和装置 | |
CN113204621A (zh) | 文档入库、文档检索方法,装置,设备以及存储介质 | |
CN111145846A (zh) | 临床试验患者招募方法及装置、电子设备和存储介质 | |
CN112509693A (zh) | 一种临床数据统计分析方法、系统、设备及存储介质 | |
CN107291835B (zh) | 一种搜索词的推荐方法和装置 | |
CN110471941B (zh) | 自动定位判断依据的方法、装置及电子设备 | |
CN111046085A (zh) | 数据的溯源处理方法及装置、介质和设备 | |
CN111383768B (zh) | 医疗数据回归分析方法、装置、电子设备及计算机可读介质 | |
CN110931136B (zh) | 事件的搜索方法及装置、计算机介质和电子设备 | |
CN111008275A (zh) | 数据挖掘方法及装置、存储介质及电子终端 | |
CN111126034B (zh) | 医学变量关系的处理方法及装置、计算机介质和电子设备 | |
Wang et al. | The evolution of publication hotspots in the field of telemedicine from 1962 to 2015 and differences among six countries | |
CN112667773A (zh) | 基于知识图谱的数据获取方法及相关设备 | |
CN111048165A (zh) | 试验样本的确定方法及装置、计算机介质和电子设备 | |
CN112766779B (zh) | 信息处理方法、计算机设备及存储介质 | |
CN114579626A (zh) | 数据处理方法、数据处理装置、电子设备和介质 | |
CN113934894A (zh) | 基于指标树的数据显示方法、终端设备 | |
CN113220896A (zh) | 多来源知识图谱生成方法、装置、终端设备 | |
CN111554387A (zh) | 医生信息推荐的方法、装置、存储介质及电子设备 | |
CN111427874A (zh) | 医疗数据生产的质控方法、装置以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |