CN107704601A - 大数据检索方法与系统、计算机存储介质及电子设备 - Google Patents

大数据检索方法与系统、计算机存储介质及电子设备 Download PDF

Info

Publication number
CN107704601A
CN107704601A CN201710957980.8A CN201710957980A CN107704601A CN 107704601 A CN107704601 A CN 107704601A CN 201710957980 A CN201710957980 A CN 201710957980A CN 107704601 A CN107704601 A CN 107704601A
Authority
CN
China
Prior art keywords
medical data
search condition
data base
retrieval
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710957980.8A
Other languages
English (en)
Inventor
王红迁
汪鹏
王红军
王飞
孙靖
尉雯雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Affiliated Hospital of TMMU
Original Assignee
First Affiliated Hospital of TMMU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of TMMU filed Critical First Affiliated Hospital of TMMU
Priority to CN201710957980.8A priority Critical patent/CN107704601A/zh
Publication of CN107704601A publication Critical patent/CN107704601A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2272Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2425Iterative querying; Query formulation based on the results of a preceding query

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明实施例提供的一种大数据检索方法与系统、计算机存储介质及电子设备,属于数据处理领域,所述方法包括:获取用户的第一检索条件;基于所述第一检索条件,在第一医疗数据库中进行检索,获得第一检索结果;在所述第一检索结果表征所述第一医疗数据库中没有与所述第一检索条件匹配的第一匹配医疗数据时,基于所述第一检索条件,在第二医疗数据库中进行检索,获得第二检索结果,从而使得在查询第一医疗数据库中的数据时,不会涉及到查询第一医疗数据库以外的数据,有效地提高数据的检索效率。其中,所述第一医疗数据库的第一被使用频率大于所述第二医疗数据库的第二被使用频率。

Description

大数据检索方法与系统、计算机存储介质及电子设备
技术领域
本发明涉及数据处理领域,具体而言,涉及一种大数据检索方法与系统、计算机存储介质及电子设备。
背景技术
随着医疗卫生信息化建设进程不断加快,医疗数据的类型与规模正以前所未有的速度增长,规模巨大的临床实验数据、疾病诊断数据、文献数据、基因数据以及居民行为与健康数据汇聚在一起形成医疗健康大数据,并呈现出了大数据的特性。医学数据也正向复杂、多样、海量、时效性的方式转变,未来大部分诊疗服务都是建立在对量化数据利用的基础上,整个医疗服务领域已经步入数据驱动的时代。这些都意味着,医疗领域数据检索对整体系统架构的要求越来越高。
当医疗数据量比较大、比较复杂时,现有技术往往存在对数据的查询时效性力度不够的问题,而面对医学中临床辅助决策的时候,要求快速的给出反馈结果,因此,仅仅采用现有技术无法满足医学场景下对数据检索时效性的需求。
发明内容
鉴于此,本发明实施例的目的在于提供一种大数据检索方法与系统、计算机存储介质及电子设备,用于解决现有技术中在医疗数据量比较大、比较复杂时,存在对数据的检索时效性低下的问题。
第一方面,本发明实施例提供一种大数据检索方法,所述方法包括:获取用户的第一检索条件;基于所述第一检索条件,在第一医疗数据库中进行检索,获得第一检索结果;在所述第一检索结果表征所述第一医疗数据库中没有与所述第一检索条件匹配的第一匹配医疗数据时,基于所述第一检索条件,在第二医疗数据库中进行检索,获得第二检索结果;其中,所述第一医疗数据库的第一被使用频率大于所述第二医疗数据库的第二被使用频率。
进一步地,在基于所述第一检索条件,在第一医疗数据库中进行检索,获得第一检索结果之前,所述方法还包括将至少一个历史检索条件与所述至少一个历史检索条件对应的至少一个历史检索结果进行关联,获得至少一条检索记录;将所述至少一条检索记录存储在所述第一医疗数据库中;将在当前时刻至所述当前时刻之前的预设时刻之间的第一部分医疗数据存储到所述第二医疗数据库中;将所述预设时刻之前的第二部分医疗数据存储到第三医疗数据库中,其中,所述第二被使用频率大于所述医疗数据库的第三被使用频率。
进一步地,基于所述第一检索条件,在第二医疗数据库中进行检索,获得第二检索结果之后,所述方法还包括:在所述第二检索结果表征所述第二医疗数据库中没有与所述第一检索条件匹配的第一匹配医疗数据时,基于所述第一检索条件,在所述第三医疗数据库中进行检索,获得第三检索结果。
进一步地,所述获取用户的第一检索条件,包括:基于所述用户的身份信息,判断所述用户是否有检索权限;在为是时,获取所述用户的第一检索条件。
第二方面,本发明实施例还提供一种大数据检索系统,包括:获取模块,用于获取用户的第一检索条件;第一检索模块,用于基于所述第一检索条件,在第一医疗数据库中进行检索,获得第一检索结果;第二检索模块,用于在所述第一检索结果表征所述第一医疗数据库中没有与所述第一检索条件匹配的第一匹配医疗数据时,基于所述第一检索条件,在第二医疗数据库中进行检索,获得第二检索结果;其中,所述第一医疗数据库的第一被使用频率大于所述第二医疗数据库的第二被使用频率。
进一步地,所述大数据检索系统还包括:第一存储模块,用于将至少一个历史检索条件与所述至少一个历史检索条件对应的至少一个历史检索结果进行关联,获得至少一条检索记录;将所述至少一条检索记录存储在所述第一医疗数据库中;第二存储模块,用于将在当前时刻至所述当前时刻之前的预设时刻之间的第一部分医疗数据存储到所述第二医疗数据库中;第三存储模块,用于将所述预设时刻之前的第二部分医疗数据存储到第三医疗数据库中,其中,所述第二被使用频率大于所述医疗数据库的第三被使用频率。
进一步地,所述获取模块包括:判断单元,用于基于所述用户的身份信息,判断所述用户是否有检索权限;获取单元,用于在为是时,获取所述用户的第一检索条件。
第三方面,本发明实施例还提供了一种计算机存储介质,所述计算机存储介质中存储有计算机指令,在所述计算机指令被计算机读取并执行时,运行所述大数据检索方法。
第四方面,本发明实施例还提供了一种电子设备,包括处理器,及存储有计算机指令的计算机存储介质,在所述计算机指令被所述处理器读取并执行时,运行所述大数据检索方法。
本发明实施例提供的大数据检索方法与系统、计算机存储介质及电子设备,首先获取用户的第一检索条件,然后基于所述第一检索条件,在第一医疗数据库中进行检索,获得第一检索结果,从而使得在在查询第一医疗数据库中的数据时,不会涉及到查询第一医疗数据库以外的数据,有效地提高数据的检索效率,接着在所述第一检索结果表征所述第一医疗数据库中没有与所述第一检索条件匹配的第一匹配医疗数据时,基于所述第一检索条件,在第二医疗数据库中进行检索,获得第二检索结果,其中,所述第一医疗数据库的第一被使用频率大于所述第二医疗数据库的第二被使用频率。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的用户终端与服务器进行交互的示意图;
图2为一种可应用于本发明实施例中的电子设备的结构框图;
图3为本发明实施例提供的一种大数据检索方法流程图;
图4为本发明实施例提供的一种大数据检索方法的详细流程图;
图5为本发明实施例提供的一种数据检索系统的功能模块示意图;
图6为本发明实施例提供的一种大数据检索系统100的功能模块详细示意图。
图标:10-用户终端;20-服务器;400-电子设备;402-存储器;403-存储控制器;404-处理器;405-网络单元;100-大数据检索系统。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
图1为本发明实施例提供的用户终端10与服务器20进行交互的示意图,所述服务器20通过网络30与一个或多个用户终端10进行通信连接,以进行数据通信或交互。所述服务器20可以是网络服务器20、数据库服务器20等。所述用户终端10可以是个人电脑(personal computer,PC)、平板电脑、智能手机、个人数字助理(personal digitalassistant,PDA)、可穿戴设备等终端。
图2示出了一种可应用于本申请实施例中的电子设备400的结构框图。该电子设备400可以作为用户终端10,也可以是作为服务器20。如图2所示,电子设备400可以包括存储器402、存储控制器403、处理器404和网络单元405。
存储器402、存储控制器403、处理器404、网络单元405各元件之间直接或间接地电连接,以实现数据的传输或交互。例如,这些元件之间可以通过一条或多条通讯总线或信号总线实现电连接。所述大数据检索系统100分别包括至少一个可以以软件或硬件(firmware)的形式存储于存储器402中的软件功能模块,例如所述大数据检索系统100包括的软件功能模块或计算机程序。
存储器402可以存储各种软件程序以及模块,如本申请实施例提供的大数据检索方法及系统对应的程序指令/模块。处理器404通过运行存储在存储器402中的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现本申请实施例中的大数据检索方法。存储器402可以包括但不限于随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。
处理器404可以是一种集成电路芯片,具有信号处理能力。上述处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
网络单元405用于接收以及发送网络信号。上述网络信号可包括无线信号或者有线信号。
当电子设备400为用户终端10时,还可以包括显示单元,该显示单元可以在所述用户终端10与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。
请参照图3,图3为本发明实施例提供的一种大数据检索方法的流程图,所述大数据检索方法具体包括如下步骤:
步骤S100:获取用户的第一检索条件。
当用户需要对数据库中的某些数据进行查询时,作为一种实施方式,用户可以通过用户终端10在网络条件下登录大数据检索系统100平台,存有数据库的服务器20获取所述用户的身份信息并基于所述用户的身份信息,判断所述用户是否有检索权限。
在为否时,查询结束。
在为是时,获取所述用户的第一检索条件。
步骤S200:基于所述第一检索条件,在第一医疗数据库中进行检索,获得第一检索结果。
步骤S300:在所述第一检索结果表征所述第一医疗数据库中没有与所述第一检索条件匹配的第一匹配医疗数据时,基于所述第一检索条件,在第二医疗数据库中进行检索,获得第二检索结果。
其中,所述第一医疗数据库的第一被使用频率大于所述第二医疗数据库的第二被使用频率。
在本发明实施例中,步骤S100的具体实现过程可以为:
当用户在网络条件下通过用户终端10输入待检索的内容时,其中,用户输入的待检索的内容可以为任意自然语言表达形式,首先服务器20获取并基于该用户输入的待检索的内容,通过文本分词技术将待检索的内容进行词法分析、语法分析以及语言处理,提取出待检索的关键字;然后,根据用户的输入格式将待检索的关键字构成关键字的关联,形成关键字键,以实现多条件复杂精准的查询效果,例如,将待检索的关键字按照逻辑and或者逻辑or进行关联,以实现多条件复杂精准的查询。
在本发明实施例中,在执行步骤S200之前,本领域技术人员可以采用的实现过程包括:
首先配置整个医疗大数据集成和处理系统,包括分布式文件系统HDFS、Spark、非关系型数据库Mongodb、内存数据库Redis、Flume、Sqoop、爬虫及Lucene等,以实现管理者可通过界面统一管理资源、增删服务等,该系统可实现动态扩容机器以及动态扩展应用,并通过Docker实现资源的容器化;然后,通过部署网闸、运维堡垒机、流量控制器以及Kerberos认证实现严格的权限控制和安全控制,同时,服务器20内设置文件加密机制,保障数据被窃取也无法及时识别。
然后,服务器20将医疗信息子系统的数据、询证数据、基因数据等标记为实时数据并通过Sqoop实时导入到HDFS中,将各种可穿戴设备采集的数据标记为实时数据并通过Flume实时的传送并保存到HDFS中,将临床指南、文献、网络医学信息等数据标记为历史数据并通过爬虫技术导入到HDFS中,同时将各个系统的元数据、各种经常更改频繁查询的信息数据和缓存的数据存储在内存数据库Redis中,当海量医学数据被导入HDFS和Redis后,根据数据条目和内容是否一致来判断是否保存成功,并给出判断反馈。若保存成功,则将服务器20中的缓存队列清空,并在内存数据库中建立与存储在该数据库中的数据对应的第一索引,其中,第一索引为与Redis中的数据对应的关键字,并建立判断索引是否建立成功的机制,第一索引存储在第一索引文件中,第一索引文件存储在Redis中,在本发明实施例中,第一索引为与实时数据对应的关键字,索引建立的时候需指定第一索引shard起始、第一索引shard的结束、设置第一索引的文档集合、设置第一索引建立后存储的位置;若保存不成功,则将缓存队列中的数据重新发送,在本发明实施例中,最多重复5次,一旦超过最高次数的限制,则先写入该机器的本地文件目录,下次定时重发,这样一方面防止因为数据不停重发而导致网络资源被过多占用,另一方面也保证数据不丢失。
最后,利用流式计算技术Spark对存储在HDFS中的原始医学数据进行预处理,即对原始医学数据进行抽取、汇集、结构化,并映射到兼容国际国内医疗数据规范标准的全局Schema中,对字段信息清洗和做语义归一化,即对数据进行过滤、分析、去除脏数据,并利用自然语义处理技术对医嘱等自然语言进行处理,并结合医疗专业术语的语义结构,将医疗语义信息从原始的自然语言表达,扩展分析为结构化的Key-Value模式,再对数据进行分类打标签,为上层应用服务提供准确的基础数据支撑和业务模型训练。其中,脏数据包括错误的数据和重复的数据,还包括自然语言中无用的数据,例如语气感叹词等词语。
将至少一个历史检索条件与所述至少一个历史检索条件对应的至少一个历史检索结果进行关联,获得至少一条检索记录;将所述至少一条检索记录存储在所述第一医疗数据库中,其中,在本发明实施例中,第一医疗数据库为内存数据库Redis,具体实现过程:
当用户通过该大数据检索系统100检索数据后,最新的检索关键字和与该关键字对应的检索结果都被缓存至Redis中,以提高检索效率。
将在当前时刻至所述当前时刻之前的预设时刻之间的第一部分医疗数据存储到所述第二医疗数据库中,其中,在本发明实施例中,第一部分医疗数据为经过预处理的实时数据,当前时刻与当前时刻之前的预设时刻相差1个小时,具体实现过程为:
将HDFS中经过预处理的实时数据转存至第二医疗数据库中,其中,在本发明实施例中,第二医疗数据库为非关系型数据库Mongodb,并根据Mongodb和HDFS中经过预处理的实时数据条目数和内容是否一致来判断是否存储成功,若是,则将HDFS中经过预处理的实时数据清除,若否,则进行重新转存,以免数据丢失。当实时数据成功存储至非关系型Mongodb中时,每隔1小时对实时数据建立对应的第二索引,并建立判断第二索引是否建立成功的机制,其中,第二索引存储在第二索引文件中,第二索引文件存储在Mongodb中,并采用Lucence技术对第二索引文件进行压缩,减小第二索引文件的大小。在本发明实施例中,第二索引为与实时数据对应的关键字,索引建立的时候需指定第二索引shard起始、第二索引shard的结束、设置第二索引的文档集合、设置第二索引建立后存储的位置。
将所述预设时刻之前的第二部分医疗数据存储到第三医疗数据库中,其中,所述第二被使用频率大于所述医疗数据库的第三被使用频率,其中,在本发明实施例中,第三部分医疗数据为经过预处理的历史数据。
将HDFS中经过预处理的历时数据存储至第三医疗数据库中,其中,在本发明实施例中,第三医疗数据库为HDFS,即将经过预处理的历史数据继续保存在HDFS中。当新的历史数据存储在HDFS中时,建立与该历史数据对应的第三索引,并建立判断第三索引是否建立成功的机制,其中,第三索引存储在第三索引文件中,索引文件存储在HDFS中,并采用Lucence技术对第三索引文件进行压缩,减小第三索引文件的大小。在本发明实施例中,第三索引为与历时数据对应的关键字,第三索引建立的时候需指定第三索引shard起始、第三索引shard的结束、设置第三索引的文档集合、设置第三索引建立后存储的位置。
在本发明实施例中,步骤S200的具体实现过程可以为:
首先服务器20将待检索的关键字键与内存数据库Redis中的第一索引数据进行查找匹配,如果内存数据库Redis中存在与待检索的关键字键匹配的关键字,则基于第一索引数据获得与待检索关键字匹配的第一匹配医疗数据,提高检索效率,然后,基于该用户的检索权限对该第一匹配医疗数据进一步审核,剔除与该用户的检索权限不匹配的医疗数据,以防止检索数据范围扩大和敏感数据泄露,最后,根据用户的检索内容与第一匹配医疗数据的相关性,按照时间等多种条件的权重,对第一匹配医疗数据进行排序,同时将获取的具体的数据展示到页面,并对第一匹配医疗数据进行各种维度的统计,生成直观的图表。如果内存数据库Redis中不存在与待检索的关键字键匹配的关键字或者用户想要获取更多的医疗数据,则执行步骤S300。
在本发明实施例中,步骤S300的具体实现过程可以为:
首先服务器20将待检索的关键字键与非关系型数据库Mongdb中的第二索引数据进行查找匹配,如果Mongodb中存在与待检索的关键字键匹配的关键字,则基于第二索引数据获得与待检索关键字匹配的第一匹配医疗数据,提高检索效率。然后,基于该用户的检索权限对该第一匹配医疗数据进一步审核,剔除与该用户的检索权限不匹配的医疗数据,以防止检索数据范围扩大和敏感数据泄露。最后,根据用户的检索内容与第一匹配医疗数据的相关性,按照时间等多种条件的权重,对第一匹配医疗数据进行排序,同时将获取的具体的数据展示到页面,并对第一匹配医疗数据进行各种维度的统计,生成直观的图表。
请参照图4,图4为本发明实施例提供的一种大数据检索方法的详细流程图,基于所述第一检索条件,在第二医疗数据库中进行检索,获得第二检索结果之后,该方法还包括:
S400:在所述第二检索结果表征所述第二医疗数据库中没有与所述第一检索条件匹配的第一匹配医疗数据时,基于所述第一检索条件,在所述第三医疗数据库中进行检索,获得第三检索结果,具体实现过程为:
首先,服务器20将待检索的关键字键与HDFS中的第三索引数据进行查找匹配,如果HDFS中存在与待检索的关键字键匹配的关键字,则基于第三索引数据获得与待检索关键字匹配的第一匹配医疗数据,提高检索效率。然后,基于该用户的检索权限对该第一匹配医疗数据进一步审核,剔除与该用户的检索权限不匹配的医疗数据,以防止检索数据范围扩大和敏感数据泄露。最后,根据用户的检索内容与第一匹配医疗数据的相关性,按照时间等多种条件的权重,对第一匹配医疗数据进行排序,同时将获取的具体的数据展示到页面,并对第一匹配医疗数据进行各种维度的统计,生成直观的图表。如果HDFS中不存在与待检索的关键字键匹配的关键字或者用户想要获取更多的医疗数据,则直接提示无满足条件的数据。
为实现上述大数据检索方法,本发明实施例提供一种大数据检索系统100,请参照图5,图5为本发明提供的一种大数据检索系统100的模块示意图,该系统包括:获取模块110、第一检索模块120、第二检索模块130。
获取模块110,用于获取用户的第一检索条件,其中获取模块110包括判断单元111和获取单元112。
判断单元111,当用户需要对数据库中的某些数据进行查询时,作为一种实施方式,用户可以通过用户终端10在网络条件下登录大数据检索系统100平台,存有数据库的服务器20获取所述用户的身份信息并基于所述用户的身份信息,判断所述用户是否有检索权限。
在为否时,查询结束。
获取单元112,在为是时,获取所述用户的第一检索条件。
第一检索模块120,用于基于所述第一检索条件,在第一医疗数据库中进行检索,获得第一检索结果。
第二检索模块130,用于在所述第一检索结果表征所述第一医疗数据库中没有与所述第一检索条件匹配的第一匹配医疗数据时,基于所述第一检索条件,在第二医疗数据库中进行检索,获得第二检索结果。
其中,所述第一医疗数据库的第一被使用频率大于所述第二医疗数据库的第二被使用频率。
请参照图6,图6为本发明提供的一种大数据检索系统100的模块详细示意图,该系统还包括:第三检索模块140。
第三检索模块140,用于在所述第二检索结果表征所述第二医疗数据库中没有与所述第一检索条件匹配的第一匹配医疗数据时,基于所述第一检索条件,在所述第三医疗数据库中进行检索,获得第三检索结果。
本发明实施例还提供了一种计算机存储介质,用于存储上述图2或图6实现所述的大数据检索系统100所用的计算机软件指令,其包括用于执行上述方法实施例所涉及的程序。通过执行存储程序,可以实现对作者隐私的保护。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的信息处理装置的具体工作过程,可以参考前述信息处理方法中的对应过程,在此不再过多赘述。
综上所述,本发明实施例提供的大数据检索方法与系统、计算机存储介质及电子设备,首先获取用户的第一检索条件,然后基于所述第一检索条件,在第一医疗数据库中进行检索,获得第一检索结果,接着在所述第一检索结果表征所述第一医疗数据库中没有与所述第一检索条件匹配的第一匹配医疗数据时,基于所述第一检索条件,在第二医疗数据库中进行检索,获得第二检索结果,从而使得在在查询第一医疗数据库中的数据时,不会涉及到查询第一医疗数据库以外的数据,有效地提高数据的检索效率,其中,所述第一医疗数据库的第一被使用频率大于所述第二医疗数据库的第二被使用频率。
在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种大数据检索方法,其特征在于,所述方法包括:
获取用户的第一检索条件;
基于所述第一检索条件,在第一医疗数据库中进行检索,获得第一检索结果;
在所述第一检索结果表征所述第一医疗数据库中没有与所述第一检索条件匹配的第一匹配医疗数据时,基于所述第一检索条件,在第二医疗数据库中进行检索,获得第二检索结果;
其中,所述第一医疗数据库的第一被使用频率大于所述第二医疗数据库的第二被使用频率。
2.根据权利要求1所述的大数据检索方法,其特征在于,所述基于所述第一检索条件,在第一医疗数据库中进行检索,获得第一检索结果之前,所述方法还包括:
将至少一个历史检索条件与所述至少一个历史检索条件对应的至少一个历史检索结果进行关联,获得至少一条检索记录;将所述至少一条检索记录存储在所述第一医疗数据库中;
将在当前时刻至所述当前时刻之前的预设时刻之间的第一部分医疗数据存储到所述第二医疗数据库中;
将所述预设时刻之前的第二部分医疗数据存储到第三医疗数据库中,其中,所述第二被使用频率大于所述医疗数据库的第三被使用频率。
3.根据权利要求2所述的大数据检索方法,其特征在于,基于所述第一检索条件,在第二医疗数据库中进行检索,获得第二检索结果之后,所述方法还包括:
在所述第二检索结果表征所述第二医疗数据库中没有与所述第一检索条件匹配的第一匹配医疗数据时,基于所述第一检索条件,在所述第三医疗数据库中进行检索,获得第三检索结果。
4.根据权利要求1-3任一权项所述的大数据检索方法,其特征在于,所述获取用户的第一检索条件,包括:
基于所述用户的身份信息,判断所述用户是否有检索权限;
在为是时,获取所述用户的第一检索条件。
5.一种大数据检索系统,其特征在于,包括:
获取模块,用于获取用户的第一检索条件;
第一检索模块,用于基于所述第一检索条件,在第一医疗数据库中进行检索,获得第一检索结果;
第二检索模块,用于在所述第一检索结果表征所述第一医疗数据库中没有与所述第一检索条件匹配的第一匹配医疗数据时,基于所述第一检索条件,在第二医疗数据库中进行检索,获得第二检索结果;
其中,所述第一医疗数据库的第一被使用频率大于所述第二医疗数据库的第二被使用频率。
6.根据权利要求5所述的大数据检索系统,其特征在于,所述大数据检索系统还包括:
第一存储模块,用于将至少一个历史检索条件与所述至少一个历史检索条件对应的至少一个历史检索结果进行关联,获得至少一条检索记录;将所述至少一条检索记录存储在所述第一医疗数据库中;
第二存储模块,用于将在当前时刻至所述当前时刻之前的预设时刻之间的第一部分医疗数据存储到所述第二医疗数据库中;
第三存储模块,用于将所述预设时刻之前的第二部分医疗数据存储到第三医疗数据库中,其中,所述第二被使用频率大于所述医疗数据库的第三被使用频率。
7.根据权利要求6所述的大数据检索系统,其特征在于,所述大数据检索系统还包括:
第三检索模块,用于在所述第二检索结果表征所述第二医疗数据库中没有与所述第一检索条件匹配的第一匹配医疗数据时,基于所述第一检索条件,在所述第三医疗数据库中进行检索,获得第三检索结果。
8.根据权利要求5-7任一权项所述的大数据检索系统,其特征在于,所述获取模块包括:
判断单元,用于基于所述用户的身份信息,判断所述用户是否有检索权限;
获取单元,用于在为是时,获取所述用户的第一检索条件。
9.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机指令,在所述计算机指令被计算机读取并执行时,运行如权利要求1-4中任一权项所述的方法。
10.一种电子设备,其特征在于,包括处理器,及存储有计算机指令的计算机存储介质,在所述计算机指令被所述处理器读取并执行时,运行如权利要求1-4中任一权项所述的方法。
CN201710957980.8A 2017-10-13 2017-10-13 大数据检索方法与系统、计算机存储介质及电子设备 Pending CN107704601A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710957980.8A CN107704601A (zh) 2017-10-13 2017-10-13 大数据检索方法与系统、计算机存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710957980.8A CN107704601A (zh) 2017-10-13 2017-10-13 大数据检索方法与系统、计算机存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN107704601A true CN107704601A (zh) 2018-02-16

Family

ID=61183830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710957980.8A Pending CN107704601A (zh) 2017-10-13 2017-10-13 大数据检索方法与系统、计算机存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN107704601A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109697201A (zh) * 2018-12-27 2019-04-30 清华大学 一种查询处理的方法、系统、设备及计算机可读存储介质
CN109902218A (zh) * 2019-01-25 2019-06-18 重庆科技学院 一种互联网统计数据获取方法及系统
CN109947751A (zh) * 2018-12-29 2019-06-28 医渡云(北京)技术有限公司 一种医疗数据处理方法、装置、可读介质及电子设备
CN110334258A (zh) * 2018-02-28 2019-10-15 江苏融成爱伊文化传播有限公司 一种基于自定义标签的网络文本内容管理办法
CN110633315A (zh) * 2018-06-20 2019-12-31 中国移动通信集团有限公司 一种数据处理方法、设备及计算机存储介质
CN110634542A (zh) * 2019-08-15 2019-12-31 卓尔智联(武汉)研究院有限公司 电子病历建立方法、装置及存储介质
CN110874417A (zh) * 2018-09-04 2020-03-10 华为技术有限公司 数据检索的方法和装置
CN110895538A (zh) * 2018-09-13 2020-03-20 深圳市蓝灯鱼智能科技有限公司 数据检索方法、装置、存储介质和处理器
CN111161817A (zh) * 2019-12-31 2020-05-15 医渡云(北京)技术有限公司 医疗数据标准化处理方法、装置、介质及电子设备
CN111200624A (zh) * 2018-11-19 2020-05-26 浙江宇视科技有限公司 一种跨网闸数据传输方法及系统
WO2020125290A1 (zh) * 2018-12-18 2020-06-25 中兴通讯股份有限公司 数据处理方法、系统及存储介质
CN111611467A (zh) * 2020-04-29 2020-09-01 广州小迈网络科技有限公司 电商信息的处理方法、系统和存储介质
CN112685364A (zh) * 2020-12-24 2021-04-20 北京浪潮数据技术有限公司 Flume元数据信息分析提取方法及相关组件
CN113284573A (zh) * 2021-06-02 2021-08-20 山东健康医疗大数据有限公司 一种文档数据库检索方法与装置
CN115619387A (zh) * 2022-11-22 2023-01-17 云账户技术(天津)有限公司 询证数据的校核方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110074A (zh) * 2007-01-30 2008-01-23 浪潮乐金信息系统有限公司 基于文件系统缓存的数据加速查询方法
CN101499070A (zh) * 2008-02-02 2009-08-05 北京城市学院 基于开放数据库接口的历史和实时数据访问系统和方法
CN105868411A (zh) * 2016-04-27 2016-08-17 国网上海市电力公司 一种非关系型与关系型数据库一体化数据查询方法与系统
CN106446038A (zh) * 2016-08-31 2017-02-22 武汉钢铁工程技术集团通信有限责任公司 基于混合数据库的数据访问控制系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110074A (zh) * 2007-01-30 2008-01-23 浪潮乐金信息系统有限公司 基于文件系统缓存的数据加速查询方法
CN101499070A (zh) * 2008-02-02 2009-08-05 北京城市学院 基于开放数据库接口的历史和实时数据访问系统和方法
CN105868411A (zh) * 2016-04-27 2016-08-17 国网上海市电力公司 一种非关系型与关系型数据库一体化数据查询方法与系统
CN106446038A (zh) * 2016-08-31 2017-02-22 武汉钢铁工程技术集团通信有限责任公司 基于混合数据库的数据访问控制系统及方法

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334258A (zh) * 2018-02-28 2019-10-15 江苏融成爱伊文化传播有限公司 一种基于自定义标签的网络文本内容管理办法
CN110633315A (zh) * 2018-06-20 2019-12-31 中国移动通信集团有限公司 一种数据处理方法、设备及计算机存储介质
CN110874417A (zh) * 2018-09-04 2020-03-10 华为技术有限公司 数据检索的方法和装置
WO2020048145A1 (zh) * 2018-09-04 2020-03-12 华为技术有限公司 数据检索的方法和装置
CN110874417B (zh) * 2018-09-04 2024-04-16 华为技术有限公司 数据检索的方法和装置
US11816117B2 (en) 2018-09-04 2023-11-14 Huawei Technologies Co., Ltd. Data retrieval method and apparatus
CN110895538A (zh) * 2018-09-13 2020-03-20 深圳市蓝灯鱼智能科技有限公司 数据检索方法、装置、存储介质和处理器
CN111200624A (zh) * 2018-11-19 2020-05-26 浙江宇视科技有限公司 一种跨网闸数据传输方法及系统
CN111200624B (zh) * 2018-11-19 2023-05-23 浙江宇视科技有限公司 一种跨网闸数据传输方法及系统
WO2020125290A1 (zh) * 2018-12-18 2020-06-25 中兴通讯股份有限公司 数据处理方法、系统及存储介质
CN109697201A (zh) * 2018-12-27 2019-04-30 清华大学 一种查询处理的方法、系统、设备及计算机可读存储介质
CN109697201B (zh) * 2018-12-27 2020-12-04 清华大学 一种查询处理的方法、系统、设备及计算机可读存储介质
CN109947751A (zh) * 2018-12-29 2019-06-28 医渡云(北京)技术有限公司 一种医疗数据处理方法、装置、可读介质及电子设备
CN109947751B (zh) * 2018-12-29 2023-04-07 医渡云(北京)技术有限公司 一种医疗数据处理方法、装置、可读介质及电子设备
CN109902218A (zh) * 2019-01-25 2019-06-18 重庆科技学院 一种互联网统计数据获取方法及系统
CN110634542A (zh) * 2019-08-15 2019-12-31 卓尔智联(武汉)研究院有限公司 电子病历建立方法、装置及存储介质
CN110634542B (zh) * 2019-08-15 2022-04-05 卓尔智联(武汉)研究院有限公司 电子病历建立方法、装置及存储介质
CN111161817B (zh) * 2019-12-31 2023-09-19 医渡云(北京)技术有限公司 医疗数据标准化处理方法、装置、介质及电子设备
CN111161817A (zh) * 2019-12-31 2020-05-15 医渡云(北京)技术有限公司 医疗数据标准化处理方法、装置、介质及电子设备
CN111611467A (zh) * 2020-04-29 2020-09-01 广州小迈网络科技有限公司 电商信息的处理方法、系统和存储介质
CN112685364A (zh) * 2020-12-24 2021-04-20 北京浪潮数据技术有限公司 Flume元数据信息分析提取方法及相关组件
CN113284573A (zh) * 2021-06-02 2021-08-20 山东健康医疗大数据有限公司 一种文档数据库检索方法与装置
CN115619387A (zh) * 2022-11-22 2023-01-17 云账户技术(天津)有限公司 询证数据的校核方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN107704601A (zh) 大数据检索方法与系统、计算机存储介质及电子设备
US10984913B2 (en) Blockchain system for natural language processing
CN111462845A (zh) 动态表单生成方法、装置、计算机设备和存储介质
CN108509547A (zh) 一种信息管理方法、信息管理系统及电子设备
CN105550206B (zh) 结构化查询语句的版本控制方法及装置
JP2011513811A5 (zh)
CA2646362A1 (en) Report generation with integrated quality management
US7676557B1 (en) Dynamically adaptive portlet palette having user/context customized and auto-populated content
CN112131295A (zh) 基于Elasticsearch的数据处理方法及设备
US9311345B2 (en) Template based database analyzer
CN106951503A (zh) 信息提供方法、装置、设备以及存储介质
CN109615534A (zh) 风控审核模型生成方法、装置、设备及可读存储介质
CN106952020A (zh) 医疗信息化基于网页的医生评级推荐系统及方法
CN110069763A (zh) 合同文本定制方法、装置、设备及可读存储介质
CN111859969A (zh) 数据分析方法及装置、电子设备、存储介质
CN112465172A (zh) 一种医院智能就诊方法及装置
CN107766400A (zh) 文本检索方法及系统
DE112016004967T5 (de) Automatisiertes Auffinden von Informationen
CN110427626B (zh) 关键词的提取方法及装置
CN110019501A (zh) 一种数据采集方法、装置及终端设备
CN107291922A (zh) 一种数据分配方法及装置
CN104391844A (zh) 数据管理系统和工具
CN116010662A (zh) 一种能源消费-碳排放查询系统的构建方法、装置及介质
CN114882965A (zh) 一种单病种数据上报方法、终端设备及存储介质
US9460139B2 (en) Distributed storage system with pluggable query processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180216