CN111063447B - 查询和文本处理方法及装置、电子设备和存储介质 - Google Patents
查询和文本处理方法及装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN111063447B CN111063447B CN201911301748.4A CN201911301748A CN111063447B CN 111063447 B CN111063447 B CN 111063447B CN 201911301748 A CN201911301748 A CN 201911301748A CN 111063447 B CN111063447 B CN 111063447B
- Authority
- CN
- China
- Prior art keywords
- query
- word
- medical
- matched
- path
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title description 14
- 238000000034 method Methods 0.000 claims abstract description 52
- 238000012545 processing Methods 0.000 claims abstract description 45
- 230000011218 segmentation Effects 0.000 claims abstract description 38
- 238000004590 computer program Methods 0.000 claims description 9
- 206010012601 diabetes mellitus Diseases 0.000 description 19
- 238000010586 diagram Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000003745 diagnosis Methods 0.000 description 5
- 208000015181 infectious disease Diseases 0.000 description 5
- 230000002458 infectious effect Effects 0.000 description 5
- 238000011282 treatment Methods 0.000 description 5
- 208000032131 Diabetic Neuropathies Diseases 0.000 description 4
- 206010020772 Hypertension Diseases 0.000 description 4
- 208000029078 coronary artery disease Diseases 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 208000006454 hepatitis Diseases 0.000 description 4
- 231100000283 hepatitis Toxicity 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 4
- 206010037660 Pyrexia Diseases 0.000 description 3
- 208000002249 Diabetes Complications Diseases 0.000 description 2
- 206010012655 Diabetic complications Diseases 0.000 description 2
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 208000003611 congenital autoimmune diabetes mellitus Diseases 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 229940126680 traditional chinese medicines Drugs 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 229940126673 western medicines Drugs 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3335—Syntactic pre-processing, e.g. stopword elimination, stemming
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Public Health (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开提供一种查询方法、装置以及电子设备和计算机可读存储介质,该方法包括:获取查询短语和查询路径;对所述查询短语进行分词处理,获得查询词;根据所述查询词在目标医疗数据库中按照所述查询路径获取与所述查询词匹配的词语;根据与所述查询词匹配的词语确定并显示查询结果。本公开实施例提供的技术方案可以根据查询路径快速的获取与查询词相关的查询结果。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及查询和文本处理方法及装置、电 子设备和计算机可读存储介质。
背景技术
随着医疗信息化的普及,各个医院都逐渐建立了比较成熟的医疗信息系统, 各个医院也积累了大量电子病历数据、诊断记录、入院记录、用药处方等。这 些数据对医学科学研究有很大的潜在价值。而在医疗研究中通常需要检索与病 人疾病、诊疗相关的数据。例如,有时需要检索与糖尿病有关的信息,而与糖 尿病有关的信息可能会包括患有该糖尿病的病人,治疗糖尿病做的特定手术名、 物理检查、实验室检查等,以及治疗该糖尿病使用的药品(包括药品通用名称、 化学名称等)等。如何在复杂的医疗信息中高效、精确地查找上述医疗数据成为了一个难题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的 背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的 信息。
发明内容
本公开实施例提供了查询和文本处理方法及装置、电子设备和计算机可 读存储介质,能够快速、便捷的查询到与查询短语相关的医疗内容。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通 过本公开的实践而习得。
本公开实施例提出一种查询方法,该方法包括:获取查询短语和查询 路径;对所述查询短语进行分词处理,获得查询词;根据所述查询词在目 标医疗数据库中按照所述查询路径获取与所述查询词匹配的词语;根据与 所述查询词匹配的词语确定并显示查询结果。
在一些实施例中,根据所述查询词在目标医疗数据库中按照所述查询 路径获取与所述查询词匹配的词语,包括:在医疗词汇知识图谱中确定与 所述查询词匹配的词语。
在一些实施例中,所述查询词包括第一查询词和第二查询词,所述查 询路径包括第一查询路径和第二查询路径;其中,根据所述查询词在目标 医疗数据库中按照所述查询路径获取与所述查询词匹配的词语,包括:根 据所述第一查询词在所述目标医疗数据库中按照所述第一查询路径获取与 所述第一查询词匹配的第一匹配词;根据所述第一查询词在所述目标医疗数据库中按照所述第二查询路径获取与所述第一查询词匹配的第二匹配词; 根据所述第二查询词在所述目标医疗数据库中按照所述第一查询路径获取 与所述第一查询词匹配的第三匹配词;根据所述第二查询词在所述目标医 疗数据库中按照所述第二查询路径获取与所述第一查询词匹配的第四匹配 词。
在一些实施例中,根据所述查询词在目标医疗数据库中按照所述查询 路径获取与所述查询词匹配的词语还包括:对在所述第一查询路径下获取 的所述第一匹配词和所述第三匹配词对应的值进行去重处理,以获得第一 匹配值;对在所述第二查询路径下获取的所述第二匹配词和所述第四匹配 词对应的值进行去重处理,以获得第二匹配值;对所述第一匹配值和所述第二匹配值进行合并处理,以获得与所述查询词匹配的值。
在一些实施例中,根据与所述查询词匹配的词语确定并显示查询结果, 包括:根据与所述查询词匹配的值获得与所述查询短语匹配的医疗文本样 本。
在一些实施例中,根据与所述查询词匹配的词语确定并显示查询结果, 包括:根据所述与所述查询词匹配的值确定所述查询词在所述目标医疗数 据库中的词频。
在一些实施例中,所述医疗词汇知识图谱包括所述查询词、与所述查 询词匹配的标准词;根据与所述查询词匹配的词语确定并显示查询结果, 包括:根据所述医疗词汇知识图谱获取与所述查询词匹配的标准词;显示 与所述查询词匹配的标准词。
本公开实施例提出了一种文本处理方法,所述文本处理方法包括:获 取医疗文本样本;获取所述医疗文本样本中各个字段的值,并根据所述医 疗文本的名称和所述医疗文本中各个字段的名称确定所述值的路径;对所 述值进行分词处理,以获得所述值的分词结果;将同一路径下的值的分词结果合并存储,以生成目标医疗数据库。
在一些实施例中,获取所述医疗文本样本中各个字段的值,包括:对 所述医疗文本样本中各个字段的值分别进行去重处理。
在一些实施例中,所述文本处理方法还包括:获取所述医疗文本样本 中各个字段的值在所述目标医疗数据库中的词频。
本公开实施例提出了一种查询装置,所述查询装置包括:查询内容获 取模块、查询词确定模块、匹配词语确定模块以及查询结果确定模块。
其中,所述查询内容获取模块可以配置为获取查询短语和查询路径; 所述查询词确定模块可以配置为对所述查询短语进行分词处理,获得查询 词;所述匹配词语确定模块可以配置为根据所述查询词在目标医疗数据库 中按照所述查询路径获取与所述查询词匹配的词语;所述查询结果确定模 块可以配置为根据与所述查询词匹配的词语确定并显示查询结果。
本公开实施例提出一种文本处理装置,所述文本处理装置包括:医疗 样本获取模块、路径确定模块、分词结果获取模块以及目标医疗数据库生 成模块。
其中,所述医疗样本获取模块可以配置为获取医疗文本样本;所述路 径获取模块可以配置为获取所述医疗文本样本中各个字段的值,并根据所 述医疗文本的名称和所述医疗文本中各个字段的名称确定所述值的路径; 所述分词结果获取模块可以配置为对所述值进行分词处理,以获得所述值 的分词结果;所述目标医疗数据库生成模块可以配置为将同一路径下的值的分词结果合并存储,以生成目标医疗数据库。
本公开实施例提出一种电子设备,该电子设备包括:一个或多个处理器; 存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或 多个处理器执行,使得所述一个或多个处理器实现上述任一项所述的查询方 法或文本处理方法。
本公开实施例提出一种计算机可读存储介质,其上存储有计算机程序, 所述程序被处理器执行时实现如上述任一项所述的查询方法或文本处理方 法。
本公开实施例提供的查询方法、装置及电子设备和计算机可读存储介质, 通过查询短语获得了细粒度的查询词,并按照查询路径查找到与查询词向匹配 的词语,以获得查询结果。该方法按照查询路径进行信息的查询,相比于在整 个目标医疗数据库中进行查询可以极大的提高查询效率和查询的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不 能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公 开的实施例,并与说明书一起用于解释本公开的原理。下面描述的附图仅仅 是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性 劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了可以应用于本公开实施例的查询、文本处理方法或查询、文办 处理装置的示例性系统架构的示意图。
图2是根据一示例性实施例示出的一种应用于查询、文本处理装置的计 算机系统的结构示意图。
图3是根据一示例性实施例示出的多种医疗文本示意图。
图4是根据一示例性实施例示出的一种文本处理方法的流程图。
图5是根据一示例性实施例示出的一种病历模板的示意图。
图6是根据一示例性实施例示出的一种病历文本样本的示意图。
图7是根据一示例性实施例示出的一种查询方法的流程图。
图8是根据一示例性实施例示出的一种查询交互界面。
图9是图7中步骤S03在一示例性实施例中的流程图。
图10是根据一示例性实施例示出的一种医疗词汇知识图谱的示意图。
图11是图7中步骤S03在另一示例性实施例中的流程图。
图12是图7中步骤S04在一示例性实施例中的流程图。
图13是根据一示例性实施例示出的一种查询装置的框图。
图14是根据一示例性实施例示出的一种文本处理装置的框图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多 种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施 例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的 技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它 们的重复描述。
本公开所描述的特征、结构或特性可以以任何合适的方式结合在一个或 更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的 实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的 技术方案而省略特定细节中的一个或更多,或者可以采用其它的方法、组元、 装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图仅为本公开的示意性图解,图中相同的附图标记表示相同或类似的 部分,因而将省略对它们的重复描述。附图中所示的一些方框图不一定必须 与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体, 或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/ 或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和步骤, 也不是必须按所描述的顺序执行。例如,有的步骤还可以分解,而有的步骤 可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本说明书中,用语“一个”、“一”、“该”、“所述”和“至少一个”用以表示存 在一个或多个要素/组成部分/等;用语“包含”、“包括”和“具有”用以表示开放式的包括在内的意思并且是指除了列出的要素/组成部分/等之外还可存在另外 的要素/组成部分/等;用语“第一”、“第二”和“第三”等仅作为标记使用,不是对其对象的数量限制。
下面结合附图对本公开示例实施方式进行详细说明。
图1示出了可以应用于本公开实施例的查询、文本处理方法或查询、文办 处理装置的示例性系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104 和服务器105。网络104用以在终端设备101、102、103和服务器105之间提 供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信 链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互, 以接收或发送消息等。其中,终端设备101、102、103可以是具有显示屏并 且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上 型便携计算机、台式计算机、可穿戴设备、虚拟现实设备、智能家居等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、 102、103所进行操作的装置提供支持的后台管理服务器。后台管理服务器可 以对接收到的请求等数据进行分析等处理,并将处理结果反馈给终端设备。
服务器105可例如获取查询短语和查询路径;服务器105可例如对所述查 询短语进行分词处理,获得查询词;服务器105可例如根据所述查询词在目标 医疗数据库中按照所述查询路径获取与所述查询词匹配的词语。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的, 服务器105可以是一个实体的服务器,还可以为多个服务器组成,根据实际需 要,可以具有任意数目的终端设备、网络和服务器。
下面参考图2,其示出了适于用来实现本申请实施例的终端设备的计算机 系统200的结构示意图。图2示出的终端设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图2所示,计算机系统200包括中央处理单元(CPU)201,其可以根 据存储在只读存储器(ROM)202中的程序或者从储存部分208加载到随机访 问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM 203 中,还存储有系统200操作所需的各种程序和数据。CPU 201、ROM 202以及 RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线 204。
以下部件连接至I/O接口205:包括键盘、鼠标等的输入部分206;包括 诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分 207;包括硬盘等的储存部分208;以及包括诸如LAN卡、调制解调器等的网 络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。 驱动器210也根据需要连接至I/O接口205。可拆卸介质211,诸如磁盘、光 盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入储存部分208。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现 为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行 流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过 通信部分209从网络上被下载和安装,和/或从可拆卸介质211被安装。在该 计算机程序被中央处理单元(CPU)201执行时,执行本申请的系统中限定的 上述功能。
需要说明的是,本申请所示的计算机可读存储介质可以是计算机可读信 号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存 储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体 的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体 的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程 只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、 光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算 机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可 读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中 承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包 括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号 介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算 机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可 以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或 者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和 计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或 框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、 程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以 以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可 以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能 而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的 方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现, 或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块和/或单元和/或子单元可以通过软 件的方式实现,也可以通过硬件的方式来实现。所描述的模块和/或单元和/或 子单元也可以设置在处理器中,例如,可以描述为:一种处理器包括发送单 元、获取单元、确定单元和第一处理单元。其中,这些模块和/或单元和/或子单元的名称在某种情况下并不构成对该模块和/或单元和/或子单元本身的限 定。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可 读存储介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在, 而未装配入该设备中。上述计算机可读存储介质承载有一个或者多个程序, 当上述一个或者多个程序被一个该设备执行时,使得该设备可实现功能包括: 获取查询短语和查询路径;对所述查询短语进行分词处理,获得查询词;根据所述查询词在目标医疗数据库中按照所述查询路径获取与所述查询词匹配的 词语;根据与所述查询词匹配的词语确定并显示查询结果。
在医疗技术领域中,医疗数据逐日增多,可以形成一个数据量巨大的医疗 数据库,其中医疗数据库可以包括电子病历医疗数据库。在一些实施例中,所 述电子病历医疗数据库中可以包括如图3所示的:患者基本信息、患者院内基 本信息、住院病案首页、临床版住院病案首页、就诊信息、转科历史、扩展文档、转床记录、科室就诊信息、诊断记录、医疗发票记录、医疗费用明细信息、 中西医处方、药品类医嘱、草药处方等信息。
对于目标用户(例如医疗研究人员或医护人员)来讲,医疗数据库中的医 疗数据就是一笔巨大的财富。目标用户可以从所述医疗数据库中获取与目标对 象(所述目标用户关心的内容,例如糖尿病就可以是目标对象)相关的信息。 例如,当医生面临疑难问题时,可以通过上述医疗数据库查看前人是如何处理 该类疑难问题的。具体的说,面对糖尿病问题,医生可以在医疗数据库中查询 与糖尿病相关的病历、治疗方法、诊疗判断等。
图4是根据一示例性实施例示出的一种文本处理方法的流程图。本公开实 施例所提供的方法可以由任意具备计算处理能力的电子设备处理,例如上述图 1实施例中的服务器105和/或终端设备102、103,在下面的实施例中,以服 务器105为执行主体为例进行举例说明,但本公开并不限定于此。
参照图4,本公开实施例提供的文本处理方法可以包括以下步骤。
在步骤S11中,获取医疗文本样本。
在一些实施例中,所述医疗文本样本可以包括患者基本信息文本、患者院 内基本信息文本、患者住院病案首页文本、患者临床版住院病案首页文本、患 者就诊信息文本、患者转科历史文本、患者扩展文档文本、患者转床记录文本、 患者科室就诊信息文本、患者诊断记录文本、医疗发票记录文本、医疗费用明 细信息文本、患者中西医处方文本、患者药品类医嘱文本、患者的草药处方文本等不同类别的医疗文本。其中,每种类别的医疗文本样本又可以包括多个不 同科室的医疗文本样本,每个科室的医疗文本样本又可以包括不同患者的医疗 文本样本。例如,在XX医院中,可能包括病历文本、住院文本、就诊文本、 转科文本等医疗文本,其中病历文本可能会包括传染科病历文本、呼吸内科病 历文本、心血管内科病历文本等,而传染病科病历文本又可例如包括“张三病 历文本”、“李四病历文本”等不同患者的病历文本。
在一些实施例中,同一类别(例如两个传染科病历文本)的病历文本的模 板可以相同。图5给出了一种类别的病历文本模板,如图5所示的病历文本模 块中可以包括姓名、性别、年龄、婚姻、主诉、现病史、既往史等信息。
在一些实施例中,不同患者的病历文本的字段的值可以不同。其中字段可 以指的是所述病历文本中的属性以及内容,所述字段的值可以指的所示所述属 性对应的内容。
如图6所示,“姓名:张三”、“性别:男”、“既往史:否认高血压、 冠心病史,否认肝炎…”等都可以是一个字段。其中对于字段“姓名:张三” 来说,“张三”就可以是该字段的值;对于字段“既往史:否认高血压、冠心 病史,否认肝炎…”来说“否认高血压、冠心病史,否认肝炎…”就可以是该字段的值。
可以理解的是,所述医疗文本样本中字段的值可以是一个词语,也可以是 一句话、一段字,本公开对此不做限制。
综上所述,本公开实施例中获取的医疗文本样本可以包括不同类别、不同 科室以及不同患者的医疗文本样。
在步骤S12中,获取所述医疗文本样本中各个字段的值,并根据所述医疗 文本的名称和所述医疗文本中各个字段的名称确定所述值的路径。
在一些实施例中,可以分别从不同医疗文本样本获取该医疗文本样本包括 的字段以及该字段对应的值。
例如,可以从如图6所示的医疗文本样本中获取该医疗文本样本中包括的 字段“姓名:张三”、“性别:男”、“年龄:18”、“婚姻:未婚”、“主 诉:指促使患者就诊的主要症状(或体征)及其持续时间”、“既往史:否认 高血压、冠心病史,否认肝炎……”等,并获取各个字段对应的值。
在一些实施例中,可以对医疗文本样本中的值进行编号,以便于后续查询 过程中的去重处理。
在一些实施例中,可以对目标医疗数据库(例如,电子病历医疗数据库) 中所有的值进行编号,也可以对目标医疗数据库中各个路径下的值分别进行编 号。
在一些实施例中,可以根据医疗文本的名称以及医疗文本中各个字段的名 称确定所述值的路径。
例如,假设图6所示的病历文本为传染科病历文本,那么图6中字段“姓 名:张三”这个字段的值的路径可以确定为“传染科病历文本_姓名”。
可以理解的是,根据医疗文本的名称以及医疗文本中各个字段的名称确定 对应值的路径的目的可以是将同一类别的医疗文本中同统一属性(可以理解为 同一字段)的值存储在一起。
因此,任意其它可以将相同医疗文本中的字段的相同字段的值进行统处理 的路径都可以是本公开可以保护的路径。
在步骤S13中,对所述值进行分词处理,以获得所述值的分词结果。
在一些实施例中,可以对各个字段的值分别进行分词处理,以获得各个字 段对应的值的分词结果。
可以理解的是,分词后每个词语都有对应的值,每个值都有自己的编号。
在步骤S14中,将同一路径下的值的分词结果合并存储,以生成目标医疗 数据库。
在一些实施例中,将同一路径下的值的分词结果合并存储可以包括将同一 类别的(或者同一类别、同一科室)医疗文本中同一属性的值存储在一起。例 如,可以将如图6所示的“住院病历”的“姓名”属性的所有的值合并存储。
在一些实施例中,在获取所述医疗文本样本中各个字段的值的同时还可以 对所述医疗文本样本中各个字段的值分别进行去重处理。
在一些实施例中,同一医疗样本中同一字段的值可能会包括相同的内容。 例如,在图6所示的住院病历文本中,“姓名”属性中可能会包括“张三”、 “李四”、“张三”等多个值。
在一些实施例中,可以对医疗文本的同一字段的值进行去重处理。
在一些实施例中,可以分别获取所述医疗文本样本中各个字段的值在所述 目标医疗数据库中的词频。
一般来说,一个词语在一个值中可能只出现一次,如果事先统计了各个值 在所述目标医疗数据库中的词频,那么在获取该值包括的某个词语的词频时将 会大大提高运算效率。
例如,目标对象A可能与值a、b、c、d等对应,其中值a在所述目标医 疗数据库中的词频为f1,值b在所述目标医疗数据库中的词频为f2、值c在所 述目标医疗数据库中的词频为f3,值d在所述目标医疗数据库中的词频为f4, 那么目标对象A在所述目标医疗数据库中的词频可以为f1+f2+f3f+f4。
本实施例提供的文本处理方法,将目标医疗数据库中的数据按照路径进行 了分类,以便方便、快捷的进行查询操作。
图7是根据一示例性实施例示出的一种查询方法的流程图。本公开实施例 所提供的方法可以由任意具备计算处理能力的电子设备处理,例如上述图1 实施例中的服务器105和/或终端设备102、103,在下面的实施例中,以服务 器105为执行主体为例进行举例说明,但本公开并不限定于此。
参照图7,本公开实施例提供的查询方法可以包括以下步骤。
在步骤S01中,获取查询短语和查询路径。
在一些实施例中,目标用户可以在查询界面输入查询短语和查询路径。例 如所述目标用户可以在如图8所示的查询界面中的查询词位置处输入查询短 语(例如,糖尿病,或先天糖尿病患者等)。
在一些实施例中,目标用户可以在查询界面的路径位置处添加查询路径, 也可以不输入查询路径。若目标用户不输入查询路径,则可以在整个目标医疗 数据库中进行信息的查询。
在一些实施例中,目标用户选择的查询路径可以是一个也可以是多个,本 公开对此不做限制。
对于医疗人员或医护人员来说,可能需要在指定科室或者指定医疗文本类 别中进行医疗数据的查询。例如,对于内科医护人员来说,他们可能需要在内 科的医疗数据中查询“发烧”对应的医疗数据。在这种情况下,他们可以在如 图8所示的界面中的搜索词中输入“发烧”,在路径中添加如“内科病历文本 _症状”等路径,其中“内科病历文本_症状”代表了在内科的病历文本中的症 状字段中查询与“发烧”有关的信息。
在步骤S02中,对所述查询短语进行分词处理,获得查询词。
在一些实施例在中,所述查询短语可以是一个词,也可以是一个句子、一 段文本。若所述查询短语是一个句子或者一段文本时,可以对所述查询短语进 行分词处理。
在一些实施例中,根据所述查询短语获得的查询词可以是一个也可以是多 个,本公开对此不做限制。
在步骤S03中,根据所述查询词在目标医疗数据库中按照所述查询路径获 取与所述查询词匹配的词语。
在一些实施例中,可以根据查询路径获取与所述查询词匹配的词语,以提 高查询效率。
在医疗领域中,由于医院系统差异、医生书写习惯、医疗名词(药品通用 名称、化学名称可能不同)不统一等问题,导致对于同一医疗词汇,可能会出现不同的名称。因此,可以对目标医疗数据库中的医疗词汇进行归一化处理。
在一些实施例中,可以根据目标医疗数据库中的医疗词汇构建医疗词汇知 识图谱,以将所述医疗词汇进行归一化。
如图10所示,可以根据糖尿病10以及与糖尿病10相关的例如2型糖尿 病11、胰岛素依赖性糖尿病12、糖尿病血管病变13、糖尿病神经病变14、糖 尿病并发症15以及糖尿病分型14等词语构建糖尿病词语的知识图谱。
在一些实施例中,可以根据医疗词汇知识图谱确定与所述查询词匹配的词 语。在一些实施例中,可以在医疗词汇知识图谱中找到查询词,并根据医疗词 汇图谱确定与查询词匹配的匹配词。
假设目标用户输入的查询词为“2型糖尿病”,根据如图10所示的医疗 词汇图谱可以确定与“2型糖尿病”匹配的匹配词包括糖尿病10、胰岛素依赖 性糖尿病12、糖尿病血管病变13、糖尿病神经病变14、糖尿病并发症15以 及糖尿病分型14等词语。
在步骤S04中,根据与所述查询词匹配的词语确定并显示查询结果。
在一些实施例中,所述查询结果可以包括所述查询短语在所述目标医疗数 据库中的词频,包括所述查询短语的路径下以及所述查询短语所对应的医疗文 本信息。
本实施例提供的查询方法,通过查询短语获得了细粒度的查询词,并按照 查询路径查找到与查询词向匹配的词语,以获得查询结果。该方法按照查询路 径进行信息的查询,相比于在整个目标医疗数据库中进行查询可以极大的提高 查询效率和查询的准确性。
图9是图8中步骤S03在一示例性实施例中的流程图。
在一些述查询词包括第一查询词和第二查询词,所述查询路径包括第一查 询路径和第二查询路径。
在一些实施例中,上述步骤S03可以包括以下步骤。
在步骤S031中,根据所述第一查询词在所述目标医疗数据库中按照所述 第一查询路径获取与所述第一查询词匹配的第一匹配词。
在步骤S032中,根据所述第一查询词在所述目标医疗数据库中按照所述 第二查询路径获取与所述第一查询词匹配的第二匹配词。
在步骤S033中,根据所述第二查询词在所述目标医疗数据库中按照所述 第一查询路径获取与所述第一查询词匹配的第三匹配词。
在步骤S034中,根据所述第二查询词在所述目标医疗数据库中按照所述 第二查询路径获取与所述第一查询词匹配的第四匹配词。
本实施例提供的查询方法,将多个查询词和多个查询路径进行融合,保证 了最终的查询结果与目标用户的意向统一。
图11是图7中步骤S03在另一示例性实施例中的流程图。上述步骤S03 可以包括以下步骤。
在步骤S035中,对在所述第一查询路径下获取的所述第一匹配词和所述 第三匹配词对应的值进行去重处理,以获得第一匹配值。
可以理解的是,所述第一查询词在所述第一路径下匹配得到的第一匹配词 与所述第二查询词在所述第一路径下匹配得到的第三匹配词可能重复。因此, 可以对在所述第一查询路径下获取的所述第一匹配词和所述第三匹配词对应 的值进行去重处理,以获得第一匹配值。
在一些实施例中,由于各个路径下的值已做过编号,所以可以根据各个路 径下的值的编号分别对各个路径下的值进行去重处理。
在步骤S036中,对在所述第二查询路径下获取的所述第二匹配词和所述 第四匹配词对应的值进行去重处理,以获得第二匹配值。
可以理解的是,所述第一查询词在所述第二路径下匹配得到的第二匹配词 与所述第二查询词在所述第二路径下匹配得到的第四匹配词可能重复。因此, 可以对在所述第二查询路径下获取的所述第二匹配词和所述第四匹配词对应 的值进行去重处理,以获得第二匹配值。
在步骤S037中,对所述第一匹配值和所述第二匹配值进行合并处理,以 获得与所述查询词匹配的值。
在一些实施例中,对所述第一匹配值和所述第二匹配值进行合并后就可以 获得与所述查询词匹配的值。
在一些实施例在中,存储在医疗文本数据库中的词语均有与之匹配的值, 每个值都可以对应一个医疗文本。
在一些实施例在中,当与所述查询词匹配的值确定之后,就可以根据与所 述查询词匹配的值获得与所述查询短语匹配的医疗文本样本。
在一些实施例中,可以根据所述与所述查询词匹配的值确定所述查询词在 所述目标医疗数据库中的词频。
在一些实施例中,所述目标医疗数据库中存储的值均有其在所述目标医疗 数据库的词频。
一般来说,一个词语在一个值中可能只出现一次,如果事先统计了各个值 在所述目标医疗数据库中的词频,那么在获取该值包括的某个词语的词频时将 会大大提高运算效率。
例如,目标对象A可能存在与值a、b、c、d等值中,其中值a在所述目 标医疗数据库中的词频为f1,值b在所述目标医疗数据库中的词频为f2、值c 在所述目标医疗数据库中的词频为f3,值d在所述目标医疗数据库中的词频为 f4,那么目标对象A在所述目标医疗数据库中的词频可以为f1+f2+f3f+f4。
图12是图7中步骤S04在一示例性实施例中的流程图。
在一些实施例中,所述医疗词汇知识图谱包括所述查询词、与所述查询词 匹配的标准词。
在一些实施例中,上述步骤S04可以包括以下步骤。
在步骤S041中,根据所述医疗词汇知识图谱获取与所述查询词匹配的标 准词。
例如假设所述查询词是“糖尿病神经病变”,则可以根据如图10所示的 医疗词汇知识图谱确定所述“糖尿病神经病变”对应的标准词为“糖尿病”。
在步骤S042中,显示与所述查询词匹配的标准词。
对于目标用户来说,当他们输入一个医疗词汇时可能希望获取业内人士对 该医疗词汇的统一称呼(也就是这里的标准词),本实施例提供的查询方法, 可以根据目标用户输入的查询词直接给出与查询词相匹配的标准词。例如,目 标用户输入“2型糖尿病”,可能直接获得“糖尿病”这一标准词。
图13是根据一示例性实施例示出的一种查询装置的框图。参照图13,本 公开实施例提供的查询装置1300可以:查询内容获取模块1301、查询词确定 模块1302、匹配词语确定模块1303以及查询结果确定模块1304。
其中,所述查询内容获取模块1301可以配置为获取查询短语和查询路径;所述查询词确定模块1302可以配置为对所述查询短语进行分词处理,获 得查询词;所述匹配词语确定模块1303可以配置为根据所述查询词在目标医 疗数据库中按照所述查询路径获取与所述查询词匹配的词语;所述查询结果确 定模块1304可以配置为根据与所述查询词匹配的词语确定并显示查询结果。
在一些实施例中,所述匹配词语确定模块1303还可以配置为通过医疗词 汇知识图谱确定与所述查询词匹配的词语。
在一些实施例中,所述查询词包括第一查询词和第二查询词,所述查询路 径包括第一查询路径和第二查询路径。
在一些实施例中,所述匹配词语确定模块1303可以包括:第一匹配单元、 第二匹配单元、第三匹配单元以及第四匹配单元。
其中,所述第一匹配单元可以配置为根据所述第一查询词在所述目标医疗 数据库中按照所述第一查询路径获取与所述第一查询词匹配的第一匹配词;所 述第二匹配单元可以配置为根据所述第一查询词在所述目标医疗数据库中按 照所述第二查询路径获取与所述第一查询词匹配的第二匹配词;所述第三匹配 单元可以配置为根据所述第二查询词在所述目标医疗数据库中按照所述第一查询路径获取与所述第一查询词匹配的第三匹配词;所述第四匹配单元可以配 置为根据所述第二查询词在所述目标医疗数据库中按照所述第二查询路径获 取与所述第一查询词匹配的第四匹配词。
在一些实施例中,所述匹配词语确定模块1303还可以包括:第一匹配值 获取子单元、第二匹配值获取子单元以及匹配值获取子单元。
其中,所述第一匹配值获取子单元可以配置为对在所述第一查询路径下获 取的所述第一匹配词和所述第三匹配词对应的值进行去重处理,以获得第一匹 配值;所述第二匹配值获取子单元可以配置为对在所述第二查询路径下获取的 所述第二匹配词和所述第四匹配词对应的值进行去重处理,以获得第二匹配值; 所述匹配值获取子单元可以配置为对所述第一匹配值和所述第二匹配值进行合并处理,以获得与所述查询词匹配的值。
在一些实施例中,所述查询结果确定模块1304还可以配置为根据与所 述查询词匹配的值获得与所述查询短语匹配的医疗文本样本。
在一些实施例中,所述查询结果确定模块1304还可以配置为根据所述与 所述查询词匹配的值确定所述查询词在所述目标医疗数据库中的词频。
在一些实施例中,所述医疗词汇知识图谱包括所述查询词、与所述查询词 匹配的标准词。
在一些实施例中,所述查询结果确定模块1304还可以包括:标准词确定 单元以及标准词显示单元。
其中,所述标准词确定单元可以配置为根据所述医疗词汇知识图谱获取与 所述查询词匹配的标准词;所述标准词显示单元可以配置为显示与所述查询词 匹配的标准词。
由于本公开的示例实施例的查询装置1300的各个功能模块与上述查询方 法的示例实施例的步骤对应,因此在此不再赘述。
图14是根据一示例性实施例示出的一种文本处理装置的框图。参照图14, 本公开实施例提供的文本处理装置1400可以:医疗样本获取模块1401、路 径获取模块1402、分词结果获取模块1403以及医疗数据库生成模块1404。
其中,所述医疗样本获取模块1401可以配置为获取医疗文本样本;所 述路径获取模块1402可以配置为获取所述医疗文本样本中各个字段的值, 并根据所述医疗文本的名称和所述医疗文本中各个字段的名称确定所述值的路径;所述分词结果获取模块1403可以配置为对所述值进行分词处理, 以获得所述值的分词结果;所述医疗数据库生成模块1404可以配置为将 同一路径下的值的分词结果合并存储,以生成目标医疗数据库。
在一些实施例中,所述路径获取模块1402还可以配置为对所述医疗文 本样本中各个字段的值分别进行去重处理。
在一些实施例中,所述文本处理装置1400还可以包括词频获取模块。其 中所述词频获取模块可以配置为获取所述医疗文本样本中各个字段的值在所 述目标医疗数据库中的词频。
由于本公开的示例实施例的文本处理装置1400的各个功能模块与上述文 本处理方法的示例实施例的步骤对应,因此在此不再赘述。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的 示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来 实现。因此,本公开实施例的技术方案可以以软件产品的形式体现出来,该 软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动 硬盘等)中,包括若干指令用以使得一台计算设备(可以是个人计算机、服务 器、移动终端、或者智能设备等)执行根据本公开实施例的方法,例如图3 的一个或多个所示的步骤。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示 意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限 制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模 块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本 公开的其他实施例。本公开旨在涵盖本公开的任何变型、用途或者适应性变 化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开 未申请的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视 为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不限于这里已经示出的详细结构、附图方式或 实现方法,相反,本公开意图涵盖包含在所附权利要求的精神和范围内的各 种修改和等效设置。
Claims (11)
1.一种查询方法,其特征在于,包括:
获取医疗文本样本;
获取所述医疗文本样本中各个字段的值,并根据所述医疗文本的名称和所述医疗文本中各个字段的名称确定所述值的路径;
对所述值进行分词处理,以获得所述值的分词结果;
将同一路径下的值的分词结果合并存储,以生成目标医疗数据库,其中所述目标医疗数据库将文本名称相同的医疗文本中的、字段名称也相同的值分词后存储在同一路径下,存储在所述目标医疗数据库中的分词后的词语具有匹配的值,每个匹配的值对应一个医疗文本;
获取查询短语和查询路径,所述查询路径包括目标医疗文本名称和目标字段名称;
对所述查询短语进行分词处理,获得查询词;
根据所述查询词在所述目标医疗数据库中按照所述查询路径获取与所述查询词匹配的词语;
根据与所述查询词匹配的词语确定并显示查询结果;
其中,按照所述查询路径获取与所述查询词匹配的词语,包括:
根据所述目标医疗文本名称和所述目标字段名称确定所述查询路径下对应的词语;
在所述查询路径下对应的词语中确定与所述查询词匹配的词语;
其中,根据与所述查询词匹配的词语确定并显示查询结果,包括:
确定与所述查询词匹配的词语具有的匹配的值所对应的医疗文本信息;
将与所述查询词匹配的词语所对应的医疗文本信息作为所述查询结果。
2.根据权利要求1所述方法,其特征在于,所述查询词包括第一查询词和第二查询词,所述查询路径包括第一查询路径和第二查询路径;其中,根据所述查询词在目标医疗数据库中按照所述查询路径获取与所述查询词匹配的词语,包括:
根据所述第一查询词在所述目标医疗数据库中按照所述第一查询路径获取与所述第一查询词匹配的第一匹配词;
根据所述第一查询词在所述目标医疗数据库中按照所述第二查询路径获取与所述第一查询词匹配的第二匹配词;
根据所述第二查询词在所述目标医疗数据库中按照所述第一查询路径获取与所述第二查询词匹配的第三匹配词;
根据所述第二查询词在所述目标医疗数据库中按照所述第二查询路径获取与所述第二查询词匹配的第四匹配词。
3.根据权利要求2所述方法,其特征在于,根据所述查询词在目标医疗数据库中按照所述查询路径获取与所述查询词匹配的词语,还包括:
对在所述第一查询路径下获取的所述第一匹配词和所述第三匹配词对应的值进行去重处理,以获得第一匹配值;
对在所述第二查询路径下获取的所述第二匹配词和所述第四匹配词对应的值进行去重处理,以获得第二匹配值;
对所述第一匹配值和所述第二匹配值进行合并处理,以获得与所述查询词匹配的值。
4.根据权利要求3所述方法,其特征在于,根据与所述查询词匹配的词语确定并显示查询结果,包括:
根据与所述查询词匹配的值获得与所述查询短语匹配的医疗文本。
5.根据权利要求3所述方法,其特征在于,根据与所述查询词匹配的词语确定并显示查询结果,包括:
根据与所述查询词匹配的词语确定所述查询词在所述目标医疗数据库中的词频;
显示所述查询词在所述目标医疗数据库中的词频。
6.根据权利要求1所述方法,其特征在于,根据与所述查询词匹配的词语确定并显示查询结果,包括:
通过医疗词汇知识图谱确定与所述查询词匹配的词语,与所述查询词匹配的词语包括与所述查询词匹配的标准词;
显示与所述查询词匹配的词语或与所述查询词匹配的标准词。
7.根据权利要求1所述方法,其特征在于,获取所述医疗文本样本中各个字段的值,包括:
对所述医疗文本样本中各个字段的值分别进行去重处理。
8.根据权利要求1所述方法,其特征在于,还包括:
获取所述医疗文本样本中各个字段的值在所述目标医疗数据库中的词频。
9.一种查询装置,其特征在于,包括:
医疗样本获取模块,配置为获取医疗文本样本;
路径获取模块,配置为获取所述医疗文本样本中各个字段的值,并根据所述医疗文本的名称和所述医疗文本中各个字段的名称确定所述值的路径;
分词结果获取模块,配置为对所述值进行分词处理,以获得所述值的分词结果;
医疗数据库生成模块,配置为将同一路径下的值的分词结果合并存储,以生成目标医疗数据库,其中所述目标医疗数据库将文本名称相同的医疗文本中的、字段名称也相同的值分词后存储在同一路径下,存储在所述目标医疗数据库中的分词后的词语具有匹配的值,每个匹配的值对应一个医疗文本;
查询内容获取模块,配置为获取查询短语和查询路径,所述查询路径包括目标医疗文本名称和目标字段名称;
查询词确定模块,配置为对所述查询短语进行分词处理,获得查询词;
匹配词语确定模块,配置为根据所述查询词在目标医疗数据库中按照所述查询路径获取与所述查询词匹配的词语
查询结果确定模块,配置为根据与所述查询词匹配的词语确定并显示查询结果;
其中,按照所述查询路径获取与所述查询词匹配的词语,包括:
根据所述目标医疗文本名称和所述目标字段名称确定所述查询路径下对应的词语;
在所述查询路径下对应的词语中确定与所述查询词匹配的词语;
其中,根据与所述查询词匹配的词语确定并显示查询结果,包括:
确定与所述查询词匹配的词语具有的匹配的值所对应的医疗文本信息;
将与所述查询词匹配的词语所对应的医疗文本信息作为所述查询结果。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一项所述的方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911301748.4A CN111063447B (zh) | 2019-12-17 | 2019-12-17 | 查询和文本处理方法及装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911301748.4A CN111063447B (zh) | 2019-12-17 | 2019-12-17 | 查询和文本处理方法及装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111063447A CN111063447A (zh) | 2020-04-24 |
CN111063447B true CN111063447B (zh) | 2024-05-03 |
Family
ID=70301871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911301748.4A Active CN111063447B (zh) | 2019-12-17 | 2019-12-17 | 查询和文本处理方法及装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111063447B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114969242A (zh) * | 2022-01-19 | 2022-08-30 | 支付宝(杭州)信息技术有限公司 | 查询内容自动补全的方法及装置 |
CN114548100A (zh) * | 2022-03-01 | 2022-05-27 | 深圳市医未医疗科技有限公司 | 一种基于大数据技术的临床科研辅助方法与系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101561818A (zh) * | 2009-05-13 | 2009-10-21 | 北京用友移动商务科技有限公司 | 分词处理方法及全文检索方法 |
CN107016001A (zh) * | 2016-01-28 | 2017-08-04 | 阿里巴巴集团控股有限公司 | 一种数据查询方法及装置 |
CN108038114A (zh) * | 2017-10-17 | 2018-05-15 | 广东欧珀移动通信有限公司 | 一种路径查询方法、终端、计算机可读存储介质 |
CN109616215A (zh) * | 2018-11-23 | 2019-04-12 | 金色熊猫有限公司 | 医疗数据抽取方法、装置、存储介质及电子设备 |
CN110516047A (zh) * | 2019-09-02 | 2019-11-29 | 湖南工业大学 | 基于包装领域的知识图谱的检索方法及检索系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10055485B2 (en) * | 2014-11-25 | 2018-08-21 | International Business Machines Corporation | Terms for query expansion using unstructured data |
-
2019
- 2019-12-17 CN CN201911301748.4A patent/CN111063447B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101561818A (zh) * | 2009-05-13 | 2009-10-21 | 北京用友移动商务科技有限公司 | 分词处理方法及全文检索方法 |
CN107016001A (zh) * | 2016-01-28 | 2017-08-04 | 阿里巴巴集团控股有限公司 | 一种数据查询方法及装置 |
CN108038114A (zh) * | 2017-10-17 | 2018-05-15 | 广东欧珀移动通信有限公司 | 一种路径查询方法、终端、计算机可读存储介质 |
CN109616215A (zh) * | 2018-11-23 | 2019-04-12 | 金色熊猫有限公司 | 医疗数据抽取方法、装置、存储介质及电子设备 |
CN110516047A (zh) * | 2019-09-02 | 2019-11-29 | 湖南工业大学 | 基于包装领域的知识图谱的检索方法及检索系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111063447A (zh) | 2020-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11581070B2 (en) | Electronic medical record summary and presentation | |
CN108920453B (zh) | 数据处理方法、装置、电子设备及计算机可读介质 | |
CN107729319B (zh) | 用于输出信息的方法和装置 | |
CN107833603B (zh) | 电子病历文档分类方法、装置、电子设备及存储介质 | |
US10733370B2 (en) | Method, apparatus, and computer program product for generating a preview of an electronic document | |
CN108959236B (zh) | 医学文献分类模型训练方法、医学文献分类方法及其装置 | |
Afshar et al. | Development and application of a high throughput natural language processing architecture to convert all clinical documents in a clinical data warehouse into standardized medical vocabularies | |
Klann et al. | Web services for data warehouses: OMOP and PCORnet on i2b2 | |
Malmasi et al. | Canary: an NLP platform for clinicians and researchers | |
US20180067986A1 (en) | Database model with improved storage and search string generation techniques | |
CN111145847A (zh) | 临床试验数据的录入方法及装置、介质和电子设备 | |
CN111063447B (zh) | 查询和文本处理方法及装置、电子设备和存储介质 | |
CN111145846A (zh) | 临床试验患者招募方法及装置、电子设备和存储介质 | |
CN111061835B (zh) | 查询方法及装置、电子设备和计算机可读存储介质 | |
CN110471941B (zh) | 自动定位判断依据的方法、装置及电子设备 | |
US9208142B2 (en) | Analyzing documents corresponding to demographics | |
US20220129623A1 (en) | Performance characteristics of cartridge artifacts over text pattern constructs | |
CN109299238A (zh) | 一种数据查询方法和装置 | |
CN111126034B (zh) | 医学变量关系的处理方法及装置、计算机介质和电子设备 | |
CN117373594A (zh) | 医疗信息确定方法、装置、设备及介质 | |
CN111523309A (zh) | 药品信息归一化的方法、装置、存储介质及电子设备 | |
CN109086438B (zh) | 用于查询信息的方法和装置 | |
US11157538B2 (en) | System and method for generating summary of research document | |
CN109299475B (zh) | 一种医学文档的处理方法、装置、介质及电子设备 | |
North et al. | Online self-triage of ear or hearing concerns in a patient portal: Comparison of subsequent diagnoses and hospitalizations to national emergency department and national ambulatory ear or hearing visits |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |