CN117095782B - 医学文本快速录入方法、系统、终端及编辑器 - Google Patents
医学文本快速录入方法、系统、终端及编辑器 Download PDFInfo
- Publication number
- CN117095782B CN117095782B CN202311360931.8A CN202311360931A CN117095782B CN 117095782 B CN117095782 B CN 117095782B CN 202311360931 A CN202311360931 A CN 202311360931A CN 117095782 B CN117095782 B CN 117095782B
- Authority
- CN
- China
- Prior art keywords
- text
- virtual
- tag
- medical
- engine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004364 calculation method Methods 0.000 claims abstract description 35
- 230000015654 memory Effects 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 12
- 230000001960 triggered effect Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 7
- 239000012634 fragment Substances 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 abstract description 5
- 238000000265 homogenisation Methods 0.000 abstract description 3
- 238000003058 natural language processing Methods 0.000 description 36
- 238000012545 processing Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 238000003860 storage Methods 0.000 description 5
- 238000003491 array Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 108010074051 C-Reactive Protein Proteins 0.000 description 1
- 102100032752 C-reactive protein Human genes 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- DYAIAHUQIPBDIP-AXAPSJFSSA-N cefonicid Chemical compound S([C@@H]1[C@@H](C(N1C=1C(O)=O)=O)NC(=O)[C@H](O)C=2C=CC=CC=2)CC=1CSC1=NN=NN1CS(O)(=O)=O DYAIAHUQIPBDIP-AXAPSJFSSA-N 0.000 description 1
- 229960004489 cefonicid Drugs 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Probability & Statistics with Applications (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供一种医学文本快速录入方法、系统、终端及编辑器,编辑器采用等待词唤醒机制扫描当前录入的医学文本,并将医学文本发送至生成式模型引擎进行计算推理生成多条生成式文本,再对各条生成式文本分别建立虚拟文本结构,并将各虚拟文本发送至NLP引擎进行标记计算获得标签数据,再基于标签数据建立一或多个标签块,以完成文本录入。本发明结合生成式模型与NLP引擎在编辑器里录入医学文本,可以有效提高病历信息的输入速度,同时能提高文书的质量,避免使用模板造成病历的同质化。
Description
技术领域
本发明涉及数据处理领域,特别是涉及一种医学文本快速录入方法、系统、终端及编辑器。
背景技术
目前,电子病历已成为医院信息化建设的核心内容,常规医院的电子病历文书录入,是采用在编辑器里完成的,基于模板的复制粘贴或者结构化元素的选择。
录入病历医学文本的时候,医生需要花大量的时间和精力整理病人的主诉、病人家属的辅助说明、每天的查房情况、结论和医嘱等信息。手动整理这些病历信息极大消耗医务人员宝贵的时间和精力。因此,有效提高病历信息的输入速度,省去医生手动输入病历信息的烦琐过程,是当下亟须研究和探讨的问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种医学文本快速录入方法、系统、终端及编辑器,用于解决以上现有技术问题。
为实现上述目的及其他相关目的,本发明提供一种医学文本快速录入方法,应用于编辑器,所述方法包括:当在录入医学文本的过程中触发了等待词时,扫描当前录入的医学文本并进行标记;将标记后的医学文本发送至生成式模型引擎进行计算推理,生成多条生成式文本;对接收的由所述生成式模型引擎返回的各条生成式文本分别建立虚拟文本结构,以分别作为虚拟文本储存至一虚拟文本结构队列;将各虚拟文本发送至NLP引擎进行标记计算获得用于建立标签块的标签数据;基于由所述NLP引擎返回的标签数据建立一或多个标签块,以完成文本录入。
于本发明的一实施例中,将标记后的医学文本发送至生成式模型引擎进行计算推理,生成多条生成式文本包括:将标记后的医学文本以及设置的温度参数数据发送至生成式模型引擎,以供所述生成式模型引擎结合患者的基本信息进行计算推理,生成多条生成式文本。
于本发明的一实施例中,每个虚拟文本结构包括:以标点符号作为切割符拆解的多个片段。
于本发明的一实施例中,所述方法还包括:基于向生成式模型引擎发送的温度参数数据,优先显示匹配度最高的虚拟文本,其余虚拟文本可通过触发上下键显示及编辑。
于本发明的一实施例中,将各虚拟文本发送至NLP引擎进行标记计算获得标签数据包括:将各虚拟文本发送至NLP引擎,以供所述NLP引擎对各虚拟文本的关键数据进行标记,并结合患者的实际检查数据生成一或多个标签块的位置和内容。
于本发明的一实施例中,基于由所述NLP引擎返回的标签数据建立一或多个标签块包括:基于各标签块的位置和内容对对应的虚拟文本进行进行数据替换,以形成各标签块。
于本发明的一实施例中,所述方法还包括:当标签块形成后,标签块的文本被自动选中并高亮供用户编辑,还可通过触发按键进行下一标签块的编辑。
为实现上述目的及其他相关目的,本发明提供一种编辑器,包括:包括:文本扫描模块,用于当在录入医学文本的过程中触发了等待词时,扫描当前录入的医学文本并进行标记;推理计算模块,连接所述文本扫描模块,用于将标记后的医学文本发送至生成式模型引擎进行计算推理,生成多条生成式文本;虚拟文本结构建立模块,连接所述推理计算模块,用于对接收的由所述生成式模型引擎返回的各条生成式文本分别建立虚拟文本结构,以分别作为虚拟文本储存至一虚拟文本结构队列;标记计算模块,连接所述虚拟文本结构建立模块,用于将各虚拟文本发送至NLP引擎进行标记计算获得用于建立标签块的标签数据;标签块建立模块,连接所述标记计算模块,用于基于由所述NLP引擎返回的标签数据建立一或多个标签块,以完成文本录入。
为实现上述目的及其他相关目的,本发明提供一种医学文本快速录入的终端,包括:一或多个存储器及一或多个处理器;所述一或多个存储器,用于存储计算机程序;所述一或多个处理器,连接所述存储器,用于运行所述计算机程序以执行所述医学文本快速录入方法。
为实现上述目的及其他相关目的,本发明提供一种医学文本快速录入系统,所述系统包括:编辑器、生成式模型引擎以及NLP引擎;其中,所述编辑器分别与生成式模型引擎以及NLP引擎通信连接;通过所述编辑器当在录入医学文本的过程中触发了等待词时,扫描当前录入的医学文本并进行标记,并将标记后的医学文本发送至生成式模型引擎;由生成式模型引擎基于标记后的医学文本进行计算推理生成多条生成式文本,并返回至编辑器;由所述编辑器对接收的各条生成式文本分别建立虚拟文本结构,以分别作为虚拟文本储存至一虚拟文本结构队列,再将各虚拟文本发送至NLP引擎;由NLP引擎基于各虚拟文本进行标记计算获得用于建立标签块的标签数据,并返回至所述编辑器建立一或多个标签块,以完成文本录入。
如上所述,本发明是一种医学文本快速录入方法、系统、终端及编辑器,具有以下有益效果:本发明的编辑器采用等待词唤醒机制扫描当前录入的医学文本,并将医学文本发送至生成式模型引擎进行计算推理生成多条生成式文本,再对各条生成式文本分别建立虚拟文本结构,并将各虚拟文本发送至NLP引擎进行标记计算获得标签数据,再基于标签数据建立一或多个标签块,以完成文本录入。本发明结合生成式模型与NLP引擎在编辑器里录入医学文本,可以有效提高病历信息的输入速度,同时能提高文书的质量,避免使用模板造成病历的同质化。
附图说明
图1显示为本发明一实施例中的医学文本快速录入方法的流程示意图。
图2显示为本发明一实施例中的编辑器编辑界面示意图。
图3显示为本发明一实施例中的编辑器编辑界面示意图。
图4显示为本发明一实施例中的编辑器编辑界面示意图。
图5显示为本发明一实施例中的编辑器的结构示意图。
图6显示为本发明一实施例中的医学文本快速录入的终端的结构示意图。
图7显示为本发明一实施例中的医学文本快速录入系统的结构示意图。
实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,在下述描述中,参考附图,附图描述了本发明的若干实施例。应当理解,还可使用其他实施例,并且可以在不背离本发明的精神和范围的情况下进行机械组成、结构、电气以及操作上的改变。下面的详细描述不应该被认为是限制性的,并且本发明的实施例的范围仅由公布的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例,而并非旨在限制本发明。空间相关的术语,例如“上”、“下”、“左”、“右”、“下面”、“下方”、““下部”、“上方”、“上部”等,可在文中使用以便于说明图中所示的一个元件或特征与另一元件或特征的关系。
在通篇说明书中,当说某部分与另一部分“连接”时,这不仅包括“直接连接” 的情形,也包括在其中间把其它元件置于其间而“间接连接”的情形。另外,当说某种部分“包括”某种构成要素时,只要没有特别相反的记载,则并非将其它构成要素,排除在外,而是意味着可以还包括其它构成要素。
其中提到的第一、第二及第三等术语是为了说明多样的部分、成分、区域、层及/或段而使 用的,但并非限定于此。这些术语只用于把某部分、成分、区域、层或段区别于其它部分、成分、区域、层或段。因此,以下叙述的第一部分、成分、区域、层或段在不 超出本发明范围的范围内,可以言及到第二部分、成分、区域、层或段。
再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
下面以附图为参考,针对本发明的实施例进行详细说明,以便本发明所述技术领域的技术人员能够容易地实施。本发明可以以多种不同形态体现,并不限于此处说明的实施例。
如图1展示本发明实施例中的一种医学文本快速录入方法的结构示意图。
应用于编辑器,所述方法包括:
步骤S1:当在录入医学文本的过程中触发了等待词时,扫描当前录入的医学文本并进行标记。
在一实施例中,本发明的编辑器中设置有等待词唤醒机制,等待词可以是某个特殊的标点符号、某个词、录入文本数量、按键,或者是一段时间的停顿(例如2秒)。录入医学文本的过程中一旦触发了等待词,即扫描编辑器当前区域录入的医学文本内容,并且将该医学文本内容加上特定标记,例如标记为文本内容的归属。
步骤S2:将标记后的医学文本发送至生成式模型引擎进行计算推理,生成多条生成式文本。
在一实施例中,步骤S2包括:
将标记后的医学文本以及设置的温度参数数据发送至生成式模型引擎,以供所述生成式模型引擎结合患者的基本信息进行计算推理,生成多条生成式文本;
本发明的生成式模型引擎采用一种可以生成数据的概率模型,它可以从训练数据集中学习到数据的潜在分布,并通过该分布来生成新数据。大语言模型凭借其突破性的理解能力、推理能力、角色扮演能力,推动行业新的生产方式的进化和提速,在计算机视觉、自然语言处理、音频处理等领域具有广泛的应用。
具体的,所述生成式模型引擎由大量标记后的医学文本、设置的不同温度参数、患者的基本信息以及对应的多条生成式文本构成的训练集训练获得。所述生成式模型引擎基于标记后的医学文本、设置的不同温度参数并集合患者的基本信息,推理出多条完整的生成式文本,可根据输入部分词的医学文本推理病历标准格式的文本并输出,减轻数据输入量;各生成式文本的匹配度与编辑器发送的对应设置的温度参数相关。其中,患者的基本信息包括性别,年龄、既往史、过敏史等信息。
步骤S3:对接收的由所述生成式模型引擎返回的各条生成式文本分别建立虚拟文本结构,以分别作为虚拟文本储存至一虚拟文本结构队列。
在一实施例中,编辑器接收到多条生成式文本后,将接收到的所有文本存入一个队列中。该队列为虚拟文本结构队列,每一个生成式文本对应一个虚拟文本结构。
所述虚拟文本结构是编辑器专门为快速录入交互设计的一种结构。每个虚拟文本结构包括:以标点符号作为切割符拆解的多个片段。即构建每个虚拟文本结构的方式包括:整个生成式文本会以标点符号作为切割符,被拆解为若干个小片段。
举例来说,虚拟文本结构队列储存的虚拟文本如下:
{
"虚拟文本1": [
"片段1": {
"属性"
"内容1"
},
"片段2": {
"属性"
"内容2"
},,
"片段3": {
"属性"
"内容3"
},
],
"虚拟文本2": [
"片段1": {
"属性"
"内容1"
},
"片段2": {
"属性"
"内容2"
},,
"片段3": {
"属性"
"内容3"
},
],
}
在一实施例中,所述方法还包括:基于向生成式模型引擎发送的温度参数数据,优先显示匹配度最高的虚拟文本,其余虚拟文本可通过触发上下键显示及编辑。
具体的,基于向生成式模型引擎发送的温度参数数据,将匹配度最高的虚拟文本显示在编辑器内,其余的虚拟文本,用户可通过特定按上,下键依次进行显示和编辑。
步骤S4:将各虚拟文本发送至NLP引擎进行标记计算获得用于建立标签块的标签数据。
在一实施例中,步骤S4包括:将各虚拟文本发送至NLP引擎,以供所述NLP引擎对各虚拟文本的关键数据进行标记,并结合患者的实际检查数据生成一或多个标签块的位置和内容。
NLP(自然语言处理),让计算机“理解”自然语言,它是语言信息处理的一个分支,另一方面它是人工智能(AI, Artificial Intelligence)的核心课题之一。
具体的,编辑器将虚拟文本发送给后台NLP引擎,NLP引擎对这些数据进行计算后,对其中识别的关键数据进行标记,会向编辑器发送标签块的位置和内容的数组。
举例来说,标签块的位置和内容的数组如下:
{
[
"位置": {
"开始"
"结束"
},
"内容": "",
],
[
"位置": {
"开始"
"结束"
},
"内容": "",
]
}
步骤S5:基于由所述NLP引擎返回的标签数据建立一或多个标签块,以完成文本录入。
在一实施例中,步骤S5包括:
基于各标签块的位置和内容对对应的虚拟文本进行进行数据替换,以形成各标签块。
具体的,依据标签块的起始位置和内容,对虚拟文本进行内容替换,形成一个标签块的数组。
在一优选实施例中,所述方法还包括:当标签块形成后,标签块的文本被自动选中并高亮供用户编辑,还可通过触发按键进行下一标签块的编辑。
具体的,当标签块形成后,编辑器的焦点将停留在标签内,且里面文本会被自动选中并高亮,方便用户修改。用户对标签块编辑完成后,通过触发特定按键Tab,会使得光标焦点离开标签块,并使得下一个虚拟块子结构或标签块被自动选中,此时编辑完的标签块结构会被清除,只剩下普通文本内容。
例如具体编辑流程:
图2所示,显示匹配度最高的虚拟文本“患者三日前无明显诱因下出现发热,体温最高39.5,查红细胞:”;如图3,通过按键后显示下一虚拟文本,并选中当前显示“1.67*10^12/L,白细胞:20.44*10^9/L,”;再依次编辑“1.67”、“20.44”,编辑完成,如图4后续显示内容 “中性粒细胞%89.1%,C-反应蛋白:10.11mg/1,予以头孢尼西”并进行相应的编辑。
通过此种机制和用户操作,在用户依次编辑完生成的所有虚拟文本后,全部结构消失,只留下普通文本。
与上述实施例原理相似的是,本发明提供一种编辑器。
以下结合附图提供具体实施例:
如图5展示本发明实施例中的一种编辑器的结构示意图。
所述编辑器包括:
文本扫描模块1,用于当在录入医学文本的过程中触发了等待词时,扫描当前录入的医学文本并进行标记;
推理计算模块2,连接所述文本扫描模块1,用于将标记后的医学文本发送至生成式模型引擎进行计算推理,生成多条生成式文本;
虚拟文本结构建立模块3,连接所述推理计算模块2,用于对接收的由所述生成式模型引擎返回的各条生成式文本分别建立虚拟文本结构,以分别作为虚拟文本储存至一虚拟文本结构队列;
标记计算模块4,连接所述虚拟文本结构建立模块3,用于将各虚拟文本发送至NLP引擎进行标记计算获得用于建立标签块的标签数据;
标签块建立模块5,连接所述标记计算模块4,用于基于由所述NLP引擎返回的标签数据建立一或多个标签块,以完成文本录入。
需说明的是,应理解图5系统实施例中的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现;
例如各模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital signal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
由于该编辑器的实现原理已在前述实施例中进行了叙述,因此此处不作重复赘述。
在一实施例中,将标记后的医学文本发送至生成式模型引擎进行计算推理,生成多条生成式文本包括:将标记后的医学文本以及设置的温度参数数据发送至生成式模型引擎,以供所述生成式模型引擎结合患者的基本信息进行计算推理,生成多条生成式文本。
在一实施例中,每个虚拟文本结构包括:以标点符号作为切割符拆解的多个片段。
在一实施例中,所述编辑器用于基于向生成式模型引擎发送的温度参数数据,优先显示匹配度最高的虚拟文本,其余虚拟文本可通过触发上下键显示及编辑。
在一实施例中,将各虚拟文本发送至NLP引擎进行标记计算获得标签数据包括:将各虚拟文本发送至NLP引擎,以供所述NLP引擎对各虚拟文本的关键数据进行标记,并结合患者的实际检查数据生成一或多个标签块的位置和内容。
在一实施例中,基于由所述NLP引擎返回的标签数据建立一或多个标签块包括:基于各标签块的位置和内容对对应的虚拟文本进行进行数据替换,以形成各标签块。
如图6展示本发明实施例中的医学文本快速录入终端60的结构示意图。
所述医学文本快速录入的终端60包括:存储器61及处理器62。所述存储器61用于存储计算机程序;所述处理器62运行计算机程序,实现如图1所述的医学文本快速录入方法。
可选的,所述存储器61的数量均可以是一或多个,所述处理器62的数量均可以是一或多个,而图6中均以一个为例。
可选的,所述医学文本快速录入的终端60中的处理器62会按照如图1所述的步骤,将一个或多个以应用程序的进程对应的指令加载到存储器61中,并由处理器62来运行存储在第一存储器61中的应用程序,从而实现如图1所述医学文本快速录入方法中的各种功能。
可选的,所述存储器61,可能包括但不限于高速随机存取存储器、非易失性存储器。例如一个或多个磁盘存储设备、闪存设备或其他非易失性固态存储设备;所述处理器62,可能包括但不限于中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field- Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可选的,所述处理器62可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明还提供计算机可读存储介质,存储有计算机程序,所述计算机程序运行时实现如图1所示的医学文本快速录入方法。所述计算机可读存储介质可包括,但不限于,软盘、光盘、CD-ROM(只读光盘存储器)、磁光盘、ROM(只读存储器)、RAM(随机存取存储器)、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦除可编程只读存储器)、磁卡或光卡、闪存、或适于存储机器可执行指令的其他类型的介质/机器可读介质。所述计算机可读存储介质可以是未接入计算机设备的产品,也可以是已接入计算机设备使用的部件。
如图7展示本发明实施例中的一种医学文本快速录入系统的结构示意图。
所述系统包括:编辑器101、生成式模型引擎102以及NLP引擎103;
其中,所述编辑器101分别与生成式模型引擎102以及NLP引擎103通信连接;所述编辑器101可实现图1的医学文本快速录入方法。
通过所述编辑器101当在录入医学文本的过程中触发了等待词时,扫描当前录入的医学文本并进行标记,并将标记后的医学文本发送至生成式模型引擎102;由生成式模型引擎102基于标记后的医学文本进行计算推理生成多条生成式文本,并返回至编辑器101;由所述编辑器101对接收的各条生成式文本分别建立虚拟文本结构,以分别作为虚拟文本储存至一虚拟文本结构队列,再将各虚拟文本发送至NLP引擎103;由NLP引擎103基于各虚拟文本进行标记计算获得用于建立标签块的标签数据,并返回至所述编辑器101建立一或多个标签块,以完成文本录入。
在一实施例中,所述生成式模型引擎102基于标记后的医学文本、设置的温度参数数据以及患者的基本信息进行计算推理,生成多条生成式文本。
在一实施例中,所述编辑器101基于向生成式模型引擎102发送的温度参数数据,优先显示匹配度最高的虚拟文本,其余虚拟文本可通过触发上下键显示及编辑。
在一实施例中,所述NLP引擎103对各虚拟文本的关键数据进行标记,并结合患者的实际检查数据生成一或多个标签块的位置和内容。
在一实施例中,所述编辑器101基于各标签块的位置和内容对对应的虚拟文本进行进行数据替换,以形成各标签块。
在一实施例中,所述编辑器101在当标签块形成后,标签块的文本被自动选中并高亮供用户编辑,还可通过触发按键进行下一标签块的编辑。
综上所述,本发明的医学文本快速录入方法、系统、终端及编辑器,编辑器采用等待词唤醒机制扫描当前录入的医学文本,并将医学文本发送至生成式模型引擎进行计算推理生成多条生成式文本,再对各条生成式文本分别建立虚拟文本结构,并将各虚拟文本发送至NLP引擎进行标记计算获得标签数据,再基于标签数据建立一或多个标签块,以完成文本录入。本发明结合生成式模型与NLP引擎在编辑器里录入医学文本,可以有效提高病历信息的输入速度,同时能提高文书的质量,避免使用模板造成病历的同质化。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅示例性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,但凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (7)
1.一种医学文本快速录入方法,其特征在于,应用于编辑器,所述方法包括:
当在录入医学文本的过程中触发了等待词时,扫描当前录入的医学文本并进行标记;
将标记后的医学文本发送至生成式模型引擎进行计算推理,生成多条生成式文本;
对接收的由所述生成式模型引擎返回的各条生成式文本分别建立虚拟文本结构,以分别作为虚拟文本储存至一虚拟文本结构队列;其中,每个虚拟文本结构包括:以标点符号作为切割符拆解的多个片段;
将各虚拟文本发送至NLP引擎进行标记计算获得用于建立标签块的标签数据;
基于由所述NLP引擎返回的标签数据建立一或多个标签块,以完成文本录入;
其中,对接收的由所述生成式模型引擎返回的各条生成式文本分别建立虚拟文本结构包括:对接收的由所述生成式模型引擎返回的每条生成式文本对应建立一个虚拟文本结构;其中,构建每个虚拟文本结构的方式包括:整个生成式文本会以标点符号作为切割符,被拆解为若干个小片段;
将各虚拟文本发送至NLP引擎进行标记计算获得用于建立标签块的标签数据包括:将各虚拟文本发送至NLP引擎,以供所述NLP引擎对各虚拟文本的关键数据进行标记,并结合患者的实际检查数据生成一或多个标签块的位置和内容;
基于由所述NLP引擎返回的标签数据建立一或多个标签块,以完成文本录入包括:基于各标签块的位置和内容对对应的虚拟文本进行数据替换,以形成各标签块;其中,依据标签块的起始位置和内容,对虚拟文本进行内容替换,形成一个标签块的数组。
2.根据权利要求1中所述的医学文本快速录入方法,其特征在于,将标记后的医学文本发送至生成式模型引擎进行计算推理,生成多条生成式文本包括:
将标记后的医学文本以及设置的温度参数数据发送至生成式模型引擎,以供所述生成式模型引擎结合患者的基本信息进行计算推理,生成多条生成式文本。
3.根据权利要求2中所述的医学文本快速录入方法,其特征在于,所述方法还包括:基于向生成式模型引擎发送的温度参数数据,优先显示匹配度最高的虚拟文本,其余虚拟文本可通过触发上下键显示及编辑。
4.根据权利要求1中所述的医学文本快速录入方法,其特征在于,所述方法还包括:当标签块形成后,标签块的文本被自动选中并高亮供用户编辑,还可通过触发按键进行下一标签块的编辑。
5.一种编辑器,其特征在于,包括:
文本扫描模块,用于当在录入医学文本的过程中触发了等待词时,扫描当前录入的医学文本并进行标记;
推理计算模块,连接所述文本扫描模块,用于将标记后的医学文本发送至生成式模型引擎进行计算推理,生成多条生成式文本;
虚拟文本结构建立模块,连接所述推理计算模块,用于对接收的由所述生成式模型引擎返回的各条生成式文本分别建立虚拟文本结构,以分别作为虚拟文本储存至一虚拟文本结构队列;其中,每个虚拟文本结构包括:以标点符号作为切割符拆解的多个片段;
标记计算模块,连接所述虚拟文本结构建立模块,用于将各虚拟文本发送至NLP引擎进行标记计算获得用于建立标签块的标签数据;
标签块建立模块,连接所述标记计算模块,用于基于由所述NLP引擎返回的标签数据建立一或多个标签块,以完成文本录入;
其中,对接收的由所述生成式模型引擎返回的各条生成式文本分别建立虚拟文本结构包括:对接收的由所述生成式模型引擎返回的每条生成式文本对应建立一个虚拟文本结构;其中,构建每个虚拟文本结构的方式包括:整个生成式文本会以标点符号作为切割符,被拆解为若干个小片段;
将各虚拟文本发送至NLP引擎进行标记计算获得用于建立标签块的标签数据包括:将各虚拟文本发送至NLP引擎,以供所述NLP引擎对各虚拟文本的关键数据进行标记,并结合患者的实际检查数据生成一或多个标签块的位置和内容;
基于由所述NLP引擎返回的标签数据建立一或多个标签块,以完成文本录入包括:基于各标签块的位置和内容对对应的虚拟文本进行数据替换,以形成各标签块;其中,依据标签块的起始位置和内容,对虚拟文本进行内容替换,形成一个标签块的数组。
6.一种医学文本快速录入终端,其特征在于,包括:一或多个存储器及一或多个处理器;
所述一或多个存储器,用于存储计算机程序;
所述一或多个处理器,连接所述存储器,用于运行所述计算机程序以执行如权利要求1至4中任一项所述的方法。
7.一种医学文本快速录入系统,其特征在于,所述系统包括:编辑器、生成式模型引擎以及NLP引擎;
其中,所述编辑器分别与生成式模型引擎以及NLP引擎通信连接;
通过所述编辑器当在录入医学文本的过程中触发了等待词时,扫描当前录入的医学文本并进行标记,并将标记后的医学文本发送至生成式模型引擎;由生成式模型引擎基于标记后的医学文本进行计算推理生成多条生成式文本,并返回至编辑器;由所述编辑器对接收的各条生成式文本分别建立虚拟文本结构,以分别作为虚拟文本储存至一虚拟文本结构队列,再将各虚拟文本发送至NLP引擎;由NLP引擎基于各虚拟文本进行标记计算获得用于建立标签块的标签数据,并返回至所述编辑器建立一或多个标签块,以完成文本录入;
其中,每个虚拟文本结构包括:以标点符号作为切割符拆解的多个片段;对接收的由所述生成式模型引擎返回的各条生成式文本分别建立虚拟文本结构包括:对接收的由所述生成式模型引擎返回的每条生成式文本对应建立一个虚拟文本结构;其中,构建每个虚拟文本结构的方式包括:整个生成式文本会以标点符号作为切割符,被拆解为若干个小片段;
由NLP引擎基于各虚拟文本进行标记计算获得用于建立标签块的标签数据包括:由所述NLP引擎对各虚拟文本的关键数据进行标记,并结合患者的实际检查数据生成一或多个标签块的位置和内容;
建立一或多个标签块,完成文本录入包括:基于各标签块的位置和内容对对应的虚拟文本进行数据替换,以形成各标签块;其中,依据标签块的起始位置和内容,对虚拟文本进行内容替换,形成一个标签块的数组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311360931.8A CN117095782B (zh) | 2023-10-20 | 2023-10-20 | 医学文本快速录入方法、系统、终端及编辑器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311360931.8A CN117095782B (zh) | 2023-10-20 | 2023-10-20 | 医学文本快速录入方法、系统、终端及编辑器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117095782A CN117095782A (zh) | 2023-11-21 |
CN117095782B true CN117095782B (zh) | 2024-02-06 |
Family
ID=88770210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311360931.8A Active CN117095782B (zh) | 2023-10-20 | 2023-10-20 | 医学文本快速录入方法、系统、终端及编辑器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117095782B (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012094422A2 (en) * | 2011-01-05 | 2012-07-12 | Health Fidelity, Inc. | A voice based system and method for data input |
CN102819655A (zh) * | 2011-06-10 | 2012-12-12 | 中国科学院深圳先进技术研究院 | 展现电子病历的系统及方法 |
CN106845147A (zh) * | 2017-04-13 | 2017-06-13 | 北京大数医达科技有限公司 | 医学经验总结模型的建立方法、装置及数据评估方法 |
CN106980767A (zh) * | 2017-03-31 | 2017-07-25 | 上海森亿医疗科技有限公司 | 一种基于结构化医学数据库的数据搜索方法及系统 |
CN110059185A (zh) * | 2019-04-03 | 2019-07-26 | 天津科技大学 | 一种医学文档专业词汇自动化标注方法 |
CN111768822A (zh) * | 2020-05-28 | 2020-10-13 | 上海森亿医疗科技有限公司 | 电子病历文档的续打方法、装置、设备和存储介质 |
CN112069783A (zh) * | 2020-09-10 | 2020-12-11 | 卫宁健康科技集团股份有限公司 | 一种病历输入法及其输入系统 |
US11170154B1 (en) * | 2021-04-09 | 2021-11-09 | Cascade Reading, Inc. | Linguistically-driven automated text formatting |
CN114341838A (zh) * | 2019-09-06 | 2022-04-12 | 豪夫迈·罗氏有限公司 | 病理报告中的使用自然语言处理的自动信息提取与扩展 |
CN114530223A (zh) * | 2022-01-18 | 2022-05-24 | 华南理工大学 | 一种基于nlp的心血管疾病病历结构化系统 |
CN115392256A (zh) * | 2022-08-29 | 2022-11-25 | 重庆师范大学 | 一种基于语义分割的药物不良事件关系抽取方法 |
CN116011408A (zh) * | 2022-12-12 | 2023-04-25 | 北京华宇九品科技有限公司 | 一种在线可编辑的文书生成系统及方法 |
CN116324910A (zh) * | 2021-02-10 | 2023-06-23 | 三星电子株式会社 | 用于执行设备上图像到文本转换的方法和系统 |
CN116341523A (zh) * | 2023-02-16 | 2023-06-27 | 平安科技(深圳)有限公司 | 文本纠错方法、装置、计算机设备及存储介质 |
CN116525125A (zh) * | 2023-07-04 | 2023-08-01 | 之江实验室 | 一种虚拟电子病历的生成方法及装置 |
CN116719840A (zh) * | 2023-04-27 | 2023-09-08 | 百洋智能科技集团股份有限公司 | 一种基于病历后结构化处理的医疗信息推送方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10553308B2 (en) * | 2017-12-28 | 2020-02-04 | International Business Machines Corporation | Identifying medically relevant phrases from a patient's electronic medical records |
EP3753025A1 (en) * | 2018-02-16 | 2020-12-23 | Google LLC | Automated extraction of structured labels from medical text using deep convolutional networks and use thereof to train a computer vision model |
US20220019741A1 (en) * | 2020-07-16 | 2022-01-20 | Optum Technology, Inc. | An unsupervised approach to assignment of pre-defined labels to text documents |
-
2023
- 2023-10-20 CN CN202311360931.8A patent/CN117095782B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012094422A2 (en) * | 2011-01-05 | 2012-07-12 | Health Fidelity, Inc. | A voice based system and method for data input |
CN102819655A (zh) * | 2011-06-10 | 2012-12-12 | 中国科学院深圳先进技术研究院 | 展现电子病历的系统及方法 |
CN106980767A (zh) * | 2017-03-31 | 2017-07-25 | 上海森亿医疗科技有限公司 | 一种基于结构化医学数据库的数据搜索方法及系统 |
CN106845147A (zh) * | 2017-04-13 | 2017-06-13 | 北京大数医达科技有限公司 | 医学经验总结模型的建立方法、装置及数据评估方法 |
CN110059185A (zh) * | 2019-04-03 | 2019-07-26 | 天津科技大学 | 一种医学文档专业词汇自动化标注方法 |
CN114341838A (zh) * | 2019-09-06 | 2022-04-12 | 豪夫迈·罗氏有限公司 | 病理报告中的使用自然语言处理的自动信息提取与扩展 |
CN111768822A (zh) * | 2020-05-28 | 2020-10-13 | 上海森亿医疗科技有限公司 | 电子病历文档的续打方法、装置、设备和存储介质 |
CN112069783A (zh) * | 2020-09-10 | 2020-12-11 | 卫宁健康科技集团股份有限公司 | 一种病历输入法及其输入系统 |
CN116324910A (zh) * | 2021-02-10 | 2023-06-23 | 三星电子株式会社 | 用于执行设备上图像到文本转换的方法和系统 |
US11170154B1 (en) * | 2021-04-09 | 2021-11-09 | Cascade Reading, Inc. | Linguistically-driven automated text formatting |
CN114530223A (zh) * | 2022-01-18 | 2022-05-24 | 华南理工大学 | 一种基于nlp的心血管疾病病历结构化系统 |
CN115392256A (zh) * | 2022-08-29 | 2022-11-25 | 重庆师范大学 | 一种基于语义分割的药物不良事件关系抽取方法 |
CN116011408A (zh) * | 2022-12-12 | 2023-04-25 | 北京华宇九品科技有限公司 | 一种在线可编辑的文书生成系统及方法 |
CN116341523A (zh) * | 2023-02-16 | 2023-06-27 | 平安科技(深圳)有限公司 | 文本纠错方法、装置、计算机设备及存储介质 |
CN116719840A (zh) * | 2023-04-27 | 2023-09-08 | 百洋智能科技集团股份有限公司 | 一种基于病历后结构化处理的医疗信息推送方法 |
CN116525125A (zh) * | 2023-07-04 | 2023-08-01 | 之江实验室 | 一种虚拟电子病历的生成方法及装置 |
Non-Patent Citations (1)
Title |
---|
医学专用输入引擎的设计与应用研究;肖辉;张方;商建国;张帧;;医疗卫生装备(02);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117095782A (zh) | 2023-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109659013B (zh) | 病症分诊及路径优化方法、装置、设备及存储介质 | |
CN112527999B (zh) | 引入农业领域知识的抽取式智能问答方法及系统 | |
CN109065172B (zh) | 病症信息获取方法、装置、计算机设备和存储介质 | |
CN111222340B (zh) | 基于多标准主动学习的乳腺电子病历实体识别系统 | |
Dai et al. | FullMeSH: improving large-scale MeSH indexing with full text | |
Bateman et al. | The landscape of Lean across public services | |
Ruel et al. | Advanced practice nursing: A principle-based concept analysis | |
CN111581972A (zh) | 文本中症状和部位对应关系识别方法、装置、设备及介质 | |
CN111429985B (zh) | 电子病历数据处理方法及系统 | |
CN112837772A (zh) | 一种预问诊病历生成方法及装置 | |
CN114999676A (zh) | 用于自动回复医疗咨询的方法、系统、装置和介质 | |
CN111755090A (zh) | 病历查找方法、病历查找装置、存储介质与电子设备 | |
Nigrin et al. | Temporal expressiveness in querying a time-stamp—based clinical database | |
Hou et al. | Discovering drug–target interaction knowledge from biomedical literature | |
CN117095782B (zh) | 医学文本快速录入方法、系统、终端及编辑器 | |
CN113421657A (zh) | 临床实践指南的知识表示模型的构建方法及装置 | |
CN111243738B (zh) | 生存分析模型的构建、生存率的预测方法、装置及设备 | |
CN115579094B (zh) | 一种多模态医疗数据湖构建方法及系统 | |
CN116719840A (zh) | 一种基于病历后结构化处理的医疗信息推送方法 | |
US20210056149A1 (en) | Search system, search method, and program | |
CN111666754B (zh) | 基于电子疾病文本的实体识别方法、系统和计算机设备 | |
KR20200076435A (ko) | 인터랙션을 이용한 반려동물 건강관리 시스템 및 그 방법 | |
Huzurbazar | Multistate models, flowgraph models, and semi-Markov processes | |
Seema et al. | Doctor Chatbot-Smart Health Prediction | |
Ma et al. | An Iterative Optimizing Framework for Radiology Report Summarization with ChatGPT |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |