CN112634889B - 基于人工智能的电子病例录入方法、装置、终端及介质 - Google Patents
基于人工智能的电子病例录入方法、装置、终端及介质 Download PDFInfo
- Publication number
- CN112634889B CN112634889B CN202011481853.3A CN202011481853A CN112634889B CN 112634889 B CN112634889 B CN 112634889B CN 202011481853 A CN202011481853 A CN 202011481853A CN 112634889 B CN112634889 B CN 112634889B
- Authority
- CN
- China
- Prior art keywords
- text
- answer
- question
- electronic case
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 33
- 239000013598 vector Substances 0.000 claims abstract description 103
- 230000008569 process Effects 0.000 claims abstract description 24
- 238000000926 separation method Methods 0.000 claims abstract description 16
- 201000010099 disease Diseases 0.000 claims description 64
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 64
- 238000004590 computer program Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 8
- 239000012634 fragment Substances 0.000 claims description 4
- 238000012549 training Methods 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 12
- 238000003745 diagnosis Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 208000024891 symptom Diseases 0.000 description 10
- 238000000605 extraction Methods 0.000 description 9
- 238000012360 testing method Methods 0.000 description 8
- 238000012795 verification Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Medical Informatics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Epidemiology (AREA)
- Artificial Intelligence (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Computing Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及智慧医疗技术领域,提供一种基于人工智能的电子病例录入方法、装置、终端及介质,包括:根据就诊申请获取电子病例参考模板;采集就诊过程中的语音并对语音进行语音分离得到多个问题语音及每个问题语音对应的回答语音;识别每个问题语音得到问题文本及识别每个回答语音得到回答文本,并根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本;采用BERT模型识别每个组合文本中的每个文本字符的文本向量;计算每个文本字符的文本向量的答案概率并根据答案概率确定每个问题文本对应的答案文本;将多个问题文本及每个问题文本对应的答案文本录入电子病例参考模板得到电子病例。本发明能够自动化的且高质量的录入电子病例。
Description
技术领域
本发明涉及智慧医疗技术领域,具体涉及一种基于人工智能的电子病例录入方法、装置、终端及介质。
背景技术
随着医院信息化建设的不断深入,临床决策支持系统(Clinical DecisionSupport System,CDSS)也逐步得到使用。临床决策支持系统能够给临床工作者、患者提供知识或统计信息,并可以智能地过滤或表示这些信息,以辅助进行临床决策。
然而发明人在实现本发明的过程中发现,尽管现有的临床决策支持系统提供了语音录入电子病历的功能,通过语音识别出文本再进行抽取文本信息抽取,但是由于医疗领域的特殊性,语音识别准确度较低,且对于较长的文本,抽取时容易造成信息丢失,因此,无法保障电子病例的录入质量。
发明内容
鉴于以上内容,有必要提出一种基于人工智能的电子病例录入方法、装置、终端及介质,能够自动化的且高质量的录入电子病例。
本发明的第一方面提供一种基于人工智能的电子病例录入方法,所述方法包括:
根据患者的就诊申请获取电子病例参考模板;
采集就诊过程中的语音并对所述语音进行语音分离得到多个问题语音及每个问题语音对应的回答语音;
识别每个问题语音得到问题文本及识别每个回答语音得到回答文本,并根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本;
采用BERT模型识别每个组合文本中的每个文本字符的文本向量;
计算每个文本字符的文本向量的答案概率并根据所述答案概率确定每个问题文本对应的答案文本;
将多个问题文本及每个问题文本对应的答案文本录入所述电子病例参考模板得到电子病例。
根据本发明的一个可选的实施例,所述根据患者的就诊申请获取电子病例参考模板包括:
解析所述就诊申请得到就诊科室类型;
获取与所述就诊科室类型对应的电子病例参考模板。
根据本发明的一个可选的实施例,所述根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本包括:
针对每个问题文本,从所述回答文本的第一个文本字符开始无重叠滑动预设第一长度的滑动窗口,并在每次滑动之后判断是否满足滑动结束条件;
当确定满足滑动结束条件时,停止所述滑动窗口的滑动,并将每次滑动时所述滑动窗口在所述回答文本中的开始位置和结束位置确定为字符切分节点;
从每个所述字符切分节点开始,从所述回答文本中切分出预设第二长度的文本字符得到多个文本片段;
将所述问题文本与对应的多个文本片段中的每一个文本片段分别进行拼接得到多个组合文本。
根据本发明的一个可选的实施例,所述计算每个文本字符的文本向量的答案概率并根据所述答案概率确定每个问题文本对应的答案文本包括:
计算所述文本字符的文本向量的第一向量值;
计算所述文本字符对应的组合文本的文本向量的第二向量值;
根据所述第一向量值及所述第二向量值计算所述文本字符的答案概率;
确定大于预设概率阈值的答案概率对应的文本字符为目标文本字符;
根据所述问题文本对应的多个组合文本中的目标文本字符生成答案文本。
根据本发明的一个可选的实施例,所述方法还包括:
调用疾病等级识别模型识别所述电子病例的疾病等级;
确定所述就诊申请对应的就诊医生并获取所述就诊医生的就诊等级;
根据所述疾病等级及所述就诊等级判断是否需要转诊就诊;
当根据所述疾病等级及所述就诊等级确定需要转诊就诊时,生成转诊申请单。
根据本发明的一个可选的实施例,所述调用疾病等级识别模型识别所述电子病例的疾病等级包括:
识别所述电子病例中的多个实体类型及每个实体类型对应的实体名称、实体属性;
根据所述类型及每个实体类型对应的实体名称、实体属性构建实体属性向量;
输入实体属性向量至疾病等级识别模型中进行疾病等级的识别。
根据本发明的一个可选的实施例,在所述解析所述就诊申请得到就诊科室类型之前,所述方法还包括:
接收就诊申请;
保存所述就诊申请至WebSocket消息队列;
通过所述WebSocket消息队列实时推送WebSocket消息至前端。
本发明的第二方面提供一种基于人工智能的电子病例录入装置,所述装置包括:
获取模块,用于根据患者的就诊申请获取电子病例参考模板;
采集模块,用于采集就诊过程中的语音并对所述语音进行语音分离得到多个问题语音及每个问题语音对应的回答语音;
第一识别模块,用于识别每个问题语音得到问题文本及识别每个回答语音得到回答文本,并根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本;
第二识别模块,用于采用BERT模型识别每个组合文本中的每个文本字符的文本向量;
计算模块,用于计算每个文本字符的文本向量的答案概率并根据所述答案概率确定每个问题文本对应的答案文本;
录入模块,用于将多个问题文本及每个问题文本对应的答案文本录入所述电子病例参考模板得到电子病例。
本发明的第三方面提供一种终端,所述终端包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述基于人工智能的电子病例录入方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于人工智能的电子病例录入方法。
综上所述,本发明所述的基于人工智能的电子病例录入方法、装置、终端及介质,根据患者的就诊申请个性化的获取适合患者病情的电子病例参考模板,为后续快速录入电子病例提供了基础;采集就诊过程中的语音并对所述语音进行语音分离得到多个问题语音及每个问题语音对应的回答语音,并识别每个问题语音得到问题文本及识别每个回答语音得到回答文本,通过语音识别技术能够自动的识别就诊过程中的语音文本,避免就诊医生手动录入;根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本,组合文本的文本长度符合BERT模型的输入需求,避免采用BERT模型进行识别时,造成文本信息的丢失,导致文本识别错误;通过BERT模型识别每个组合文本中的每个文本字符的文本向量之后,计算每个文本字符的文本向量的答案概率并根据所述答案概率确定每个问题文本对应的答案文本,能够提高答案文本的识别准确率,提高了电子病例的录入质量;最后将多个问题文本及每个问题文本对应的答案文本录入所述电子病例参考模板中,实现了电子病例的快速且自动的录入。
附图说明
图1是本发明实施例一提供的基于人工智能的电子病例录入方法的流程图。
图2是本发明实施例二提供的基于人工智能的电子病例录入装置的结构图。
图3是本发明实施例三提供的终端的结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本发明实施例提供的基于人工智能的电子病例录入方法由终端执行,相应地,基于人工智能的电子病例录入装置运行于终端中。
图1是本发明实施例一提供的基于人工智能的电子病例录入方法的流程图。所述基于人工智能的电子病例录入方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S11,根据患者的就诊申请获取电子病例参考模板。
终端中安装有临床决策支持系统(Clinical Decision Support System,CDSS),所述终端为就诊医生的终端设备,所述临床决策支持系统中存储有多个电子病例参考模板,不同的电子病例参考模板对应不同的病症。
患者可以将标识自己身份信息的证件(例如,医保卡)插入医共体平台,来提出就诊申请,终端接收到患者的就诊申请后,获取与就诊申请对应的电子病例参考模板。
在一个可选的实施例中,所述根据患者的就诊申请获取电子病例参考模板包括:
解析所述就诊申请得到就诊科室类型;
获取与所述就诊科室类型对应的电子病例参考模板。
该可选的实施例中,所述就诊申请中可以携带就诊患者的身份信息,就诊科室类型。
所述临床决策支持系统中存储有就诊科室类型与电子病例参考模板之间的关系表。
临床决策支持系统可以对所述就诊申请进行智能语义解析得到就诊科室类型,在解析得到就诊科室类型后,通过查询所述关系表,即可确定与所述就诊科室类型对应的电子病例参考模板。
该可选的实施例中,由于不同的患者的病症不同,但同一病症的疾病症状及所需的诊断诊疗手段大同小异,通过患者的就诊科室类型来个性化的获取电子病例参考模板,有助于后续录入电子病例,提高电子病例的录入效率。
S12,采集就诊过程中的语音并对所述语音进行语音分离得到多个问题语音及每个问题语音对应的回答语音。
在患者就诊的过程中,终端可以通过语音采集设备采集患者与就诊医生之间的语音。所述语音采集设备可以是终端自带的,也可以是外挂在终端上。
临床决策支持系统可以采用语音分离技术对就诊过程中的语音进行语音分离,从而得到就诊医生对应的问题语音,及患者对应的回答语音。其中,将任意两个相邻的问题语音之间的回答语音确定为上一个问题语音的回答语音。
所述语音分离技术为现有技术,本发明实施例不详细阐述。
S13,识别每个问题语音得到问题文本及识别每个回答语音得到回答文本,并根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本。
临床决策支持系统在分离出多个问题语音及多个回答语音之后,将每一个问题语音及对应的回答语音进行关联。
临床决策支持系统可以采用语音识别技术对所述问题语音进行语音识别,得到问题文本;临床决策支持系统可以采用语音识别技术对所述回答语音进行语音识别,得到回答文本。语音识别技术为现有技术,本发明实施例不详细阐述。
临床决策支持系统首先确定每个回答文本的文本长度,再判断所述回答文本的文本长度是否超过预设文本长度阈值,根据判断结果确定根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本。具体实施时,当判断结果为所述回答文本的文本长度超过预设文本长度阈值时,根据所述回答文本及所述回答文本对应的问题文本生成多个组合文本;当判断结果为所述回答文本的文本长度没有超过预设文本长度阈值时,将所述回答文本及所述回答文本对应的问题文本进行拼接得到一个组合文本。
其中,所述预设文本长度阈值为BERT模型允许输入的最大文本长度。
由于问题语音对应的回答语音可能较差,则识别出的回答文本字符长度较大。对于较长的回答文本,后续进行文本信息抽取时,容易出现信息丢失,导致信息抽取质量较差,临床决策支持系统根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本,使得每个组合文本的文本长度适中,便于进行文本信息的抽取,提高抽取的信息的质量,从而提高电子病例的录入质量,确保电子病例正确的录入。
在一个可选的实施例中,所述根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本包括:
针对每个问题文本,从所述回答文本的第一个文本字符开始无重叠滑动预设第一长度的滑动窗口,并在每次滑动之后判断是否满足滑动结束条件;
当确定满足滑动结束条件时,停止所述滑动窗口的滑动,并将每次滑动时所述滑动窗口在所述回答文本中的开始位置和结束位置确定为字符切分节点;
从每个所述字符切分节点开始,从所述回答文本中切分出预设第二长度的文本字符得到多个文本片段;
将所述问题文本与对应的多个文本片段中的每一个文本片段分别进行拼接得到多个组合文本。
其中,当每次滑动之后所述滑动窗口在所述回答文本中的结束位置与所述回答文本的结束位置之间的差值小于或者等于预设文本长度阈值时,确定满足所述预设滑动结束条件;当每次滑动之后所述滑动窗口在所述回答文本中的结束位置与所述文本的结束位置之间的差值大于所述预设文本长度阈值时,确定未满足所述预设滑动结束条件。
示例性的,假设预设文本长度阈值M为500,所述预设第一长度N为40,某一个回答文本的长度L为600,记为L=[t1,t2,...,t600],由于回答文本的长度L大于预设文本长度阈值M,则使用长度为N的滑动窗口对长度为L的回答文本进行切分,得到长度分别为500,500,500,480的4个文本片段,如[t1,t2,...,t500],[t41,t42,...,t540],[t81,t82,...,t580],[t121,t122,...,t600]。再将每一个文本片段与对应的问题文本进行拼接得到组合文本,共得到4个组合文本。
S14,采用BERT模型识别每个组合文本中的每个文本字符的文本向量。
其中,所述BERT模型为预先训练得到的,训练过程为现有技术,不再详细阐述。
预先训练的BERT模型根据所述组合文本确定所述组合文本对应的全文语义信息,并根据所述全文语义信息对所述组合文本中各字符的向量进行处理,得到所述组合文本中各字符融合全文语义信息后对应的向量表示,即得到组合文本中各文本字符对应的文本向量,如文本向量V=[v1,v2,...,vm]。
通过将问题文本和回答文本进行拼接得到组合文本,实现BERT模型的单输入,可提高BERT模型的处理速度,从而提高问题答案生成的效率。同时将问题文本和回答文本进行拼接可以使得特征之间进行更全面的交互,提高BERT模型确定全文语义信息的准确率,从而提高问题答案生成的准确率。
S15,计算每个文本字符的文本向量的答案概率并根据所述答案概率确定每个问题文本对应的答案文本。
由于传统的信息抽取方案基于命名实体识别模型,该模型的原理是对输入文本中的每一个字/词进行分类,输出该字/词属于哪一类预定义的实体或者不属于任一预定义的实体。
本实施例通过输出文本字符的文本向量的答案概率,来确定出问题文本对应的答案文本。
在一个可选的实施例中,所述计算每个文本字符的文本向量的答案概率并根据所述答案概率确定每个问题文本对应的答案文本包括:
计算所述文本字符的文本向量的第一向量值;
计算所述文本字符对应的组合文本的文本向量的第二向量值;
根据所述第一向量值及所述第二向量值计算所述文本字符的答案概率;
确定大于预设概率阈值的答案概率对应的文本字符为目标文本字符;
根据所述问题文本对应的多个组合文本中的目标文本字符生成答案文本。
其中,每一个文本字符的文本向量是一串数字表示的矩阵,通过计算矩阵的模可得到文本字符的文本向量的第一向量值,将组合文本中的所有文本字符的文本向量先进行加和得到总文本向量,再计算总文本向量的向量值即可得到组合文本的第二向量值。
计算第一向量值与所述第二向量值的比值,作为所述文本字符的答案概率。答案概率越大,表示所述文本字符作为问题文本的问题答案的概率越高,答案概率越小,表示所述文本字符作为问题文本的问题答案的概率越低。
具体实施时,先确定每一个组合文本中答案概率大于预设概率阈值的文本字符为目标文本字符,再确定每一个组合文本对应的所有目标文本字符。针对某一个问题文本,首先确定该问题文本对应的所有组合文本,再将该所有组合文本中的每一个组合文本对应的所有目标文本字符集合在一起,接着确定集合中的目标文本字符在原有回答文本中的字符顺序,将相同字符顺序的目标文本字符进行删除,最后按照文本字符原有的顺序进行排序,得到所述问题文本的答案文本。
该可选的实施例中,通过答案概率能够有效的确定出与问题文本最相关的答案,提高答案文本的识别质量。答案文本的识别质量的提高,有助于提高电子病例的录入质量,确保电子病例能够准确的录入,录入的电子病例中的内容符合医疗领域的词云。
S16,将多个问题文本及每个问题文本对应的答案文本录入所述电子病例参考模板得到电子病例。
所述电子病例参考模板中有多个标准问题,就诊医生在对患者的就诊过程基本按照电子病例参考模板中的标准问题进行询问,因而临床决策支持系统将多个问题文本与多个标准问题进行匹配,确定每一个标准问题对应的答案文本,将答案文本录入所述标准问题对应的位置,从而完成电子病例的自动录入。
在一个可选的实施例中,在所述解析所述就诊申请得到就诊科室类型之前,所述方法还包括:
接收就诊申请;
保存所述就诊申请至WebSocket消息队列;
通过所述WebSocket消息队列实时推送WebSocket消息至前端。
所述临床支持决策系统接收到就诊申请之后,先将所述就诊申请保存至WebSocket消息队列中,其中,WebSocket是一种基于长连接的推送服务,其作用在于不用终端用户发起接口请求,主动将消息推送给终端用户。
该可选的实施例中,通过借助于WebSocket消息队列的消息推送机制,能够快速实时的获取到就诊申请以对就诊申请进行解析。
在一个可选的实施例中,所述方法还包括:
调用疾病等级识别模型识别所述电子病例的疾病等级;
确定所述就诊申请对应的就诊医生并获取所述就诊医生的就诊等级;
根据所述疾病等级及所述就诊等级判断是否需要转诊就诊;
当根据所述疾病等级及所述就诊等级确定需要转诊就诊时,生成转诊申请单。
终端可以依据世界卫生组织疾病程度划分表,取4个疾病程度,分别对应轻度、中度、重度、高危,并以此建立电子病例集。按照6:2:2的比例依次划分训练集、测试集、验证集,并分别通过医疗知识图谱识别出所述训练集、测试集、验证集中的电子病例的多个实体类型及每个实体类型对应的实体名称、实体属性,从而分别构建训练实体属性向量集、测试实体属性向量集及验证实体属性向量集。基于训练实体属性向量集、测试实体属性向量集及验证实体属性向量集训练用于分析疾病等级的神经网络模型,得到疾病等级识别模型。
临床支持决策系统调用疾病等级识别模型识别所述电子病例的疾病等级,根据疾病等级与就诊医生的就诊等级确定是否需要转诊就诊。当疾病等级低于所述就诊等级时,确定不需要转诊就诊,当疾病等级高于所述就诊等级时,确定需要转诊就诊。
当根据所述疾病等级及所述就诊等级确定需要转诊就诊时,生成转诊申请单。既能够优化本医院的医疗资源,又能够为患者匹配出合适的就诊医生,避免无就诊能力的就诊医生耽误患者的病情,提高就诊人的就诊体验。
在一个可选的实施例中,所述调用疾病等级识别模型识别所述电子病例的疾病等级包括:
识别所述电子病例中的多个实体类型及每个实体类型对应的实体名称、实体属性;
根据所述类型及每个实体类型对应的实体名称、实体属性构建实体属性向量;
输入实体属性向量至疾病等级识别模型中进行疾病等级的识别。
其中,所述实体类型是指疾病、症状、诊断分类、治疗、检查检验、人体组织、检查项等医学名词,所述实体名称是指每个实体类型包括的实体项目,所述实体属性是指实体项目的程度。例如,实体类型为疾病,所述实体项目为癌症,所述实体属性为中3期。
终端中预先存储有通过专业的医疗实体标记员构建的医疗知识图谱,通过医疗知识图谱识别出所述患者电子病例中的多个实体类型,并根据上下文语义解析算法解析出每个实体项目在所述患者电子病例中的实体属性。
当识别出的疾病等级越高时,表明所述患者的病情较为严重;当识别出的疾病等级越低时,表明所述患者的病情较为轻微。
综上,本发明实施例,根据患者的就诊申请个性化的获取适合患者病情的电子病例参考模板,为后续快速录入电子病例提供了基础;采集就诊过程中的语音并对所述语音进行语音分离得到多个问题语音及每个问题语音对应的回答语音,并识别每个问题语音得到问题文本及识别每个回答语音得到回答文本,通过语音识别技术能够自动的识别就诊过程中的语音文本,避免就诊医生手动录入;根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本,组合文本的文本长度符合BERT模型的输入需求,避免采用BERT模型进行识别时,造成文本信息的丢失,导致文本识别错误;通过BERT模型识别每个组合文本中的每个文本字符的文本向量之后,计算每个文本字符的文本向量的答案概率并根据所述答案概率确定每个问题文本对应的答案文本,能够提高答案文本的识别准确率,提高了电子病例的录入质量;最后将多个问题文本及每个问题文本对应的答案文本录入所述电子病例参考模板中,实现了电子病例的快速且自动的录入。
需要强调的是,为进一步保证上述电子病例的私密性和安全性,上述电子病例可存储于区块链的节点中。
图2是本发明实施例二提供的基于人工智能的电子病例录入装置的结构图。
在一些实施例中,所述基于人工智能的电子病例录入装置20可以包括多个由计算机程序段所组成的功能模块。所述基于人工智能的电子病例录入装置20中的各个程序段的计算机程序可以存储于终端的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)基于人工智能的电子病例录入的功能。
本实施例中,所述基于人工智能的电子病例录入装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:获取模块201、采集模块202、第一识别模块203、第二识别模块204、计算模块205、录入模块206、推送模块207及第三识别模块208。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
所述获取模块201,用于根据患者的就诊申请获取电子病例参考模板。
终端中安装有临床决策支持系统(Clinical Decision Support System,CDSS),所述终端为就诊医生的终端设备,所述临床决策支持系统中存储有多个电子病例参考模板,不同的电子病例参考模板对应不同的病症。
患者可以将标识自己身份信息的证件(例如,医保卡)插入医共体平台,来提出就诊申请,终端接收到患者的就诊申请后,获取与就诊申请对应的电子病例参考模板。
在一个可选的实施例中,所述获取模块201根据患者的就诊申请获取电子病例参考模板包括:
解析所述就诊申请得到就诊科室类型;
获取与所述就诊科室类型对应的电子病例参考模板。
该可选的实施例中,所述就诊申请中可以携带就诊患者的身份信息,就诊科室类型。
所述临床决策支持系统中存储有就诊科室类型与电子病例参考模板之间的关系表。
临床决策支持系统可以对所述就诊申请进行智能语义解析得到就诊科室类型,在解析得到就诊科室类型后,通过查询所述关系表,即可确定与所述就诊科室类型对应的电子病例参考模板。
该可选的实施例中,由于不同的患者的病症不同,但同一病症的疾病症状及所需的诊断诊疗手段大同小异,通过患者的就诊科室类型来个性化的获取电子病例参考模板,有助于后续录入电子病例,提高电子病例的录入效率。
所述采集模块202,用于采集就诊过程中的语音并对所述语音进行语音分离得到多个问题语音及每个问题语音对应的回答语音。
在患者就诊的过程中,终端可以通过语音采集设备采集患者与就诊医生之间的语音。所述语音采集设备可以是终端自带的,也可以是外挂在终端上。
临床决策支持系统可以采用语音分离技术对就诊过程中的语音进行语音分离,从而得到就诊医生对应的问题语音,及患者对应的回答语音。其中,将任意两个相邻的问题语音之间的回答语音确定为上一个问题语音的回答语音。
所述语音分离技术为现有技术,本发明实施例不详细阐述。
所述第一识别模块203,用于识别每个问题语音得到问题文本及识别每个回答语音得到回答文本,并根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本。
临床决策支持系统在分离出多个问题语音及多个回答语音之后,将每一个问题语音及对应的回答语音进行关联。
临床决策支持系统可以采用语音识别技术对所述问题语音进行语音识别,得到问题文本;临床决策支持系统可以采用语音识别技术对所述回答语音进行语音识别,得到回答文本。语音识别技术为现有技术,本发明实施例不详细阐述。
临床决策支持系统首先确定每个回答文本的文本长度,再判断所述回答文本的文本长度是否超过预设文本长度阈值,根据判断结果确定根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本。具体实施时,当判断结果为所述回答文本的文本长度超过预设文本长度阈值时,根据所述回答文本及所述回答文本对应的问题文本生成多个组合文本;当判断结果为所述回答文本的文本长度没有超过预设文本长度阈值时,将所述回答文本及所述回答文本对应的问题文本进行拼接得到一个组合文本。
其中,所述预设文本长度阈值为BERT模型允许输入的最大文本长度。
由于问题语音对应的回答语音可能较差,则识别出的回答文本字符长度较大。对于较长的回答文本,后续进行文本信息抽取时,容易出现信息丢失,导致信息抽取质量较差,临床决策支持系统根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本,使得每个组合文本的文本长度适中,便于进行文本信息的抽取,提高抽取的信息的质量,从而提高电子病例的录入质量,确保电子病例正确的录入。
在一个可选的实施例中,所述第一识别模块203根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本包括:
针对每个问题文本,从所述回答文本的第一个文本字符开始无重叠滑动预设第一长度的滑动窗口,并在每次滑动之后判断是否满足滑动结束条件;
当确定满足滑动结束条件时,停止所述滑动窗口的滑动,并将每次滑动时所述滑动窗口在所述回答文本中的开始位置和结束位置确定为字符切分节点;
从每个所述字符切分节点开始,从所述回答文本中切分出预设第二长度的文本字符得到多个文本片段;
将所述问题文本与对应的多个文本片段中的每一个文本片段分别进行拼接得到多个组合文本。
其中,当每次滑动之后所述滑动窗口在所述回答文本中的结束位置与所述回答文本的结束位置之间的差值小于或者等于预设文本长度阈值时,确定满足所述预设滑动结束条件;当每次滑动之后所述滑动窗口在所述回答文本中的结束位置与所述文本的结束位置之间的差值大于所述预设文本长度阈值时,确定未满足所述预设滑动结束条件。
示例性的,假设预设文本长度阈值M为500,所述预设第一长度N为40,某一个回答文本的长度L为600,记为L=[t1,t2,...,t600],由于回答文本的长度L大于预设文本长度阈值M,则使用长度为N的滑动窗口对长度为L的回答文本进行切分,得到长度分别为500,500,500,480的4个文本片段,如[t1,t2,...,t500],[t41,t42,...,t540],[t81,t82,...,t580],[t121,t122,...,t600]。再将每一个文本片段与对应的问题文本进行拼接得到组合文本,共得到4个组合文本。
所述第二识别模块204,用于采用BERT模型识别每个组合文本中的每个文本字符的文本向量。
其中,所述BERT模型为预先训练得到的,训练过程为现有技术,不再详细阐述。
预先训练的BERT模型根据所述组合文本确定所述组合文本对应的全文语义信息,并根据所述全文语义信息对所述组合文本中各字符的向量进行处理,得到所述组合文本中各字符融合全文语义信息后对应的向量表示,即得到组合文本中各文本字符对应的文本向量,如文本向量V=[v1,v2,...,vm]。
通过将问题文本和回答文本进行拼接得到组合文本,实现BERT模型的单输入,可提高BERT模型的处理速度,从而提高问题答案生成的效率。同时将问题文本和回答文本进行拼接可以使得特征之间进行更全面的交互,提高BERT模型确定全文语义信息的准确率,从而提高问题答案生成的准确率。
所述计算模块205,用于计算每个文本字符的文本向量的答案概率并根据所述答案概率确定每个问题文本对应的答案文本。
由于传统的信息抽取方案基于命名实体识别模型,该模型的原理是对输入文本中的每一个字/词进行分类,输出该字/词属于哪一类预定义的实体或者不属于任一预定义的实体。
本实施例通过输出文本字符的文本向量的答案概率,来确定出问题文本对应的答案文本。
在一个可选的实施例中,所述计算模块205计算每个文本字符的文本向量的答案概率并根据所述答案概率确定每个问题文本对应的答案文本包括:
计算所述文本字符的文本向量的第一向量值;
计算所述文本字符对应的组合文本的文本向量的第二向量值;
根据所述第一向量值及所述第二向量值计算所述文本字符的答案概率;
确定大于预设概率阈值的答案概率对应的文本字符为目标文本字符;
根据所述问题文本对应的多个组合文本中的目标文本字符生成答案文本。
其中,每一个文本字符的文本向量是一串数字表示的矩阵,通过计算矩阵的模可得到文本字符的文本向量的第一向量值,将组合文本中的所有文本字符的文本向量先进行加和得到总文本向量,再计算总文本向量的向量值即可得到组合文本的第二向量值。
计算第一向量值与所述第二向量值的比值,作为所述文本字符的答案概率。答案概率越大,表示所述文本字符作为问题文本的问题答案的概率越高,答案概率越小,表示所述文本字符作为问题文本的问题答案的概率越低。
具体实施时,先确定每一个组合文本中答案概率大于预设概率阈值的文本字符为目标文本字符,再确定每一个组合文本对应的所有目标文本字符。针对某一个问题文本,首先确定该问题文本对应的所有组合文本,再将该所有组合文本中的每一个组合文本对应的所有目标文本字符集合在一起,接着确定集合中的目标文本字符在原有回答文本中的字符顺序,将相同字符顺序的目标文本字符进行删除,最后按照文本字符原有的顺序进行排序,得到所述问题文本的答案文本。
该可选的实施例中,通过答案概率能够有效的确定出与问题文本最相关的答案,提高答案文本的识别质量。答案文本的识别质量的提高,有助于提高电子病例的录入质量,确保电子病例能够准确的录入,录入的电子病例中的内容符合医疗领域的词云。
所述录入模块206,用于将多个问题文本及每个问题文本对应的答案文本录入所述电子病例参考模板得到电子病例。
所述电子病例参考模板中有多个标准问题,就诊医生在对患者的就诊过程基本按照电子病例参考模板中的标准问题进行询问,因而临床决策支持系统将多个问题文本与多个标准问题进行匹配,确定每一个标准问题对应的答案文本,将答案文本录入所述标准问题对应的位置,从而完成电子病例的自动录入。
所述推送模块207,用于接收就诊申请;保存所述就诊申请至WebSocket消息队列;通过所述WebSocket消息队列实时推送WebSocket消息至前端。
所述临床支持决策系统接收到就诊申请之后,先将所述就诊申请保存至WebSocket消息队列中,其中,WebSocket是一种基于长连接的推送服务,其作用在于不用终端用户发起接口请求,主动将消息推送给终端用户。
该可选的实施例中,通过借助于WebSocket消息队列的消息推送机制,能够快速实时的获取到就诊申请以对就诊申请进行解析。
所述第三识别模块208,用于调用疾病等级识别模型识别所述电子病例的疾病等级;确定所述就诊申请对应的就诊医生并获取所述就诊医生的就诊等级;根据所述疾病等级及所述就诊等级判断是否需要转诊就诊;当根据所述疾病等级及所述就诊等级确定需要转诊就诊时,生成转诊申请单。
终端可以依据世界卫生组织疾病程度划分表,取4个疾病程度,分别对应轻度、中度、重度、高危,并以此建立电子病例集。按照6:2:2的比例依次划分训练集、测试集、验证集,并分别通过医疗知识图谱识别出所述训练集、测试集、验证集中的电子病例的多个实体类型及每个实体类型对应的实体名称、实体属性,从而分别构建训练实体属性向量集、测试实体属性向量集及验证实体属性向量集。基于训练实体属性向量集、测试实体属性向量集及验证实体属性向量集训练用于分析疾病等级的神经网络模型,得到疾病等级识别模型。
临床支持决策系统调用疾病等级识别模型识别所述电子病例的疾病等级,根据疾病等级与就诊医生的就诊等级确定是否需要转诊就诊。当疾病等级低于所述就诊等级时,确定不需要转诊就诊,当疾病等级高于所述就诊等级时,确定需要转诊就诊。
当根据所述疾病等级及所述就诊等级确定需要转诊就诊时,生成转诊申请单。既能够优化本医院的医疗资源,又能够为患者匹配出合适的就诊医生,避免无就诊能力的就诊医生耽误患者的病情,提高就诊人的就诊体验。
在一个可选的实施例中,所述第三识别模块208调用疾病等级识别模型识别所述电子病例的疾病等级包括:
识别所述电子病例中的多个实体类型及每个实体类型对应的实体名称、实体属性;
根据所述类型及每个实体类型对应的实体名称、实体属性构建实体属性向量;
输入实体属性向量至疾病等级识别模型中进行疾病等级的识别。
其中,所述实体类型是指疾病、症状、诊断分类、治疗、检查检验、人体组织、检查项等医学名词,所述实体名称是指每个实体类型包括的实体项目,所述实体属性是指实体项目的程度。例如,实体类型为疾病,所述实体项目为癌症,所述实体属性为中3期。
终端中预先存储有通过专业的医疗实体标记员构建的医疗知识图谱,通过医疗知识图谱识别出所述患者电子病例中的多个实体类型,并根据上下文语义解析算法解析出每个实体项目在所述患者电子病例中的实体属性。
当识别出的疾病等级越高时,表明所述患者的病情较为严重;当识别出的疾病等级越低时,表明所述患者的病情较为轻微。
综上,本发明实施例,根据患者的就诊申请个性化的获取适合患者病情的电子病例参考模板,为后续快速录入电子病例提供了基础;采集就诊过程中的语音并对所述语音进行语音分离得到多个问题语音及每个问题语音对应的回答语音,并识别每个问题语音得到问题文本及识别每个回答语音得到回答文本,通过语音识别技术能够自动的识别就诊过程中的语音文本,避免就诊医生手动录入;根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本,组合文本的文本长度符合BERT模型的输入需求,避免采用BERT模型进行识别时,造成文本信息的丢失,导致文本识别错误;通过BERT模型识别每个组合文本中的每个文本字符的文本向量之后,计算每个文本字符的文本向量的答案概率并根据所述答案概率确定每个问题文本对应的答案文本,能够提高答案文本的识别准确率,提高了电子病例的录入质量;最后将多个问题文本及每个问题文本对应的答案文本录入所述电子病例参考模板中,实现了电子病例的快速且自动的录入。
需要强调的是,为进一步保证上述电子病例的私密性和安全性,上述电子病例可存储于区块链的节点中。
参阅图3所示,为本发明实施例三提供的终端的结构示意图。在本发明较佳实施例中,所述终端3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
本领域技术人员应该了解,图3示出的终端的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述终端3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述终端3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的计算机设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述终端3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述终端3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31中存储有计算机程序,所述计算机程序被所述至少一个处理器32执行时实现如所述的基于人工智能的电子病例录入方法中的全部或者部分步骤。所述存储器31包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
在一些实施例中,所述至少一个处理器32是所述终端3的控制核心(ControlUnit),利用各种接口和线路连接整个终端3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行终端3的各种功能和处理数据。例如,所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本发明实施例中所述的基于人工智能的电子病例录入方法的全部或者部分步骤;或者实现基于人工智能的电子病例录入装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
尽管未示出,所述终端3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述终端3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台终端(可以是个人计算机,终端,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (9)
1.一种基于人工智能的电子病例录入方法,其特征在于,所述方法包括:
根据患者的就诊申请获取电子病例参考模板;
采集就诊过程中的语音并对所述语音进行语音分离得到多个问题语音及每个问题语音对应的回答语音;
识别每个问题语音得到问题文本及识别每个回答语音得到回答文本,当所述回答文本的文本长度超过预设文本长度阈值时,根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本,其中,所述预设文本长度阈值为BERT模型允许输入的最大文本长度;
采用所述BERT模型识别每个组合文本中的每个文本字符的文本向量;
计算每个文本字符的文本向量的答案概率并根据所述答案概率确定每个问题文本对应的答案文本,包括:计算所述文本字符的文本向量的第一向量值;计算所述文本字符对应的组合文本的文本向量的第二向量值;根据所述第一向量值及所述第二向量值计算所述文本字符的答案概率;确定大于预设概率阈值的答案概率对应的文本字符为目标文本字符;根据所述问题文本对应的多个组合文本中的目标文本字符生成答案文本;
将多个问题文本及每个问题文本对应的答案文本录入所述电子病例参考模板得到电子病例。
2.如权利要求1所述的基于人工智能的电子病例录入方法,其特征在于,所述根据患者的就诊申请获取电子病例参考模板包括:
解析所述就诊申请得到就诊科室类型;
获取与所述就诊科室类型对应的电子病例参考模板。
3.如权利要求1所述的基于人工智能的电子病例录入方法,其特征在于,所述根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本包括:
针对每个问题文本,从所述回答文本的第一个文本字符开始无重叠滑动预设第一长度的滑动窗口,并在每次滑动之后判断是否满足滑动结束条件;
当确定满足滑动结束条件时,停止所述滑动窗口的滑动,并将每次滑动时所述滑动窗口在所述回答文本中的开始位置和结束位置确定为字符切分节点;
从每个所述字符切分节点开始,从所述回答文本中切分出预设第二长度的文本字符得到多个文本片段;
将所述问题文本与对应的多个文本片段中的每一个文本片段分别进行拼接得到多个组合文本。
4.如权利要求1至3中任意一项所述的基于人工智能的电子病例录入方法,其特征在于,所述方法还包括:
调用疾病等级识别模型识别所述电子病例的疾病等级;
确定所述就诊申请对应的就诊医生并获取所述就诊医生的就诊等级;
根据所述疾病等级及所述就诊等级判断是否需要转诊就诊;
当根据所述疾病等级及所述就诊等级确定需要转诊就诊时,生成转诊申请单。
5.如权利要求4所述的基于人工智能的电子病例录入方法,其特征在于,所述调用疾病等级识别模型识别所述电子病例的疾病等级包括:
识别所述电子病例中的多个实体类型及每个实体类型对应的实体名称、实体属性;
根据所述类型及每个实体类型对应的实体名称、实体属性构建实体属性向量;
输入实体属性向量至疾病等级识别模型中进行疾病等级的识别。
6.如权利要求2所述的基于人工智能的电子病例录入方法,其特征在于,在所述解析所述就诊申请得到就诊科室类型之前,所述方法还包括:
接收就诊申请;
保存所述就诊申请至WebSocket消息队列;
通过所述WebSocket消息队列实时推送WebSocket消息至前端。
7.一种基于人工智能的电子病例录入装置,其特征在于,所述装置包括:
获取模块,用于根据患者的就诊申请获取电子病例参考模板;
采集模块,用于采集就诊过程中的语音并对所述语音进行语音分离得到多个问题语音及每个问题语音对应的回答语音;
第一识别模块,用于识别每个问题语音得到问题文本及识别每个回答语音得到回答文本,当所述回答文本的文本长度超过预设文本长度阈值时,根据每个问题文本及所述问题文本对应的回答文本生成多个组合文本,其中,所述预设文本长度阈值为BERT模型允许输入的最大文本长度;
第二识别模块,用于采用所述BERT模型识别每个组合文本中的每个文本字符的文本向量;
计算模块,用于计算每个文本字符的文本向量的答案概率并根据所述答案概率确定每个问题文本对应的答案文本,包括:计算所述文本字符的文本向量的第一向量值;计算所述文本字符对应的组合文本的文本向量的第二向量值;根据所述第一向量值及所述第二向量值计算所述文本字符的答案概率;确定大于预设概率阈值的答案概率对应的文本字符为目标文本字符;根据所述问题文本对应的多个组合文本中的目标文本字符生成答案文本;
录入模块,用于将多个问题文本及每个问题文本对应的答案文本录入所述电子病例参考模板得到电子病例。
8.一种终端,其特征在于,所述终端包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至6中任意一项所述的基于人工智能的电子病例录入方法。
9.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任意一项所述的基于人工智能的电子病例录入方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011481853.3A CN112634889B (zh) | 2020-12-15 | 2020-12-15 | 基于人工智能的电子病例录入方法、装置、终端及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011481853.3A CN112634889B (zh) | 2020-12-15 | 2020-12-15 | 基于人工智能的电子病例录入方法、装置、终端及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112634889A CN112634889A (zh) | 2021-04-09 |
CN112634889B true CN112634889B (zh) | 2023-08-08 |
Family
ID=75313297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011481853.3A Active CN112634889B (zh) | 2020-12-15 | 2020-12-15 | 基于人工智能的电子病例录入方法、装置、终端及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112634889B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113724695B (zh) * | 2021-08-30 | 2023-08-01 | 深圳平安智慧医健科技有限公司 | 基于人工智能的电子病历生成方法、装置、设备及介质 |
CN113706724A (zh) * | 2021-08-30 | 2021-11-26 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的转诊监管方法、装置、设备及存储介质 |
CN113761899A (zh) * | 2021-09-07 | 2021-12-07 | 卫宁健康科技集团股份有限公司 | 一种医疗文本生成方法、装置、设备及存储介质 |
CN115292458A (zh) * | 2022-06-29 | 2022-11-04 | 北京梦天门科技股份有限公司 | 一种调查信息录入方法、系统及电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010054549A (ja) * | 2008-08-26 | 2010-03-11 | Gifu Univ | 回答音声認識システム |
CN104485105A (zh) * | 2014-12-31 | 2015-04-01 | 中国科学院深圳先进技术研究院 | 一种电子病历生成方法和电子病历系统 |
CN109003648A (zh) * | 2018-06-29 | 2018-12-14 | 北京大学口腔医学院 | 口腔门诊语音电子病历生成方法和计算机可读存储介质 |
WO2020037454A1 (zh) * | 2018-08-20 | 2020-02-27 | 深圳市全息医疗科技有限公司 | 智能辅助诊疗系统及方法 |
CN111046152A (zh) * | 2019-10-12 | 2020-04-21 | 平安科技(深圳)有限公司 | Faq问答对自动构建方法、装置、计算机设备及存储介质 |
CN111145903A (zh) * | 2019-12-18 | 2020-05-12 | 东北大学 | 获取眩晕症问诊文本的方法、装置、电子设备及问诊系统 |
CN111180025A (zh) * | 2019-12-18 | 2020-05-19 | 东北大学 | 表示病历文本向量的方法、装置及问诊系统 |
CN111274373A (zh) * | 2020-01-16 | 2020-06-12 | 山东大学 | 一种基于知识图谱的电子病历问答方法及系统 |
CN111797922A (zh) * | 2020-07-03 | 2020-10-20 | 泰康保险集团股份有限公司 | 文本图像分类方法及装置 |
CN111863170A (zh) * | 2016-09-05 | 2020-10-30 | 京东方科技集团股份有限公司 | 一种电子病历信息的生成方法、装置及系统 |
-
2020
- 2020-12-15 CN CN202011481853.3A patent/CN112634889B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010054549A (ja) * | 2008-08-26 | 2010-03-11 | Gifu Univ | 回答音声認識システム |
CN104485105A (zh) * | 2014-12-31 | 2015-04-01 | 中国科学院深圳先进技术研究院 | 一种电子病历生成方法和电子病历系统 |
CN111863170A (zh) * | 2016-09-05 | 2020-10-30 | 京东方科技集团股份有限公司 | 一种电子病历信息的生成方法、装置及系统 |
CN109003648A (zh) * | 2018-06-29 | 2018-12-14 | 北京大学口腔医学院 | 口腔门诊语音电子病历生成方法和计算机可读存储介质 |
WO2020037454A1 (zh) * | 2018-08-20 | 2020-02-27 | 深圳市全息医疗科技有限公司 | 智能辅助诊疗系统及方法 |
CN111046152A (zh) * | 2019-10-12 | 2020-04-21 | 平安科技(深圳)有限公司 | Faq问答对自动构建方法、装置、计算机设备及存储介质 |
CN111145903A (zh) * | 2019-12-18 | 2020-05-12 | 东北大学 | 获取眩晕症问诊文本的方法、装置、电子设备及问诊系统 |
CN111180025A (zh) * | 2019-12-18 | 2020-05-19 | 东北大学 | 表示病历文本向量的方法、装置及问诊系统 |
CN111274373A (zh) * | 2020-01-16 | 2020-06-12 | 山东大学 | 一种基于知识图谱的电子病历问答方法及系统 |
CN111797922A (zh) * | 2020-07-03 | 2020-10-20 | 泰康保险集团股份有限公司 | 文本图像分类方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112634889A (zh) | 2021-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112634889B (zh) | 基于人工智能的电子病例录入方法、装置、终端及介质 | |
CN112614578B (zh) | 医生智能推荐方法、装置、电子设备及存储介质 | |
CN112216361A (zh) | 基于人工智能的随访计划单生成方法、装置、终端及介质 | |
WO2021180244A1 (zh) | 一种疾病风险预测系统、方法、装置、设备及介质 | |
CN112149409B (zh) | 医疗词云生成方法、装置、计算机设备及存储介质 | |
CN111564223A (zh) | 传染病生存概率的预测方法、预测模型的训练方法及装置 | |
CN113724830B (zh) | 基于人工智能的用药风险检测方法及相关设备 | |
CN111986794B (zh) | 基于人脸识别的防冒挂号方法、装置、计算机设备及介质 | |
CN111986744B (zh) | 医疗机构的患者界面生成方法、装置、电子设备及介质 | |
CN111144658A (zh) | 医疗风险预测方法、装置、系统、存储介质与电子设备 | |
CN111785371A (zh) | 医疗服务方法、装置、计算机设备及存储介质 | |
CN111950625A (zh) | 基于人工智能的风险识别方法、装置、计算机设备及介质 | |
CN113870974B (zh) | 基于人工智能的风险预测方法、装置、电子设备及介质 | |
CN111816300A (zh) | 基于深度强化学习的数据分类方法、装置、设备及介质 | |
CN114334175B (zh) | 医院疫情监测方法、装置、计算机设备及存储介质 | |
CN112634017A (zh) | 远程开卡激活方法、装置、电子设备及计算机存储介质 | |
CN112435745B (zh) | 就诊策略推荐方法、装置、电子设备及存储介质 | |
CN113434651B (zh) | 话术推荐方法、装置及相关设备 | |
CN111651452B (zh) | 数据存储方法、装置、计算机设备及存储介质 | |
CN115658858A (zh) | 基于人工智能的对话推荐方法及相关设备 | |
CN113793668B (zh) | 基于人工智能的症状标准化方法、装置、电子设备及介质 | |
CN114492446B (zh) | 法律文书处理方法、装置、电子设备及存储介质 | |
CN111859985B (zh) | Ai客服模型测试方法、装置、电子设备及存储介质 | |
CN114664458A (zh) | 患者分类装置、计算机设备及存储介质 | |
CN113221990A (zh) | 信息录入方法、装置及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220916 Address after: Room 2601 (Unit 07), Qianhai Free Trade Building, No. 3048, Xinghai Avenue, Nanshan Street, Qianhai Shenzhen-Hong Kong Cooperation Zone, Shenzhen, Guangdong 518000 Applicant after: Shenzhen Ping An Smart Healthcare Technology Co.,Ltd. Address before: 1-34 / F, Qianhai free trade building, 3048 Xinghai Avenue, Mawan, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong 518000 Applicant before: Ping An International Smart City Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |