CN117275649B - 文档病历图片的排序方法和装置、电子设备和存储介质 - Google Patents
文档病历图片的排序方法和装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN117275649B CN117275649B CN202311559275.4A CN202311559275A CN117275649B CN 117275649 B CN117275649 B CN 117275649B CN 202311559275 A CN202311559275 A CN 202311559275A CN 117275649 B CN117275649 B CN 117275649B
- Authority
- CN
- China
- Prior art keywords
- picture
- document
- medical record
- text
- record pictures
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012937 correction Methods 0.000 claims description 37
- 230000007115 recruitment Effects 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 description 18
- 238000012015 optical character recognition Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 239000003814 drug Substances 0.000 description 10
- 229940079593 drug Drugs 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000002604 ultrasonography Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 206010041519 Spider naevus Diseases 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 210000001165 lymph node Anatomy 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 102100032202 Cornulin Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000920981 Homo sapiens Cornulin Proteins 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 210000004400 mucous membrane Anatomy 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000005311 nuclear magnetism Effects 0.000 description 1
- 238000012634 optical imaging Methods 0.000 description 1
- 238000009522 phase III clinical trial Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/106—Display of layout of documents; Previewing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请公开了一种文档病历图片的排序方法和装置、电子设备和存储介质,该方法包括获取若干文档病历图片,并分别提取文档头信息、文档尾信息以及文档正文信息;基于文档头信息和文档尾信息,确定若干文档病历图片中的首页图片,并基于文档正文信息,分别提取若干文档病历图片的头文本和尾文本;将若干文档病历图片组合为图片对,并基于头文本和尾文本确定图片对中两张文档病历图片的相邻置信度;基于首页图片和相邻置信度,确定若干文档病历图片的最大概率路径,以对若干文档病历图片进行排序。如此,可以在无需人工介入的情况下,实现患者上传的文档病历图片的准确排序,从而保障后续病程生成的可靠性,避免影响患者招募。
Description
技术领域
本申请属于计算机技术领域,具体涉及一种文档病历图片的排序方法和装置、电子设备和存储介质。
背景技术
在智能招募等业务场景中,业务方为了获取患者的病程信息,通常会要求患者上传其入院记录、出院记录等图片。由于患者操作的自由度高和图片资料的复杂性,经常会导致最终生成的病程信息错误,进而影响患者的匹配。
公开于该背景技术部分的信息仅仅旨在增加对本申请的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本申请的目的在于提供一种文档病历图片的排序方法,其用于解决现有技术中患者招募匹配效果不佳的问题。
为实现上述目的,本申请提供了一种文档病历图片的排序方法,所述方法包括:
获取若干文档病历图片,并分别提取文档头信息、文档尾信息以及文档正文信息;
基于所述文档头信息和文档尾信息,确定所述若干文档病历图片中的首页图片,并基于所述文档正文信息,分别提取所述若干文档病历图片的头文本和尾文本;
将所述若干文档病历图片组合为图片对,并基于所述头文本和尾文本确定所述图片对中两张文档病历图片的相邻置信度;
基于所述首页图片和相邻置信度,确定所述若干文档病历图片的最大概率路径,以对所述若干文档病历图片进行排序。
一实施例中,基于所述文档头信息和文档尾信息,确定所述若干文档病历图片中的首页图片,具体包括:
将所述文档头信息或文档尾信息中包括目标页码的文档病历图片确定为所述首页图片;和/或,
将所述文档头信息中包括目标文本的文档病历图片确定为所述首页图片,其中,所述目标文本包括医院名称、病历文书类型、病历基本信息中的一种或组合。
一实施例中,基于所述文档正文信息,分别提取所述若干文档病历图片的头文本和尾文本,具体包括:
分别获取所述若干文档病历图片的头M行文本和尾N行文本;
基于标点对所述若干文档病历图片的头M行文本进行分割以提取对应的头文本,以及基于标点对所述若干文档病历图片的尾N行文本进行分割以提取对应的尾文本。
一实施例中,所述图片对包括第一图片和第二图片;
将所述若干文档病历图片组合为图片对,并基于所述头文本和尾文本确定所述图片对中两张文档病历图片的相邻置信度,具体包括:
拼接所述第一图片的第一长度头文本和第二图片的第一长度尾文本并输入分类网络,确定所述第二图片为所述第一图片的在前图片的第一置信度;
拼接所述第一图片的第一长度尾文本和第二图片的第一长度头文本并输入所述分类网络,确定所述第一图片为所述第二图片的在先图片的第二置信度。
一实施例中,所述方法还包括:
在所述第一图片和第二图片为相同图片时,将所述第一图片和第二图片的相邻置信度确定为0;和/或,
在所述第一图片为首页图片时,将所述第二图片为所述第一图片的在前图片的第一置信度确定为0。
一实施例中,所述方法还包括:
拼接所述第一图片的第二长度头文本和第二图片的第二长度尾文本,获得第一拼接语句,其中,所述第一长度和第二长度的长度不等;
拼接所述第一图片的第二长度尾文本和第二图片的第二长度头文本,获得第二拼接语句;
基于所述第一拼接语句和第二拼接语句的困惑度,修正所述图片对中两张文档病历图片的相邻置信度。
一实施例中,基于所述第一拼接语句和第二拼接语句的困惑度,修正所述图片对中两张文档病历图片的相邻置信度,具体包括:
比较所述第一拼接语句和第二拼接语句的困惑度;
在所述第一拼接语句的困惑度大于第二拼接语句的困惑度时,判断所述第一置信度是否小于第二置信度;若是,
在所述第一长度小于第二长度时,以第一修正力度增加所述第二置信度的值,并在所述第一长度大于第二长度时,以第二修正力度增加所述第二置信度的值,其中,所述第一修正力度大于第二修正力度。
一实施例中,在所述第一置信度大于第二置信度时,所述方法还包括:
在所述第一长度小于第二长度时,以第三修正力度减小所述第一置信度,并在所述第一长度大于第二长度时,以第四修正力度减小所述第一置信度,其中,所述第三修正力度大于第四修正力度。
一实施例中,基于所述首页图片和相邻置信度,确定所述若干文档病历图片的最大概率路径,具体包括:
以所述若干文档病历图片是否为所述首页图片,确定所述若干文档病历图片在初始时刻的初始概率值;
基于所述初始概率值和相邻置信度,确定从所述初始时刻分别到达下一时刻所述若干文档病历图片的若干最大概率值;
在每下一时刻,基于若干参考最大概率值和所述相邻置信度,递推确定从上一时刻分别到达下一时刻所述若干文档病历图片的若干最大概率值,其中,所述参考最大概率值为从上一时刻到达下一时刻所述文档病历图片的最大概率值;
选取从所述初始时刻到达终止时刻时,所述最大概率值的最大累加值对应的图片排序路径为所述最大概率路径。
一实施例中,所述方法还包括:
在终止时刻时,沿所述最大概率路径依次回溯上一时刻对应的文档病历图片,直至到达初始时刻;
基于回溯所得的图片排序,对所述若干文档病历图片进行排序。
本申请还提供一种文档病历图片的排序装置,包括:
获取模块,用于获取若干文档病历图片,并分别提取文档头信息、文档尾信息以及文档正文信息;
第一确定模块,用于基于所述文档头信息和文档尾信息,确定所述若干文档病历图片中的首页图片,并基于所述文档正文信息,分别提取所述若干文档病历图片的头文本和尾文本;
第二确定模块,用于组合所述若干文档病历图片以构建图片对,并基于所述头文本和尾文本确定所述图片对中两张文档病历图片的相邻置信度;
排序模块,用于基于所述首页图片和相邻置信度,确定所述若干文档病历图片的最大概率路径,以对所述若干文档病历图片进行排序。
本申请还提供一种电子设备,包括:
至少一个处理器;以及
存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的文档病历图片的排序方法。
本申请还提供一种机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如上所述的文档病历图片的排序方法。
与现有技术相比,根据本申请的文档病历图片的排序方法,通过对文档病历图片进行文档头信息、文档尾信息以及文档正文信息的提取,确定首页图片、头文本和尾文本,并基于头文本和尾文本确定文档病历图片组合成的图片对中两张文档病历图片的相邻置信度,进而确定若干文档病历图片的最大概率路径,以对其进行排序,可以在无需人工介入的情况下,实现患者上传的文档病历图片的准确排序,从而保障后续病程生成的可靠性,避免影响患者招募。
附图说明
图1是根据本申请一实施例文档病历图片的排序方法的应用场景示意图;
图2是根据本申请一实施例文档病历图片的排序方法的流程图;
图3是根据本申请一实施例文档病历图片的排序方法中,OCR识别时对患者资料进行预处理的示意图;
图4是根据本申请一实施例文档病历图片的排序方法中,OCR识别患者资料中文本信息的示意图;
图5是根据本申请一实施例文档病历图片的排序方法中,超声医学影像报告的示意图;
图6是根据本申请一实施例文档病历图片的排序方法中,寻找最大概率路径的网络示意图;
图7是根据本申请一实施例文档病历图片的排序装置的模块图;
图8是根据本申请一实施方式电子设备的硬件结构图。
具体实施方式
以下将结合附图所示的各实施方式对本申请进行详细描述。但该等实施方式并不限制本申请,本领域的普通技术人员根据该等实施方式所做出的结构、方法、或功能上的变换均包含在本申请的保护范围内。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV),计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
药物的临床试验指的是在人体进行的药物系统性研究,以确定药物的疗效和安全性。药物临床试验阶段分为I期、II期、III期临床试验、IV期临床试验。I期主要是涉及初步的临床药理学及人体安全性评价试验。II期可以理解为治疗作用初步评价阶段,主要涉及初步评价药物对目标适应症患者的治疗作用和安全性,也包括为III期临床试验研究设计和给药剂量方案的确定提供依据。III期可以理解为治疗作用确证阶段,主要进一步验证药物对目标适应症患者的治疗作用和安全性,评价利益与风险关系,最终为药物注册申请的审查提供充分的依据。IV期主要是药物上市后的临床试验,在药物上市后,可以继续追踪在广泛使用条件下的药物的疗效和不良反应,以评价在普通或者特殊人群中使用的利益与风险关系以及改进给药剂量等。
患者招募就是临床试验研究项目的申办者药企,委托医院或者临床试验服务机构,通过各种方式,招募合适的患者参与到临床试验项目中。通常地,可以通过收集患者最新的入院记录、出院记录、病历报告、CT/核磁等影像学、基因报告等疾病信息,筛选符合临床试验研究项目的患者,并推荐到对应的试验开展医院就诊。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等。除此之外,人工智能技术还可以在其它领域得到应用,例如,本申请的各实施例中,利用计算机视觉技术识别并提取文档病历图片中的文档头信息、文档尾信息以及文档正文信息,再利用自然语言处理技术抽取这些信息中的头文本和尾文本,最后利用机器学习技术基于头文本和尾文本确定患者上传的若干文档病历图片的最大概率路径,以对这些文档病历图片进行排序。
在一些应用场景中,例如患者A上传了多份文档病历:入院记录1、入院记录2、出院记录1、出院记录2、CT检查报告和基因报告,这其中的每份文档病历都可能包括多页图片。以入院记录为例,患者实际上传的图片顺序可能是:入院记录1第1页-入院记录2第2页-入院记录1第2页-入院记录2第1页。可以看出,若依照患者上传的图片顺序生成患者病程可能会导致招募时的匹配错误。基于此,本申请期望在生成患者病程之前,对患者上传的文档病历图片先进行正确的排序,进而可以基于正确的文档病历图片顺序生成患者病程,从而提高患者招募的匹配效果。
参图1,在一个实施环境场景示例中,服务器、终端通过网络连接,患者可以通过终端上传文档病历图片至服务器。服务器通过运行本申请实施例提供的文档病历图片的排序方法,对这些文档病历图片进行正确的排序。
又或者,在其它的实施场景中,本实施例提供的文档病历图片的排序方法也可以是由服务器和终端共同运行。例如,终端在接收到患者输入的文档病历图片后,先提取其中的文档头信息、文档尾信息以及文档正文信息,进而确定首页图片并提取文档病历图片的头文本和尾文本;服务器可以进一步地获取上述终端的处理结果,以确定文档病历图片的最大概率路径,实现对文档病历图片的排序。
以上实施环境中,终端与服务器之间通过通信网络进行数据通信,可选地,通信网络可以是有线网络也可以是无线网络,且该通信网络可以是局域网、城域网以及广域网中的至少一种。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。服务器以及终端设备可以为彼此独立的设备,也可以是集成于同一个系统内,此处不做限定。
基于上述文档病历图片的排序过程相关描述可以看出,本申请实施例提出的文档病历图片的排序方法可以由任意合适的计算机设备(终端或服务器)执行;或者,该文档病历图片的排序方法可由终端和服务器共同执行。为便于阐述,后续均以计算机设备执行该文档病历图片的排序方法为例进行说明。
参图2,介绍本申请文档病历图片的排序方法的一实施例。在本实施例中,该方法包括:
S11、获取若干文档病历图片,并分别提取文档头信息、文档尾信息以及文档正文信息。
计算机设备获取的文档病历图片可以是用户上传的多种格式的电子数据,例如PDF文档格式,PNG、JPEG、JPG、BMP等图片格式。在一些场景中,用户可以是将多张文档病历图片打包进行上传。计算机设备在接收到压缩包后,解压出其中的文档病历图片并分别进行识别,从而提升操作效率。
计算机设备可以首先基于光学字符识别模型对文档病历图片中的文本信息进行识别。光学字符识别(Optical Character Recognition,OCR)是指针对印刷体字符,通过光学成像设备转换为电子文件,并利用识别软件将电子文件中的文字转换为文本格式。示范性地,成像设备可以是扫描仪、数码相机、带摄像功能的移动终端等。
可以理解的,针对文档病历图片类型的多样性,可以调用合适的光学字符识别模型从其中识别文本信息。并且,针对不同类型的文档病历图片,光学字符识别模型可以是被预先针对性地建模和训练,从而在相应类型的文档病历图片识别中具有较佳的准确性。
一实施例中,光学字符识别模型可以是CRNN网络模型。可选地,在利用光学字符识别模型进行文本信息识别前,还可以根据不同文档病历图片的来源,对其进行一些设定流程的预处理,以优化光学字符识别结果。
配合参图3,示范性地,对于文档病历图片而言,可能的保存角度有0°、90°、180°以及270°,其中,0°为常规视角的角度,90°为0°向右旋转90°,其它角度同理。本实施例中,可以选择轻量级神经网络模型mobileNetv3将受试者资料都统一旋转至0°,以便于后续处理。
配合参图4,又例如,可以使用DBNet网络模型进行受试者资料中连续文本的坐标检测,并且,综合性能考虑,其主干网络(backbone)可以采用resnet18。DBNet网络可以为文档病历图片中的连续文本匹配对应的文本框,从而将这些文本框的四个顶点的坐标确定为对应的连续文本坐标。根据确定的连续文本坐标,可以进行透视变换,以获取文档病历图片中的文本区域图片供光学字符识别。透视变换的过程是将一个平面通过一个投影矩阵投影到指定的平面上,从而扭转矫正原图像中可能存在的变形和偏转等问题。
计算机设备还可以基于深度神经网络确定文档病历图片中的文档头信息、文档尾信息以及文档正文信息对应的区域位置,进而,结合上述OCR识别的结果进行版面分析,从对应的区域位置提取文档头信息、文档尾信息以及文档正文信息。
这里的深度神经网络可以是YOLO-V5网络,还可以是其它用于目标检测的卷积神经网络,例如,可以是基于区域的卷积神经网络(Regions with ConvolutionalNeuralNetwork,R-CNN)、快速基于区域的卷积神经网络(Fast R-CNN)、空间金字塔池网络(Spatial PyramidPooling Net,SPP-Net)、YOLO-V1、YOLO-V2、YOLO-V3等。
整体而言,YOLO是一种端到端的网络模型,从网络设计上,改革了区域建议框式检测框架,RCNN系列均需要生成建议框,在建议框上进行分类与回归,但建议框之间有重叠,这会带来很多重复工作。YOLO将全图划分为S*S的格子,每个格子负责中心在该格子的目标检测,采用一次性预测所有格子所含目标的bbox、定位置信度以及所有类别概率向量来将问题一次性解决(one-shot)。也就是说,YOLO训练和检测均是在一个单独网络中进行。并且,YOLO将物体检测作为一个回归问题进行求解,输入图片经过一次推理(inference),便能得到图片中所有对象的位置和其所属类别及相应的置信概率。相对地,RCNN系列需要将检测结果分为两部分求解:物体类别(分类问题),物体位置即回归问题(bounding box)。
示范性地,文档头信息例如包括正文前的医院名称(XXX医院)、病历文书类型(入院记录、出院记录等)、病历基本信息(姓名、性别、科室等)、页码信息(第1页、…、第N页)等;文档尾信息例如包括正文后的页码信息(第1页/共3页)和补充信息等;正文信息则包括正文的文字内容。
S12、基于文档头信息和文档尾信息,确定若干文档病历图片中的首页图片,并基于文档正文信息,分别提取若干文档病历图片的头文本和尾文本。
本实施例中,计算机设备可以将文档头信息或文档尾信息中包括目标页码的文档病历图片确定为首页图片。例如,计算机设备在文档病历图片A的尾信息中识别到了“第1页/共3页”,或者在文档病历图片B的头信息中识别到了“第1页”,则可以将文档病历图片A和文档病历图片B确定为首页图片。
在一些类型的文档病历图片中,可能单张文档病历图片即对应至一份患者的文档病历。参图5,一份超声医学影像报告包括一张文档病历图片,该文档病历图片并不包括页码信息,此时通过页码信息确定该超声医学影像报告是否为首页图片可能并不合适。为此,本实施例中,计算机设备还可以将文档头信息中包括目标文本的文档病历图片确定为首页图片,这里的目标文本可以包括医院名称、病历文本类型、病历基本信息中的一种或组合。
继续参图5,可以看出该超声医学影像报告的文档头信息可以包括:“超声医学影像报告”(病历文书类型)、“姓名:XX”(病历基本信息)、“性别:XX”(病历基本信息)、“科别:XX”(病历基本信息)、“临床诊断”。计算机设备可以识别出其中包括了病历文书类型和病历基本信息,并依此将该超声医学影像报告确定为首页图片。
本实施例中,计算机设备提取的头文本和尾文本可以是文档正文信息中指定位置的句子。例如,要求将文档正文信息中前3句提取作为头文本、后3句提取作为尾文本。
计算机设备可以分别获取若干文档病历图片的头M行文本和尾N行文本,并基于标点对该若干文档病历图片的头M行文本进行分割以提取对应的头文本、基于标点对若干文档病历图片的尾N行文本进行分割以提取对应的尾文本。例如,可以将句号、分号、问号、感叹号等表示一个句子结束的标点符号作为句子分割符,也可以将逗号也作为句子分割符。分割后得到的头文本headj(文档病历图片j的头文本)和尾文本taili(文档病历图片i的尾文本)可以表示为:
其中,split表示以标点进行分割的文本分割函数。
S13、将若干文档病历图片组合为图片对,并基于头文本和尾文本确定图片对中两张文档病历图片的相邻置信度。
在将若干文档病历图片组合为图片对时,可以有不同的组合方式。例如,假设有N张文档病历图片,可以对这N张文档病历图片进行全排列组合,获得N×(N-1)个图片对;又或者,每张图片也可以与自身进行组合,获得N×N个图片对;又或者,还可以考虑图片对中两张图片的先后顺序,获得2×N×N个图片对。
本实施例中,计算机设备在组合图片对时,可以不考虑图片对中两张图片的先后顺序,且每张图片允许与自身进行组合。例如,患者上传的文档病历图片包括:[图片1,图片2,图片3,图片4],则计算机设备可以组合出图片对:[图片1,图片1]、[图片1,图片2]、[图片1,图片3]、[图片1,图片4]、[图片2,图片1]、[图片2,图片2]、…、[图片4,图片4]共计16个图片对。
计算机设备随之对每个图片对中的两张文档病历图片确定相邻置信度,具体地,以图片对中包括第一图片和第二图片为例,计算机设备可以拼接第一图片的第一长度头文本和第二图片的第一长度尾文本并输入分类网络,从而确定第二图片为第一图片的在前图片的第一置信度,以及拼接第一图片的第一长度尾文本和第二图片的第一长度头文本并输入分类网络,从而确定第一图片为第二图片的在先图片的第二置信度。
本实施例中,考虑到允许文档病历图片自身组合为图片对,计算机设备在进行置信度确定时,可以在第一图片和第二图片为相同图片时,将第一图片和第二图片的相邻置信度确定为0。同时,在第一图片为首页图片时,将第二图片为第一图片的在前图片的第一置信度确定为0。
示范性地,分类网络可以例如是采用下一句预测(Next Sentence Prediction,NSP)模型。NSP可以理解为BERT模型的一个任务目标函数。NSP是一个二分类任务,其用于预测第二个句子是不是第一句子的下一句,即NSP用于学习句子与句子之间的关系。
图片对中两张文档病历图片的相邻置信度可以表示为:
其中,i=j代表图片对中两张图片i和j为相同图片,jpage代表图片对中在后图片的页码,W为权重(也叫连接系数),b为偏置,W和b均为sigmoid激活函数中可以训练的参数,taili+headj代表拼接文档病历图片i的尾文本和文档病历图片j的头文本。
sigmoid激活函数可以用于二分类,将隐藏层神经元输出映射到(0,1)的区间。例如,若taili为:“全身黏膜皮肤未见黄染,未见肝掌,蜘蛛痣”,headj为:“耳前、耳后、颌下、锁骨上窝、腹股沟等浅表处淋巴结未触及肿大”,sigmoid激活函数计算得到ai,j=1,则代表“耳前、耳后、颌下、锁骨上窝、腹股沟等浅表处淋巴结未触及肿大”为“全身黏膜皮肤未见黄染,未见肝掌,蜘蛛痣”的在后句子,文档病历图片j为文档病历图片i的在后图片。
一些实施例中,考虑到基于NSP模型对图片相邻判断的局限性,还可以引入困惑度指标对上述的第一置信度、第二置信度进行修正。
困惑度是衡量句子语义通顺程度的一个指标,句子的语义越通顺,对应的困惑度越小。例如,可以基于预训练的语言模型计算句子的困惑度,语言模型是用于计算一个句子是一个语义通顺的正确句子的概率模型,困惑度则是与语言模型预测一个句子的概率相关的经句子长度归一化的指标。对于一个完全正确的句子,语言模型在该句子上的困惑度越小,则说明该语言模型越好。从另一个角度看,若已经选取了一个较佳的语言模型,那么对于一个句子而言,如果语言模型在该句子上的困惑度很小,则说明该句子属于正确句子的可能性就很大。
本实施例中,首先拼接第一图片的第二长度头文本和第二图片的第二长度尾文本获得第一拼接语句,并拼接第一图片的第二长度尾文本和第二图片的第二长度头文本获得第二拼接语句;基于第一拼接语句和第二拼接语句的困惑度,对图片对中两张文档病历图片的相邻置信度进行修正。
本申请提出,若基于NSP模型获得的第一置信度小于第二置信度,说明第一图片为第二图片的在前图片的可能性更大。这种情况下,如果第一拼接语句的困惑度也大于第二拼接语句的困惑度,则表明从困惑度角度出发,第一图片为第二图片的在前图片的可能性也更大。因此,可以通过强化第一图片为第二图片的在前图片的可能性,使得在后确定的最大概率路径更能反应文档病历图片的真实顺序。
反之,若基于NSP模型获得的第一置信度大于第二置信度,说明第二图片为第一图片的在前图片的可能性更大。这种情况下,如果第一拼接语句的困惑度仍然大于第二拼接语句的困惑度,则表明从困惑度角度出发,第一图片为第二图片的在前图片的可能性更大,即困惑度和NSP模型的判断结果相反。本申请认为,此时第二图片为第一图片的在前图片的可能性应当被削弱,但该削弱过程并不能导致第一图片为第二图片的在前图片的可能性大于第二图片为第一图片的在前图片的可能性。
具体地,计算机设备可以比较第一拼接语句和第二拼接语句的困惑度;在所述第一拼接语句的困惑度大于第二拼接语句的困惑度时,判断第一置信度是否小于第二置信度;若是,且在第一长度小于第二长度时,以第一修正力度增加第二置信度,并在第一长度大于第二长度时,以第二修正力度增加所述第二置信度,其中,第一修正力度大于第二修正力度;若否,且在第一长度小于第二长度时,以第三修正力度减小第一置信度,并在第一长度大于第二长度时,以第四修正力度减小第一置信度,其中,第三修正力度大于第四修正力度,且修正后的第一置信度大于第二置信度。
可以看出,在对图片对中两张文档病历图片的相邻置信度进行修正时,引入了NSP模型判断置信度和困惑度判断时所使用的文本长度指标。本申请提出,无论是NSP模型判断置信度或是困惑度判断,如果使用的文本长度更长,应当认为能够从其中获得更多的可信信息。基于此,通过区分第一修正力度和第二修正力度的差异、以及第三修正力度和第四修正力度的差异,使得置信度的修正进一步精细化。
S14、基于首页图片和相邻置信度,确定若干文档病历图片的最大概率路径,以对若干文档病历图片进行排序。
图片对中两张文档病历图片的相邻置信度可以视作两张图片之间的转移概率。例如图片对:[图片1,图片2]中图片1为图片2在先图片的置信度为1,则代表排序时,从图片1转移至图片2的概率为1。
文档病历图片组成的全部图片对的转移矩阵可以表示为:
A=[ai,j]
配合参图6,本实施例中,将文档病历图片的排序问题转换为了最优路径问题。也即,从开始出发,寻找从初始时刻直至终止时刻的文档病历图片最大概率路径。在寻找最大概率路径的每个观测时刻,都包括对应的观测量(当前时刻的文档病历图片)。可以看出,该最大概率路径的长度T、观察的时刻数、每个观测时刻的观测量都等于文档病历图片的数量N。
可以理解地,若图片对是由若干文档病历图片全排列获得,则最大概率路径在每个时刻的观测量也可以等于每个前一时刻观测量的数量减1,在此不再赘述。
本实施例中,计算机设备以若干文档病历图片是否为首页图片,确定该若干文档病历图片在初始时刻的初始概率值,表示为:
其中,π为初始概率向量,π可以表示为:
其中,pagei表示文档病历图片i的页码,也即,在文档病历图片i的页码不为1时,定义其对应的初始概率向量为0,反之则为1。
接着,计算机设备基于初始概率值和相邻置信度,确定从初始时刻分别到达下一时刻若干文档病历图片的若干最大概率值。
继续配合参图6,在开始出发时,仅凭S-A的N条路径并不能判断从哪条路径出发概率最大,因此,继续观察初始时刻的下一时刻:即S-A-B。可以看出,S-A-B有N×N条可能的路径;此时,经过S和A,可以分别确定一条到达B1、B2、…、BN的最大概率路径。同时,可以保留到达B时最大概率路径对应的最大概率值,并删除到达其它路径对应的概率值。
如此,在每下一时刻,计算机设备可以基于若干参考最大概率值和相邻置信度,递推确定从上一时刻分别到达下一时刻若干文档病历图片的若干最大概率值。这其中,参考最大概率值即为从上一时刻到达下一时刻文档病历图片的最大概率值,可以表示为:
其中,max表示取最大值,可以理解为从上一时刻到达所有状态i(即文档病历图片i)的路径中,选择概率最大的路径,并乘以从状态i转移至状态j的概率ai,j,得到从上一时刻到达状态j的所有路径中,概率最大的那条路径的概率值。
同时,定义表示在时刻t处于状态j时,前一个时刻的状态i使得从i到j的路径概率最大。使用以下公式计算/>:
其中,argmax表示取使函数取最大值的参数。计算完毕后,就代表了前T个观测值中以状态j结尾的所有路径中,概率最大的那条路经的概率值。
最后,选取从初始时刻到达终止时刻时,最大概率值的累加值对应的图片排序路径为最大概率路径。该最大概率值的累加值即可以表示为:
也即,递推完T个时刻(对应N张文档病历图片)后,以状态i结尾可取到最大概率路径。
具体地,计算机设备可以在终止时刻时,沿最大概率路径依次回溯上一时刻对应的文档病历图片,直至到达初始时刻,并基于回溯所得的图片排序,对若干文档病历图片进行排序。回溯的过程可以表示为:
即,可以从最终状态开始回溯,根据记录的前一个状态/>依次向前回溯,直至回溯到初始时刻t=1。至此,得到使得图片排序概率最大的路径,也即最大概率路径。
在上述实施例中,计算机设备还可以将计算所得的所有概率值取对数处理,从而防止因状态数和观测量过大而可能导致的数值下溢。
参图7,介绍本申请文档病历图片的排序装置的一实施例。在本实施例中,该扫描图像的处理装置包括获取模块21、第一确定模块22、第二确定模块23和排序模块24。
获取模块21用于获取若干文档病历图片,并分别提取文档头信息、文档尾信息以及文档正文信息;第一确定模块22用于基于所述文档头信息和文档尾信息,确定所述若干文档病历图片中的首页图片,并基于所述文档正文信息,分别提取所述若干文档病历图片的头文本和尾文本;第二确定模块23用于组合所述若干文档病历图片以构建图片对,并基于所述头文本和尾文本确定所述图片对中两张文档病历图片的相邻置信度;排序模块24用于基于所述首页图片和相邻置信度,确定所述若干文档病历图片的最大概率路径,以对所述若干文档病历图片进行排序。
一实施例中,第一确定模块22具体用于将所述文档头信息或文档尾信息中包括目标页码的文档病历图片确定为所述首页图片。
一实施例中,第一确定模块22具体用于将所述文档头信息中包括目标文本的文档病历图片确定为所述首页图片,其中,所述目标文本包括医院名称、病历文书类型、病历基本信息中的一种或组合。
一实施例中,第一确定模块22具体用于分别获取所述若干文档病历图片的头M行文本和尾N行文本;基于标点对所述若干文档病历图片的头M行文本进行分割以提取对应的头文本,以及基于标点对所述若干文档病历图片的尾N行文本进行分割以提取对应的尾文本。
一实施例中,所述图片对包括第一图片和第二图片;第二确定模块23具体用于拼接所述第一图片的第一长度头文本和第二图片的第一长度尾文本并输入分类网络,确定所述第二图片为所述第一图片的在前图片的第一置信度;拼接所述第一图片的第一长度尾文本和第二图片的第一长度头文本并输入所述分类网络,确定所述第一图片为所述第二图片的在先图片的第二置信度。
一实施例中,第二确定模块23还用于在所述第一图片和第二图片为相同图片时,将所述第一图片和第二图片的相邻置信度确定为0;和/或,在所述第一图片为首页图片时,将所述第二图片为所述第一图片的在前图片的第一置信度确定为0。
一实施例中,第二确定模块23还用于拼接所述第一图片的第二长度头文本和第二图片的第二长度尾文本,获得第一拼接语句,其中,所述第一长度和第二长度的长度不等;拼接所述第一图片的第二长度尾文本和第二图片的第二长度头文本,获得第二拼接语句;基于所述第一拼接语句和第二拼接语句的困惑度,修正所述图片对中两张文档病历图片的相邻置信度。
一实施例中,第二确定模块23具体用于比较所述第一拼接语句和第二拼接语句的困惑度;在所述第一拼接语句的困惑度大于第二拼接语句的困惑度时,判断所述第一置信度是否小于第二置信度;若是,在所述第一长度小于第二长度时,以第一修正力度增加所述第二置信度,并在所述第一长度大于第二长度时,以第二修正力度增加所述第二置信度,其中,所述第一修正力度大于第二修正力度。
一实施例中,在所述第一置信度大于第二置信度时,第二确定模块23还用于在所述第一长度小于第二长度时,以第三修正力度减小所述第一置信度,并在所述第一长度大于第二长度时,以第四修正力度减小所述第一置信度,其中,所述第三修正力度大于第四修正力度,且修正后的所述第一置信度大于第二置信度。
一实施例中,排序模块24具体用于以所述若干文档病历图片是否为所述首页图片,确定所述若干文档病历图片在初始时刻的初始概率值;基于所述初始概率值和相邻置信度,确定从所述初始时刻分别到达下一时刻所述若干文档病历图片的若干最大概率值;在每下一时刻,基于若干参考最大概率值和所述相邻置信度,递推确定从上一时刻分别到达下一时刻所述若干文档病历图片的若干最大概率值,其中,所述参考最大概率值为从上一时刻到达下一时刻所述文档病历图片的最大概率值;选取从所述初始时刻到达终止时刻时,所述最大概率值的最大累加值对应的图片排序路径为所述最大概率路径。
一实施例中,排序模块24具体用于在终止时刻时,沿所述最大概率路径依次回溯上一时刻对应的文档病历图片,直至到达初始时刻;基于回溯所得的图片排序,对所述若干文档病历图片进行排序。
如上参照图1到图6,对根据本说明书实施例文档病历图片的排序方法进行了描述。在以上对方法实施例的描述中所提及的细节,同样适用于本说明书实施例的文档病历图片的排序装置。上面的文档病历图片的排序装置可以采用硬件实现,也可以采用软件或者硬件和软件的组合来实现。
图8示出了根据本说明书的实施例的电子设备的硬件结构图。如图8所示,电子设备30可以包括至少一个处理器31、存储器32(例如非易失性存储器)、内存33和通信接口34,并且至少一个处理器31、存储器32、内存33和通信接口34经由总线35连接在一起。至少一个处理器31执行在存储器32中存储或编码的至少一个计算机可读指令。
应该理解,在存储器32中存储的计算机可执行指令当执行时使得至少一个处理器31进行本说明书的各个实施例中以上结合图1到图6描述的各种操作和功能。
在本说明书的实施例中,电子设备30可以包括但不限于:个人计算机、服务器计算机、工作站、桌面型计算机、膝上型计算机、笔记本计算机、移动电子设备、智能电话、平板计算机、蜂窝电话、个人数字助理(PDA)、手持装置、消息收发设备、可佩戴电子设备、消费电子设备等等。
根据一个实施例,提供了一种比如机器可读介质的程序产品。机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本说明书的各个实施例中以上结合图1到图6描述的各种操作和功能。具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
在这种情况下,从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此机器可读代码和存储机器可读代码的可读存储介质构成了本说明书的一部分。
可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上或云上下载程序代码。
本领域技术人员应当理解,上面公开的各个实施例可以在不偏离发明实质的情况下做出各种变形和修改。因此,本说明书的保护范围应当由所附的权利要求书来限定。
需要说明的是,上述各流程和各系统结构图中不是所有的步骤和单元都是必须的,可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的,可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构,也可以是逻辑结构,即,有些单元可能由同一物理客户实现,或者,有些单元可能分由多个物理客户实现,或者,可以由多个独立设备中的某些部件共同实现。
以上各实施例中,硬件单元或模块可以通过机械方式或电气方式实现。例如,一个硬件单元、模块或处理器可以包括永久性专用的电路或逻辑(如专门的处理器,FPGA或ASIC)来完成相应操作。硬件单元或处理器还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。
上面结合附图阐述的具体实施方式描述了示例性实施例,但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。
本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说,对本公开内容进行的各种修改是显而易见的,并且,也可以在不脱离本公开内容的保护范围的情况下,将本文所对应的一般性原理应用于其它变型。因此,本公开内容并不限于本文所描述的示例和设计,而是与符合本文公开的原理和新颖性特征的最广范围相一致。
Claims (10)
1.一种文档病历图片的排序方法,其特征在于,所述方法包括:
获取若干文档病历图片,并分别提取文档头信息、文档尾信息以及文档正文信息;
基于所述文档头信息和文档尾信息,确定所述若干文档病历图片中的首页图片,并基于所述文档正文信息,分别提取所述若干文档病历图片的头文本和尾文本;
将所述若干文档病历图片组合为图片对,并基于所述头文本和尾文本确定所述图片对中两张文档病历图片的相邻置信度;
基于所述首页图片和相邻置信度,确定所述若干文档病历图片的最大概率路径,以对所述若干文档病历图片进行排序;
其中,所述图片对包括第一图片和第二图片;
将所述若干文档病历图片组合为图片对,并基于所述头文本和尾文本确定所述图片对中两张文档病历图片的相邻置信度,具体包括:
拼接所述第一图片的第一长度头文本和第二图片的第一长度尾文本并输入分类网络,确定所述第二图片为所述第一图片的在前图片的第一置信度;
拼接所述第一图片的第一长度尾文本和第二图片的第一长度头文本并输入所述分类网络,确定所述第一图片为所述第二图片的在先图片的第二置信度;
所述方法还包括:
拼接所述第一图片的第二长度头文本和第二图片的第二长度尾文本,获得第一拼接语句,其中,所述第一长度和第二长度的长度不等;
拼接所述第一图片的第二长度尾文本和第二图片的第二长度头文本,获得第二拼接语句;
基于所述第一拼接语句和第二拼接语句的困惑度,修正所述图片对中两张文档病历图片的相邻置信度;
基于所述首页图片和相邻置信度,确定所述若干文档病历图片的最大概率路径,具体包括:
以所述若干文档病历图片是否为所述首页图片,确定所述若干文档病历图片在初始时刻的初始概率值;
基于所述初始概率值和相邻置信度,确定从所述初始时刻分别到达下一时刻所述若干文档病历图片的若干最大概率值;
在每下一时刻,基于若干参考最大概率值和所述相邻置信度,递推确定从上一时刻分别到达下一时刻所述若干文档病历图片的若干最大概率值,其中,所述参考最大概率值为从上一时刻到达下一时刻所述文档病历图片的最大概率值;
选取从所述初始时刻到达终止时刻时,所述最大概率值的最大累加值对应的图片排序路径为所述最大概率路径。
2.根据权利要求1所述的文档病历图片的排序方法,其特征在于,基于所述文档头信息和文档尾信息,确定所述若干文档病历图片中的首页图片,具体包括:
将所述文档头信息或文档尾信息中包括目标页码的文档病历图片确定为所述首页图片;和/或,
将所述文档头信息中包括目标文本的文档病历图片确定为所述首页图片,其中,所述目标文本包括医院名称、病历文书类型、病历基本信息中的一种或组合。
3.根据权利要求1所述的文档病历图片的排序方法,其特征在于,基于所述文档正文信息,分别提取所述若干文档病历图片的头文本和尾文本,具体包括:
分别获取所述若干文档病历图片的头M行文本和尾N行文本;
基于标点对所述若干文档病历图片的头M行文本进行分割以提取对应的头文本,以及基于标点对所述若干文档病历图片的尾N行文本进行分割以提取对应的尾文本。
4.根据权利要求1所述的文档病历图片的排序方法,其特征在于,所述方法还包括:
在所述第一图片和第二图片为相同图片时,将所述第一图片和第二图片的相邻置信度确定为0;和/或,
在所述第一图片为首页图片时,将所述第二图片为所述第一图片的在前图片的第一置信度确定为0。
5.根据权利要求1所述的文档病历图片的排序方法,其特征在于,基于所述第一拼接语句和第二拼接语句的困惑度,修正所述图片对中两张文档病历图片的相邻置信度,具体包括:
比较所述第一拼接语句和第二拼接语句的困惑度;
在所述第一拼接语句的困惑度大于第二拼接语句的困惑度时,判断所述第一置信度是否小于第二置信度;若是,
在所述第一长度小于第二长度时,以第一修正力度增加所述第二置信度,并在所述第一长度大于第二长度时,以第二修正力度增加所述第二置信度,其中,所述第一修正力度大于第二修正力度。
6.根据权利要求5所述的文档病历图片的排序方法,其特征在于,在所述第一置信度大于第二置信度时,所述方法还包括:
在所述第一长度小于第二长度时,以第三修正力度减小所述第一置信度,并在所述第一长度大于第二长度时,以第四修正力度减小所述第一置信度,其中,所述第三修正力度大于第四修正力度,且修正后的所述第一置信度大于第二置信度。
7.根据权利要求1所述的文档病历图片的排序方法,其特征在于,所述方法还包括:
在终止时刻时,沿所述最大概率路径依次回溯上一时刻对应的文档病历图片,直至到达初始时刻;
基于回溯所得的图片排序,对所述若干文档病历图片进行排序。
8.一种文档病历图片的排序装置,其特征在于,包括:
获取模块,用于获取若干文档病历图片,并分别提取文档头信息、文档尾信息以及文档正文信息;
第一确定模块,用于基于所述文档头信息和文档尾信息,确定所述若干文档病历图片中的首页图片,并基于所述文档正文信息,分别提取所述若干文档病历图片的头文本和尾文本;
第二确定模块,用于组合所述若干文档病历图片以构建图片对,并基于所述头文本和尾文本确定所述图片对中两张文档病历图片的相邻置信度;
排序模块,用于基于所述首页图片和相邻置信度,确定所述若干文档病历图片的最大概率路径,以对所述若干文档病历图片进行排序;
其中,所述图片对包括第一图片和第二图片;第二确定模块具体用于拼接所述第一图片的第一长度头文本和第二图片的第一长度尾文本并输入分类网络,确定所述第二图片为所述第一图片的在前图片的第一置信度;拼接所述第一图片的第一长度尾文本和第二图片的第一长度头文本并输入所述分类网络,确定所述第一图片为所述第二图片的在先图片的第二置信度;
第二确定模块还用于拼接所述第一图片的第二长度头文本和第二图片的第二长度尾文本,获得第一拼接语句,其中,所述第一长度和第二长度的长度不等;拼接所述第一图片的第二长度尾文本和第二图片的第二长度头文本,获得第二拼接语句;基于所述第一拼接语句和第二拼接语句的困惑度,修正所述图片对中两张文档病历图片的相邻置信度;
排序模块具体用于以所述若干文档病历图片是否为所述首页图片,确定所述若干文档病历图片在初始时刻的初始概率值;基于所述初始概率值和相邻置信度,确定从所述初始时刻分别到达下一时刻所述若干文档病历图片的若干最大概率值;在每下一时刻,基于若干参考最大概率值和所述相邻置信度,递推确定从上一时刻分别到达下一时刻所述若干文档病历图片的若干最大概率值,其中,所述参考最大概率值为从上一时刻到达下一时刻所述文档病历图片的最大概率值;选取从所述初始时刻到达终止时刻时,所述最大概率值的最大累加值对应的图片排序路径为所述最大概率路径。
9. 一种电子设备,包括:
至少一个处理器;以及
存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如权利要求1至7任一项所述的文档病历图片的排序方法。
10.一种机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如权利要求1至7任一项所述的文档病历图片的排序方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311559275.4A CN117275649B (zh) | 2023-11-22 | 2023-11-22 | 文档病历图片的排序方法和装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311559275.4A CN117275649B (zh) | 2023-11-22 | 2023-11-22 | 文档病历图片的排序方法和装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117275649A CN117275649A (zh) | 2023-12-22 |
CN117275649B true CN117275649B (zh) | 2024-01-30 |
Family
ID=89210946
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311559275.4A Active CN117275649B (zh) | 2023-11-22 | 2023-11-22 | 文档病历图片的排序方法和装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117275649B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657221A (zh) * | 2018-12-13 | 2019-04-19 | 北京金山数字娱乐科技有限公司 | 一种文档段落排序方法、排序装置、电子设备及存储介质 |
CN111326148A (zh) * | 2020-01-19 | 2020-06-23 | 北京世纪好未来教育科技有限公司 | 置信度校正及其模型训练方法、装置、设备及存储介质 |
CN111460272A (zh) * | 2019-01-22 | 2020-07-28 | 北京国双科技有限公司 | 一种文本页面的排序方法及相关设备 |
CN112001312A (zh) * | 2020-08-21 | 2020-11-27 | 深圳传音控股股份有限公司 | 文档拼接方法、设备及存储介质 |
CN112632948A (zh) * | 2020-12-29 | 2021-04-09 | 天津汇智星源信息技术有限公司 | 案件文书排序方法及相关设备 |
CN113515620A (zh) * | 2021-07-20 | 2021-10-19 | 云知声智能科技股份有限公司 | 电力设备技术标准文档排序方法、装置、电子设备和介质 |
CN114116605A (zh) * | 2021-12-02 | 2022-03-01 | 上海卓繁信息技术股份有限公司 | 一种基于语义特征对图像文档排序的方法、装置及电子设备 |
CN114510920A (zh) * | 2022-01-28 | 2022-05-17 | 北京百度网讯科技有限公司 | 一种模型训练、文本排序方法和装置 |
CN114863459A (zh) * | 2022-05-05 | 2022-08-05 | 上海卓繁信息技术股份有限公司 | 一种乱序文档排序的方法、装置及电子设备 |
CN115880704A (zh) * | 2023-02-16 | 2023-03-31 | 中国人民解放军总医院第一医学中心 | 一种病例的自动编目方法、系统、设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110019224A1 (en) * | 2009-07-27 | 2011-01-27 | Xerox Corporation | Method and system for re-ordering at least one image of a scanned multi-page document |
US9760803B2 (en) * | 2013-05-15 | 2017-09-12 | Google Inc. | Associating classifications with images |
-
2023
- 2023-11-22 CN CN202311559275.4A patent/CN117275649B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657221A (zh) * | 2018-12-13 | 2019-04-19 | 北京金山数字娱乐科技有限公司 | 一种文档段落排序方法、排序装置、电子设备及存储介质 |
CN111460272A (zh) * | 2019-01-22 | 2020-07-28 | 北京国双科技有限公司 | 一种文本页面的排序方法及相关设备 |
CN111326148A (zh) * | 2020-01-19 | 2020-06-23 | 北京世纪好未来教育科技有限公司 | 置信度校正及其模型训练方法、装置、设备及存储介质 |
CN112001312A (zh) * | 2020-08-21 | 2020-11-27 | 深圳传音控股股份有限公司 | 文档拼接方法、设备及存储介质 |
CN112632948A (zh) * | 2020-12-29 | 2021-04-09 | 天津汇智星源信息技术有限公司 | 案件文书排序方法及相关设备 |
CN113515620A (zh) * | 2021-07-20 | 2021-10-19 | 云知声智能科技股份有限公司 | 电力设备技术标准文档排序方法、装置、电子设备和介质 |
CN114116605A (zh) * | 2021-12-02 | 2022-03-01 | 上海卓繁信息技术股份有限公司 | 一种基于语义特征对图像文档排序的方法、装置及电子设备 |
CN114510920A (zh) * | 2022-01-28 | 2022-05-17 | 北京百度网讯科技有限公司 | 一种模型训练、文本排序方法和装置 |
CN114863459A (zh) * | 2022-05-05 | 2022-08-05 | 上海卓繁信息技术股份有限公司 | 一种乱序文档排序的方法、装置及电子设备 |
CN115880704A (zh) * | 2023-02-16 | 2023-03-31 | 中国人民解放军总医院第一医学中心 | 一种病例的自动编目方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117275649A (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10470510B1 (en) | Systems and methods for full body measurements extraction using multiple deep learning networks for body feature measurements | |
US10962404B2 (en) | Systems and methods for weight measurement from user photos using deep learning networks | |
CN112949786B (zh) | 数据分类识别方法、装置、设备及可读存储介质 | |
US20190392587A1 (en) | System for predicting articulated object feature location | |
JP4542591B2 (ja) | 画像処理システム、画像保管装置、および、画像処理装置、並びに、画像処理方法、プログラム | |
CN111476806B (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
CN109492547B (zh) | 一种结节识别方法、装置和存储介质 | |
CN111582409A (zh) | 图像标签分类网络的训练方法、图像标签分类方法及设备 | |
CN111461174A (zh) | 多层次注意力机制的多模态标签推荐模型构建方法及装置 | |
CN111242083A (zh) | 基于人工智能的文本处理方法、装置、设备、介质 | |
CN113011387B (zh) | 网络训练及人脸活体检测方法、装置、设备及存储介质 | |
CN111507285A (zh) | 人脸属性识别方法、装置、计算机设备和存储介质 | |
CN111091010A (zh) | 相似度确定、网络训练、查找方法及装置和存储介质 | |
US20200372639A1 (en) | Method and system for identifying skin texture and skin lesion using artificial intelligence cloud-based platform | |
CN116129141A (zh) | 医学数据处理方法、装置、设备、介质和计算机程序产品 | |
Santarossa et al. | MedRegNet: Unsupervised multimodal retinal-image registration with GANs and ranking loss | |
CN114329004A (zh) | 数字指纹生成、数据推送方法、装置和存储介质 | |
CN113822283A (zh) | 文本内容处理方法、装置、计算机设备及存储介质 | |
CN117351504A (zh) | 一种电子病历表格抽取的方法、装置、设备及介质 | |
CN117275649B (zh) | 文档病历图片的排序方法和装置、电子设备和存储介质 | |
CN116805522A (zh) | 诊断报告输出方法、装置、终端及存储介质 | |
WO2007077694A1 (ja) | 鼻紋情報生成装置及び鼻紋情報照合装置及び鼻紋情報生成プログラム及び鼻紋情報生成方法 | |
CN116029968A (zh) | 猴痘感染皮肤图像检测方法和装置、电子设备及存储介质 | |
US20230087494A1 (en) | Determining image similarity by analysing registrations | |
Rani et al. | Skin disease diagnosis using vgg19 algorithm and treatment recommendation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |