CN116628125A - 一种临床影像诊断报告关键词提取方法与辅助装置 - Google Patents

一种临床影像诊断报告关键词提取方法与辅助装置 Download PDF

Info

Publication number
CN116628125A
CN116628125A CN202310396591.8A CN202310396591A CN116628125A CN 116628125 A CN116628125 A CN 116628125A CN 202310396591 A CN202310396591 A CN 202310396591A CN 116628125 A CN116628125 A CN 116628125A
Authority
CN
China
Prior art keywords
keywords
text
report
diagnosis report
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310396591.8A
Other languages
English (en)
Other versions
CN116628125B (zh
Inventor
刘耀辉
刘�东
雷冠雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiangnan University
Original Assignee
Xiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiangnan University filed Critical Xiangnan University
Priority to CN202310396591.8A priority Critical patent/CN116628125B/zh
Publication of CN116628125A publication Critical patent/CN116628125A/zh
Application granted granted Critical
Publication of CN116628125B publication Critical patent/CN116628125B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00007Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to particular apparatus or devices
    • H04N1/00018Scanning arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00026Methods therefor
    • H04N1/00037Detecting, i.e. determining the occurrence of a predetermined state
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00071Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for characterised by the action taken
    • H04N1/00074Indicating or reporting
    • H04N1/00076Indicating or reporting locally
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00244Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00519Constructional details not otherwise provided for, e.g. housings, covers
    • H04N1/00559Mounting or support of components or elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/024Details of scanning heads ; Means for illuminating the original
    • H04N1/02418Details of scanning heads ; Means for illuminating the original for picture information pick up and reproduction
    • H04N1/02472Details of scanning heads ; Means for illuminating the original for picture information pick up and reproduction using a single head, i.e. for pick up and reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Character Discrimination (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及影像识别领域,且公开了一种临床影像诊断报告关键词提取方法与辅助装置,所述关键词提取方法包括以下步骤:Step1:建立数据库,存储设定参数与录入文本;Step2:设定可触发提取的关键词,包括科室关键词、项目关键词与病情诊断关键词,对独立关键词进行单组归类标签的制定,在触发提取指令后,进行记录并将关键词涉及的文本在归类标签下进行交叉归类,递交至存储端;通过预先编辑关键词的提取机制,扫描录入诊断报告,并对所获取的关键词进行归类标签的下发,复合归类标签的形式可使用户精准查验所需要的诊断报告,节约索引时间,在提取过程中,能够准确划分需要识别的区域,为不同诊断报告类型,对接专属的文字提取区域。

Description

一种临床影像诊断报告关键词提取方法与辅助装置
技术领域
本发明涉及影像识别技术领域,具体为一种临床影像诊断报告关键词提取方法与辅助装置。
背景技术
医学影像设备是医院医疗设备中不可或缺的组成部分,也是医院综合实力的重要体现,不仅为临床诊断、治疗提供重要保障,同时为临床科学研究提供重要平台,影像设备作为一个综合平台,对医院的发展起着重要推动作用,临床影像诊断报告作为诊断最直观的体现,每年医院都会产出大量的诊断报告,这些报告具有一定的研究与参考价值;
但是,现有技术对诊断报告中有用信息的提取还存在一定的不足,例如:
1、缺乏对关键词进行有效提取的措施,难以通过关键词的提取,对诊断报告进行分类,难以通过不同关键词的组合,准确匹配到用户所需要的诊断报告,无法快速规避诊断报告中的无用信息,缺乏对识别区域的划分功能,难以缩短提取时间;
2、缺乏对诊断报告中的缺陷处进行报警提示的措施,难以为后续报告的书写提供指导意见,容易使得提取内容出现错漏,进而影响提取质量,导致对诊断报告的分类出现误差;
3、难以保证关键词提取的准确性,缺乏核验的措施,缺乏不断学习的能力,难以通过大量的数据进行训练。
发明内容
(一)解决的技术问题
针对现有技术所存在的上述缺点,本发明提供了一种临床影像诊断报告关键词提取方法与辅助装置,能够有效地解决现有技术的提取方法缺乏对关键词进行有效提取的措施,难以通过关键词的提取,对诊断报告进行分类,难以通过不同关键词的组合,准确匹配到用户所需要的诊断报告,无法快速规避诊断报告中的无用信息,缺乏对识别区域的划分功能,难以缩短提取时间,缺乏对诊断报告中的缺陷处进行报警提示的措施,难以为后续报告的书写提供指导意见,容易使得提取内容出现错漏,进而影响提取质量,导致对诊断报告的分类出现误差,难以保证关键词提取的准确性,缺乏核验的措施,缺乏不断学习的能力,难以通过大量的数据进行训练的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现,
本发明公开了一种临床影像诊断报告关键词提取方法,包括以下步骤:
Step1:建立数据库,存储设定参数与录入文本;
Step2:设定可触发提取的关键词,包括科室关键词、项目关键词与病情诊断关键词,对独立关键词进行单组归类标签的制定,在触发提取指令后,进行记录并将关键词涉及的文本在归类标签下进行交叉归类,递交至存储端;
Step3:获取关键词数据,构建提取模型,对所获取关键词组进行分析,将科室关键词作为主归类标签,在主归类标签下,为项目关键词与病情诊断关键词制定两组及两组以上的复合归类标签,并实时刷新更替信息;
Step4:进行区域划分,录入所有诊断报告类型,对关键区域进行分别标记,过滤无用区域,在识别当前诊断报告类型后,对接每种类型专属的文字提取区域;
Step5:对诊断报告进行关键区域划分,录入所有诊断报告类型,对关键区域进行分别标记,过滤无用区域;
Step6:获取待提取的诊断报告递交至扫描端,进行文本的录入,对关键区域内文本数据的缺陷进行报警提示;
Step7:获取录入文本,在识别当前诊断报告类型后,对接每种类型专属的文字提取区域,对区域内文本数据进行预处理;
Step8:运行提取模型,按所设定提取机制提取关键词,在匹配过程中按顺序进行逐步的运算算法,并为诊断报告下发归类标签。
更进一步地,所述Step3中的复合归类标签在制定完毕后,进行程序自动查验,而后递交至人工复查,对存在逻辑错误的复合归类标签进行剔除。
更进一步地,所述Step3中的提取模型在运行时,对文本数据进行特征提取,转换为可用于机器学习的数字特征,完成文本数据的特征值化。
更进一步地,所述Step5中无用区域的属性包括:文中的空白行、空格和图像,在接收到过滤指令后,进行屏蔽,停止内容的读取。
更进一步地,所述Step6中的报警提示的运行逻辑包括以下步骤:
Step601:识别当前诊断报告类型,接收对应关键区域属性,开始扫描;
SStep602:识别关键区域内文本是否存在文本遗漏、错别字以及重复冗余文字;
Step603:否,按照预定设置持续运行,接收录入文本;
Step604:是,扫描端进行报警提醒,暂停扫描;
Step605:确认继续扫描;
Step606:是,扫描端复位,清除已扫描内容;
Step607:否,从暂停处继续扫描剩余文本,扫描可识别问题区域,跳过无法识别区域;
Step608:标记问题区域,生成问题报告。
更进一步地,所述Step608中的问题报告的属性包括:生成时间、问题字节、涉及区域和诊断报告类型。
更进一步地,所述Step7中的预处理过程包括:对文本进行分词、去除停用词处理和去除与文章语义无关的部分词汇,词汇包括:标点符号、形容词、副词、助词及人称代词。
更进一步地,所述Step8中按所设定提取机制提取关键词的过程中,若遇到文本中无法识别的待定义字段,程序会跳过此段文本,进行下一段文本处理。
一种临床影像诊断报告关键词提取的辅助装置,包括:
扫描器主体,用于文本分析,进行操控指令的发送与编辑,作为核心控制端;
承物板,用于承载待扫描诊断报告,限制扫描区域;
扫描头,用于对诊断报告进行扫描,识别文本字段;
警报灯,用于在接收到报警指令后,进行闪烁提醒;
复位按钮,用于将指令运行进程进行复位,完成初始化;
配网模块,用于提供无线网络配置,支持外部设备的接入;
语音播报器,用于在接收到报警指令后,进行语音播报提醒;
存储接口,用于将内部存储介质与外部存储介质进行对接;
控制按钮,用于操控装置的启停。
更进一步地,所述扫描器主体的右侧安装有承物板,所述扫描器主体右侧的中间处安装有配网模块,所述扫描器主体右侧的底端安装有存储接口,所述扫描器主体右侧的顶端安装有复位按钮,所述扫描器主体的前后两侧皆安装有语音播报器,所述扫描器主体的顶端安装有警报灯,所述扫描器主体右侧的底端安装有扫描头,所述扫描器主体左侧的底端安装有控制按钮。
(三)有益效果
采用本发明提供的技术方案,与已知的现有技术相比,具有如下有益效果,
1、本发明通过增加对诊断报告中的关键词进行快速提取的措施,通过预先编辑关键词的提取机制,扫描录入诊断报告,并对所获取的关键词进行归类标签的下发,复合归类标签的形式可使用户精准查验所需要的诊断报告,节约索引时间,在提取过程中,能够准确划分需要识别的区域,为不同诊断报告类型,对接专属的文字提取区域,对无用数据进行及时过滤,进一步节约提取时间。
2、本发明通过增加对诊断报告中的缺陷处进行报警提示的措施,对文本中的遗漏、错别字以及重复冗余文字现象进行提示,从而为后续报告的书写提供有效的指导意见,容易使得提取内容出现错漏,保证良好的提取质量,避免对诊断报告的分类出现误差,进行语音与灯光提醒,帮助用户及时察觉问题数据。
3、本发明通过对关键词的提取进行核验的措施,对复合归类标签进行程序和人工相结合的查验,避免存在逻辑错误的标签内容过多占用系统资源处理能力,提取模型在此过程中进行不断学习,通过大量的数据进行训练,不断提升数据处理能力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明中的临床影像诊断报告关键词提取方法的流程示意图;
图2为本发明中的报警提示的运行逻辑流程示意图;
图3为本发明中的临床影像诊断报告关键词提取辅助装置的正视立体结构示意图;
图4为本发明中的临床影像诊断报告关键词提取辅助装置的背视立体结构示意图;
图中的标号分别代表,1、扫描器主体;2、承物板;3、扫描头;4、警报灯;5、复位按钮;6、配网模块;7、语音播报器;8、存储接口;9、控制按钮。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合实施例对本发明作进一步的描述。
实施例1
本实施例的一种临床影像诊断报告关键词提取方法与辅助装置,如图1和图3所示,包括以下步骤:
Step1:建立数据库,存储设定参数与录入文本;
Step2:设定可触发提取的关键词,包括科室关键词、项目关键词与病情诊断关键词,对独立关键词进行单组归类标签的制定,在触发提取指令后,进行记录并将关键词涉及的文本在归类标签下进行交叉归类,递交至存储端;
Step3:获取关键词数据,构建提取模型,对所获取关键词组进行分析,将科室关键词作为主归类标签,在主归类标签下,为项目关键词与病情诊断关键词制定两组及两组以上的复合归类标签,并实时刷新更替信息;
Step4:进行区域划分,录入所有诊断报告类型,对关键区域进行分别标记,过滤无用区域,在识别当前诊断报告类型后,对接每种类型专属的文字提取区域;
Step5:对诊断报告进行关键区域划分,录入所有诊断报告类型,对关键区域进行分别标记,过滤无用区域;
Step6:获取待提取的诊断报告递交至扫描端,进行文本的录入,对关键区域内文本数据的缺陷进行报警提示;
Step7:获取录入文本,在识别当前诊断报告类型后,对接每种类型专属的文字提取区域,对区域内文本数据进行预处理;
Step8:运行提取模型,按所设定提取机制提取关键词,在匹配过程中按顺序进行逐步的运算算法,并为诊断报告下发归类标签。
Step3中的复合归类标签在制定完毕后,进行程序自动查验,而后递交至人工复查,对存在逻辑错误的复合归类标签进行剔除。
Step3中的提取模型在运行时,对文本数据进行特征提取,转换为可用于机器学习的数字特征,完成文本数据的特征值化。
Step5中无用区域的属性包括:文中的空白行、空格和图像,在接收到过滤指令后,进行屏蔽,停止内容的读取。
本实施例在具体实施时,通过预先编辑关键词的提取机制,扫描录入诊断报告,并对所获取的关键词进行归类标签的下发,复合归类标签的形式可使用户精准查验所需要的诊断报告,节约索引时间,在提取模型运行的过程中,能够准确划分需要识别的区域,为不同诊断报告类型,对接每种类型专属的文字提取区域,对无用数据进行及时过滤;
对复合归类标签进行程序和人工相结合的查验,避免存在逻辑错误的标签内容过多占用系统资源处理能力,提取模型在此过程中进行不断学习,通过海量数据进行训练。
实施例2
本实施例还提供一种临床影像诊断报告关键词提取的辅助装置,如图3和图4所示,包括:
扫描器主体1,用于文本分析,进行操控指令的发送与编辑,作为核心控制端;
承物板2,用于承载待扫描诊断报告,限制扫描区域;
扫描头3,用于对诊断报告进行扫描,识别文本字段;
警报灯4,用于在接收到报警指令后,进行闪烁提醒;
复位按钮5,用于将指令运行进程进行复位,完成初始化;
配网模块6,用于提供无线网络配置,支持外部设备的接入;
语音播报器7,用于在接收到报警指令后,进行语音播报提醒;
存储接口8,用于将内部存储介质与外部存储介质进行对接;
控制按钮9,用于操控装置的启停。
如图3和图4所示,扫描器主体1的右侧安装有承物板2,扫描器主体1右侧的中间处安装有配网模块6,扫描器主体1右侧的底端安装有存储接口8,扫描器主体1右侧的顶端安装有复位按钮5,扫描器主体1的前后两侧皆安装有语音播报器7,扫描器主体1的顶端安装有警报灯4,扫描器主体1右侧的底端安装有扫描头3,扫描器主体1左侧的底端安装有控制按钮9。
本实施例在具体实施时,对文本中的遗漏、错别字以及重复冗余文字现象进行提示,从而为后续报告的书写提供有效的指导意见,容易使得提取内容出现错漏,保证良好的提取质量,避免对诊断报告的分类出现误差,进行语音与灯光提醒,帮助用户及时察觉问题数据。
实施例3
本实施例中,如图2所示,提供一种报警提示的运行逻辑,包括以下步骤:
Step601:识别当前诊断报告类型,接收对应关键区域属性,开始扫描;
SStep602:识别关键区域内文本是否存在文本遗漏、错别字以及重复冗余文字;
Step603:否,按照预定设置持续运行,接收录入文本;
Step604:是,扫描端进行报警提醒,暂停扫描;
Step605:确认继续扫描;
Step606:是,扫描端复位,清除已扫描内容;
Step607:否,从暂停处继续扫描剩余文本,扫描可识别问题区域,跳过无法识别区域;
Step608:标记问题区域,生成问题报告。
Step608中的问题报告的属性包括:生成时间、问题字节、涉及区域和诊断报告类型。
本实施例在具体实施时,用户将待扫描的诊断报告放置在承物板2上,由配网模块6提供无线网络的支持,并对接外部设备,在识别到问题数据后,通过警报灯4进行灯光提醒,并且语音播报器7进行语音播报警告,通过存储接口8外接存储设置,进行数据的写入与读取,通过复位按钮5对装置的运行指令进行复位,将装置初始化,由控制按钮9控制装置的启停。
综上,本发明通过预先编辑关键词的提取机制,扫描录入诊断报告,并对所获取的关键词进行归类标签的下发,复合归类标签的形式可使用户精准查验所需要的诊断报告,节约索引时间,在提取模型运行的过程中,能够准确划分需要识别的区域,为不同诊断报告类型,对接每种类型专属的文字提取区域,对无用数据进行及时过滤;
对复合归类标签进行程序和人工相结合的查验,避免存在逻辑错误的标签内容过多占用系统资源处理能力,提取模型在此过程中进行不断学习,通过海量数据进行训练;
用户将待扫描的诊断报告放置在承物板2上,由配网模块6提供无线网络的支持,并对接外部设备,在识别到问题数据后,通过警报灯4进行灯光提醒,并且语音播报器7进行语音播报警告,通过存储接口8外接存储设置,进行数据的写入与读取,通过复位按钮5对装置的运行指令进行复位,将装置初始化,由控制按钮9控制装置的启停;
从而对文本中的遗漏、错别字以及重复冗余文字现象进行提示,从而为后续报告的书写提供有效的指导意见,容易使得提取内容出现错漏,保证良好的提取质量,避免对诊断报告的分类出现误差,进行语音与灯光提醒,帮助用户及时察觉问题数据。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种临床影像诊断报告关键词提取方法,其特征在于,包括以下步骤:
Step1:建立数据库,存储设定参数与录入文本;
Step2:设定可触发提取的关键词,包括科室关键词、项目关键词与病情诊断关键词,对独立关键词进行单组归类标签的制定,在触发提取指令后,进行记录并将关键词涉及的文本在归类标签下进行交叉归类,递交至存储端;
Step3:获取关键词数据,构建提取模型,对所获取关键词组进行分析,将科室关键词作为主归类标签,在主归类标签下,为项目关键词与病情诊断关键词制定两组及两组以上的复合归类标签,并实时刷新更替信息;
Step4:进行区域划分,录入所有诊断报告类型,对关键区域进行分别标记,过滤无用区域,在识别当前诊断报告类型后,对接每种类型专属的文字提取区域;
Step5:对诊断报告进行关键区域划分,录入所有诊断报告类型,对关键区域进行分别标记,过滤无用区域;
Step6:获取待提取的诊断报告递交至扫描端,进行文本的录入,对关键区域内文本数据的缺陷进行报警提示;
Step7:获取录入文本,在识别当前诊断报告类型后,对接每种类型专属的文字提取区域,对区域内文本数据进行预处理;
Step8:运行提取模型,按所设定提取机制提取关键词,在匹配过程中按顺序进行逐步的运算算法,并为诊断报告下发归类标签。
2.根据权利要求1所述的一种临床影像诊断报告关键词提取方法,其特征在于,所述Step3中的复合归类标签在制定完毕后,进行程序自动查验,而后递交至人工复查,对存在逻辑错误的复合归类标签进行剔除。
3.根据权利要求1所述的一种临床影像诊断报告关键词提取方法,其特征在于,所述Step3中的提取模型在运行时,对文本数据进行特征提取,转换为可用于机器学习的数字特征,完成文本数据的特征值化。
4.根据权利要求1所述的一种临床影像诊断报告关键词提取方法,其特征在于,所述Step5中无用区域的属性包括:文中的空白行、空格和图像,在接收到过滤指令后,进行屏蔽,停止内容的读取。
5.根据权利要求1所述的一种临床影像诊断报告关键词提取方法,其特征在于,所述Step6中的报警提示的运行逻辑包括以下步骤:
Step601:识别当前诊断报告类型,接收对应关键区域属性,开始扫描;
SStep602:识别关键区域内文本是否存在文本遗漏、错别字以及重复冗余文字;
Step603:否,按照预定设置持续运行,接收录入文本;
Step604:是,扫描端进行报警提醒,暂停扫描;
Step605:确认继续扫描;
Step606:是,扫描端复位,清除已扫描内容;
Step607:否,从暂停处继续扫描剩余文本,扫描可识别问题区域,跳过无法识别区域;
Step608:标记问题区域,生成问题报告。
6.根据权利要求5所述的一种临床影像诊断报告关键词提取方法,其特征在于,所述Step608中的问题报告的属性包括:生成时间、问题字节、涉及区域和诊断报告类型。
7.根据权利要求1所述的一种临床影像诊断报告关键词提取方法,其特征在于,所述Step7中的预处理过程包括:对文本进行分词、去除停用词处理和去除与文章语义无关的部分词汇,词汇包括:标点符号、形容词、副词、助词及人称代词。
8.根据权利要求1所述的一种临床影像诊断报告关键词提取方法,其特征在于,所述Step8中按所设定提取机制提取关键词的过程中,若遇到文本中无法识别的待定义字段,程序会跳过此段文本,进行下一段文本处理。
9.一种临床影像诊断报告关键词提取的辅助装置,所述辅助装置是对如权利要求1-8中任意一项所述的一种临床影像诊断报告关键词提取方法的实施装置,其特征在于,包括:
扫描器主体(1),用于文本分析,进行操控指令的发送与编辑,作为核心控制端;
承物板(2),用于承载待扫描诊断报告,限制扫描区域;
扫描头(3),用于对诊断报告进行扫描,识别文本字段;
警报灯(4),用于在接收到报警指令后,进行闪烁提醒;
复位按钮(5),用于将指令运行进程进行复位,完成初始化;
配网模块(6),用于提供无线网络配置,支持外部设备的接入;
语音播报器(7),用于在接收到报警指令后,进行语音播报提醒;
存储接口(8),用于将内部存储介质与外部存储介质进行对接;
控制按钮(9),用于操控装置的启停。
10.根据权利要求9所述的一种临床影像诊断报告关键词提取辅助装置,其特征在于,所述扫描器主体(1)的右侧安装有承物板(2),所述扫描器主体(1)右侧的中间处安装有配网模块(6),所述扫描器主体(1)右侧的底端安装有存储接口(8),所述扫描器主体(1)右侧的顶端安装有复位按钮(5),所述扫描器主体(1)的前后两侧皆安装有语音播报器(7),所述扫描器主体(1)的顶端安装有警报灯(4),所述扫描器主体(1)右侧的底端安装有扫描头(3),所述扫描器主体(1)左侧的底端安装有控制按钮(9)。
CN202310396591.8A 2023-04-14 2023-04-14 一种临床影像诊断报告关键词提取方法与辅助装置 Active CN116628125B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310396591.8A CN116628125B (zh) 2023-04-14 2023-04-14 一种临床影像诊断报告关键词提取方法与辅助装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310396591.8A CN116628125B (zh) 2023-04-14 2023-04-14 一种临床影像诊断报告关键词提取方法与辅助装置

Publications (2)

Publication Number Publication Date
CN116628125A true CN116628125A (zh) 2023-08-22
CN116628125B CN116628125B (zh) 2024-01-30

Family

ID=87601567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310396591.8A Active CN116628125B (zh) 2023-04-14 2023-04-14 一种临床影像诊断报告关键词提取方法与辅助装置

Country Status (1)

Country Link
CN (1) CN116628125B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0816620A (ja) * 1994-04-28 1996-01-19 Fujitsu Ltd データ分類装置/方法、データ分類木生成装置/方法、派生語抽出装置/方法、シソーラス構築装置/方法、データ処理システム
CN105286795A (zh) * 2015-10-20 2016-02-03 赵立荣 产科影像临床诊断装置
KR20180101858A (ko) * 2017-03-06 2018-09-14 연세대학교 산학협력단 단일 클래스 기반의 데이터 수집 장치 및 방법
CN109543049A (zh) * 2018-11-23 2019-03-29 广东小天才科技有限公司 一种针对写作特点自动推送素材的方法及系统
CN111489800A (zh) * 2020-04-10 2020-08-04 武汉万屏电子科技有限公司 一种病历和报告单图像识别与存储的分析方法及系统
CN112185520A (zh) * 2020-09-27 2021-01-05 志诺维思(北京)基因科技有限公司 一种医疗病理报告图片的文本结构化处理系统和方法
CN112329448A (zh) * 2020-11-13 2021-02-05 浙江卡易智慧医疗科技有限公司 一种书写报告智能纠错和注意信息智能提示方法
CN114707052A (zh) * 2022-04-06 2022-07-05 武汉文构数据科技有限公司 一种基于网页的信息提取方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0816620A (ja) * 1994-04-28 1996-01-19 Fujitsu Ltd データ分類装置/方法、データ分類木生成装置/方法、派生語抽出装置/方法、シソーラス構築装置/方法、データ処理システム
CN105286795A (zh) * 2015-10-20 2016-02-03 赵立荣 产科影像临床诊断装置
KR20180101858A (ko) * 2017-03-06 2018-09-14 연세대학교 산학협력단 단일 클래스 기반의 데이터 수집 장치 및 방법
CN109543049A (zh) * 2018-11-23 2019-03-29 广东小天才科技有限公司 一种针对写作特点自动推送素材的方法及系统
CN111489800A (zh) * 2020-04-10 2020-08-04 武汉万屏电子科技有限公司 一种病历和报告单图像识别与存储的分析方法及系统
CN112185520A (zh) * 2020-09-27 2021-01-05 志诺维思(北京)基因科技有限公司 一种医疗病理报告图片的文本结构化处理系统和方法
CN112329448A (zh) * 2020-11-13 2021-02-05 浙江卡易智慧医疗科技有限公司 一种书写报告智能纠错和注意信息智能提示方法
CN114707052A (zh) * 2022-04-06 2022-07-05 武汉文构数据科技有限公司 一种基于网页的信息提取方法和装置

Also Published As

Publication number Publication date
CN116628125B (zh) 2024-01-30

Similar Documents

Publication Publication Date Title
CN110472524B (zh) 基于深度学习的发票信息管理方法、系统和可读介质
CN110956026B (zh) 法律文书生成方法、生成装置和电子设备
CN111144191A (zh) 字体识别方法、装置、电子设备及存储介质
CN107273883B (zh) 决策树模型训练方法、确定ocr结果中数据属性方法及装置
CN112418813B (zh) 基于智能解析识别的aeo资质智能评级管理系统、方法及存储介质
CN106845467B (zh) 基于光学字符识别技术的航空维修工卡工作内容识别方法
CN110543475A (zh) 一种基于机器学习的财务报表数据自动识别和分析方法
CN110634546A (zh) 电子病历文本规范化检测方法
CN112749277A (zh) 医学数据的处理方法、装置及存储介质
CN116628125B (zh) 一种临床影像诊断报告关键词提取方法与辅助装置
CN116913549A (zh) 不良反应事件预警方法、装置、系统和电子设备
CN113888663B (zh) 重建模型训练方法、异常检测方法、装置、设备及介质
CN115600570A (zh) 一种电网设备预警限值表格重构方法、录入方法及装置
CN114549014A (zh) 基于自动和人工审核结合的供应链金融风控办法及系统
CN114676207A (zh) 一种用于金融长文本复核系统的金融数据勾稽关系审核模块
JP2001101340A (ja) 文字読取装置および文字認識方法
CN113298067A (zh) 体检结果自动审核方法及系统、电子设备及存储介质
KR102118322B1 (ko) 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버 및 번역 방법
CN112966689B (zh) 文本识别方法、装置、电子设备和可读存储介质
CN118397285B (zh) 一种数据标注方法、装置、计算设备及计算机存储介质
CN118277532B (zh) 一种医疗数据处理建议的生成方法、装置和设备
CN117995368B (zh) 基于随访数据的个性化医疗影像诊断质量保障方法及系统
CN118295559B (zh) 一种古籍修复专家系统
CN112288039B (zh) 一种用于ocr模型训练的样本标注方法及系统
CN112541085B (zh) 问卷的结构化方法、问卷的结构化装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant