CN114708981A - 基于医学影像报告的疾病图谱构建方法、解读方法及系统 - Google Patents

基于医学影像报告的疾病图谱构建方法、解读方法及系统 Download PDF

Info

Publication number
CN114708981A
CN114708981A CN202210481687.XA CN202210481687A CN114708981A CN 114708981 A CN114708981 A CN 114708981A CN 202210481687 A CN202210481687 A CN 202210481687A CN 114708981 A CN114708981 A CN 114708981A
Authority
CN
China
Prior art keywords
disease
medical image
description
map
image report
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210481687.XA
Other languages
English (en)
Inventor
荣辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Huiming Software Co ltd
Original Assignee
Shanghai Huiming Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Huiming Software Co ltd filed Critical Shanghai Huiming Software Co ltd
Priority to CN202210481687.XA priority Critical patent/CN114708981A/zh
Publication of CN114708981A publication Critical patent/CN114708981A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/134Hyperlinking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K17/00Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations
    • G06K17/0022Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations arrangements or provisions for transferring data to distant stations, e.g. from a sensing device
    • G06K17/0025Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations arrangements or provisions for transferring data to distant stations, e.g. from a sensing device the arrangement consisting of a wireless interrogation device in combination with a device for optically marking the record carrier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Animal Behavior & Ethology (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明的目的在于揭示一种基于医学影像报告的疾病图谱构建方法、解读方法及系统,包括以下步骤:将若干历史医学影像报告进行预处理,得到若干历史医学影像报告标准文本;对标准文本进行分词,并提取关键特征词;通过基于NEZHA的命名实体识别算法训练模型确定关键特征词中的疾病名称;构建以三元组为基础的疾病图谱;建立疾病名称与所述疾病图谱的索引关系,本发明的有益效果是:通过对若干历史医学影像报告预处理成为标准文本,并对标准文本进行分词后提取关键特征词,通过关键特征词中的疾病名称与疾病图谱建立索引关系,使得疾病图谱成为了基于大数据的智能疾病图谱;在解读新的医学影像报告时,在疾病图谱中进行检索,便于患者查看疾病图谱。

Description

基于医学影像报告的疾病图谱构建方法、解读方法及系统
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于医学影像报告的疾病图谱构建方法、解读方法及系统。
背景技术
随着国内医学影像设备的增加,越来越多的人进行医学影像检查,得到的医学影像报告作为后续诊断及治疗的依据。但是,普遍存在的现象是,医学影像报告中的用词均是医疗领域的词汇,患者经常会出现认识医学影像报告中的字,但却不知晓其具体含义,特别是不能通过读取医学影像报告获知病情的严重程度,也无法知晓是否还需要做进一步检查或治疗。
当前,绝大多数医院已经实现了患者自助获取电子或纸质的医学影像报告,患者需要再次排队让医生解读医学影像报告,即便医生对报告进行了解读,鉴于医生较忙,解读的全面性不足以让很多患者消除疑虑,尤其是病因、如何预防、如何治疗、并发症等,患者能够获得的专业指导尚存在不足之处。
鉴于此,有必要基于大数据构建疾病图谱,通过疾病图谱对医学影像报告进行深度解读,并通过直白的语言对医学影像报告进行说明,以满足部分患者对医学影像报告的解读需求。
发明内容
本发明的目的在于揭示一种基于医学影像报告的疾病图谱构建方法、解读方法及系统,基于大数据构建疾病图谱,通过疾病图谱解读医学影像报告,使普通患者能够及时清晰地了解医学影像报告的通俗含义,有助于减轻医生的工作量。
本发明的第一个发明目的是提供一种基于医学影像报告的疾病图谱构建方法。
本发明的第二个发明目的是提供一种基于疾病图谱的医学影像报告解读方法。
本发明的第三个发明目的是提供一种基于疾病图谱的医学影像报告解读系统。
为实现上述第一个发明目的,本发明提供了一种基于医学影像报告的疾病图谱构建方法,包括以下步骤:
将若干历史医学影像报告进行预处理,得到若干历史医学影像报告标准文本,所述标准文本包括历史医学影像报告的影像描述及影像诊断报告;
对标准文本进行分词,并提取关键特征词,所述关键特征词至少包括人体部位、影像特征描述、疾病名称、临床表现描述;
通过基于NEZHA的命名实体识别算法训练模型确定关键特征词中的疾病名称;
构建疾病图谱,所述疾病图谱至少包括以下三元组:{疾病名称,影像特征,影像特征描述}、{疾病名称,临床表现,临床表现描述}、{疾病名称,并发症,并发症描述},将疾病图谱信息以三元组形式存储于JanusGraph图数据库;
建立疾病名称与所述疾病图谱的索引关系。
优选地,分词时采用医疗词库。
优选地,所述命名实体识别算法训练模型通过以下步骤进行训练:
人工读取若干份历史医学影像报告,对关键特征词进行人工标注;
通过命名实体识别算法对人工标注进行机器学习,得到命名实体识别算法训练模型;
通过命名实体识别算法训练模型读取若干份历史医学影像报告,对关键特征词进行智能标注。
优选地,所述疾病图谱是基于疾病名称通过爬虫技术自医学知识库中提取。
优选地,所述疾病图谱还包括以下三元组:{疾病名称,别名,别名描述}、{疾病名称,病因,病因描述}、{疾病名称,治疗,治疗描述}、{疾病名称,预防,预防描述}、{疾病名称,多发群体,多发群体描述}。
优选地,在所述三元组中,若影像特征描述、临床表现描述、并发症描述中存在相似内容,则关联相似内容,所述相似内容是指相同文字占比超90%。
为实现上述第二个发明目的,本发明提供了一种基于疾病图谱的医学影像报告解读方法,包括以下步骤:
加载新的医学影像报告并对所述医学影像报告进行分词,提取关键特征词,所述关键特征词包括人体部位、影像特征描述、疾病名称、临床表现描述;
基于疾病名称、影像特征描述或临床表现描述中的一种在第一发明创造所述的基于医学影像报告的疾病图谱构建方法所构建的疾病图谱中进行检索,将检索到的疾病图谱进行缓存并与新的医学影像报告建立对应关系;
在新的医学影像报告中的影像特征描述及疾病名称建立超链接,患者点击超链接,则呈现缓存的疾病图谱。
优选地,在新的医学影像报告中设置二维码,患者得到纸质医学影像报告后,通过扫描所述二维码,呈现缓存的疾病图谱。
为实现上述第三个发明目的,本发明提供了一种基于疾病图谱的医学影像报告解读系统,包括:
疾病图谱模块,疾病图谱以三元组形式存储于JanusGraph图数据库;
医学影像报告解读模块,对所述医学影像报告进行分词并提取关键特征词,基于关键特征词在所述疾病图谱中进行检索,将检索到的疾病图谱进行缓存并与新的医学影像报告建立对应关系,并在关键特征词与所述疾病图谱建立超链接;
医学影像报告读取终端,执行第二发明创造所述的基于疾病图谱的医学影像报告解读方法,查看医学影像报告。
优选地,所述三元组包括{疾病名称,影像特征,影像特征描述}、{疾病名称,临床表现,临床表现描述}、{疾病名称,并发症,并发症描述}、{疾病名称,别名,别名描述}、{疾病名称,病因,病因描述}、{疾病名称,治疗,治疗描述}、{疾病名称,预防,预防描述}、{疾病名称,多发群体,多发群体描述}。
与现有技术相比,本发明的有益效果是:
(1)构建以疾病名称为基础的疾病图谱,通过对若干历史医学影像报告预处理成为标准文本,并对标准文本进行分词后提取关键特征词,通过关键特征词中的疾病名称与疾病图谱建立索引关系,使得疾病图谱成为了基于大数据的智能疾病图谱,为后续在解读新的医学影像报告时提供了基础。
(2)在解读新的医学影像报告时,通过加载新的医学影像报告并进行分词,通过提取关键特征词,特别是关键特征词中的疾病名称,并在已经构建好的智能疾病图谱中进行检索,实时将疾病名称与智能疾病谱图中对应的疾病谱图进行缓存并建立链接关系,便于患者在自助获取医学影像报告时及时进行查看疾病图谱。
(3)建立了基于疾病图谱的医学影像报告解读系统,该解读系统具有疾病图谱模块、医学影像报告解读模块和医学影像报告读取终端,能够方便患者在自助获取医学影像报告时及时进行查看疾病图谱,有助于减轻医生解读报告的工作量。
附图说明
图1为本发明基于医学影像报告的疾病图谱构建方法流程图;
图2为本发明命名实体识别算法训练模型的训练流程图;
图3为本发明疾病图谱示意图;
图4为本发明疾病图谱示意图;
图5为本发明基于疾病图谱的医学影像报告解读方法流程图;
图6为本发明基于疾病图谱的医学影像报告解读系统框图。
具体实施方式
下面结合附图所示的各实施方式对本发明进行详细说明,但应当说明的是,这些实施方式并非对本发明的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代,均属于本发明的保护范围之内。
以下通过多个实施例对本发明的具体实现过程予以阐述。
实施例1
参图1所示,本实施例揭示了一种基于医学影像报告的疾病图谱构建方法(以下简称“方法”)的一种具体实施方式。
基于医学影像报告的疾病图谱构建方法,参图1所示,包括以下步骤:
S1:将若干历史医学影像报告进行预处理,得到若干历史医学影像报告标准文本,所述标准文本包括历史医学影像报告的影像描述及影像诊断报告。具体地,为使疾病图谱包含各种疾病,通过对海量的历史医学影像报告进行预处理,得到海量的历史医学影像报告标准文本,标准文本以文字形式包括医学影像报告的影像描述及影像诊断报告内容,后续的分词及模型训练,是以海量的标准文本为基础进行;在该步骤中,历史医学影像报告的数量越多越好,为大数据分析提供基础。
S2:对标准文本进行分词,并提取关键特征词,所述关键特征词至少包括人体部位、影像特征描述、疾病名称、临床表现描述。具体地,采用医疗词库对标准文本进行分词,在分词的结果中提取关键特征词,关键特征词至少包括人体部位、影像特征描述、疾病名称、临床表现描述等,有助于准确构建疾病图谱,也有助于后期解读新的医学影像报告时更加准确。
S3:通过基于NEZHA的命名实体识别算法训练模型确定关键特征词中的疾病名称。具体地,NEZHA是一种在预训练模型上的实践总结,命名实体识别算法的任务从属于自然语言处理,作为自然语言处理的一个分支,它的目的是将自然文本中的实体抽取出来并按照标签类别进行划分,具体到本实施例,是将人体部位、影像特征描述、疾病名称、临床表现描述等关键特征词中的疾病名称进行确定,也就是对每一份医学影像报告确定至少一个疾病名称,在具体的医学影像报告中,可能会存在多个疾病名称的情况。
命名实体识别算法训练模型通过以下步骤进行训练:
S31:人工读取若干份历史医学影像报告,对关键特征词进行人工标注。具体地,对历史医学影像报告中的人体部位、影像特征描述、疾病名称、临床表现描述等关键特征词进行人工标注,特别是区分疾病名称和疾病症状等临床表现,为机器学习准确找出医学影像报告中的疾病名称提供基础依据。
S32:通过命名实体识别算法对人工标注进行机器学习,得到命名实体识别算法训练模型。具体地,命名实体识别算法通过对若干份人工标注过的历史医学影像报告进行机器学习,得到命名实体识别算法训练模型,使该训练模型具有准确识别医学影像报告中的疾病名称的能力。
S33:通过命名实体识别算法训练模型读取若干份历史医学影像报告,对关键特征词进行智能标注。具体地,通过命名实体识别算法训练模型读取未人工标注的若干份历史医学影像报告,检验命名实体识别算法训练模型准确识别医学影像报告中的疾病名称的能力,直至疾病名称的准确识别能力达到99%以上时,最终得到可信任的命名实体识别算法训练模型。
S4:构建疾病图谱,所述疾病图谱至少包括以下三元组:{疾病名称,影像特征,影像特征描述}、{疾病名称,临床表现,临床表现描述}、{疾病名称,并发症,并发症描述},将疾病图谱信息以三元组形式存储于JanusGraph图数据库。具体地,基于三元组构建的疾病图谱参见图3,三元组以疾病名称为中心,以影像特征、临床表现和并发症为分支,并以影像特征描述、临床表现描述和并发症描述为具体内容,形成疾病图谱,以三元组形式存储的疾病图谱,一方面使患者能够清晰读懂,另一方面使存储空间大幅减小。
为了使疾病图谱的内容足够完善,所述疾病图谱是基于疾病名称通过爬虫技术自医学知识库中提取。具体地,疾病图谱中的疾病名称来自基于若干历史医学影像报告中提取的关键特征词,再基于疾病名称通过爬虫技术自医学知识库中提取,医学知识库包括医学教材、医学百科等。或者,疾病图谱中的疾病名称直接基于爬虫技术自医学知识库中提取,医学知识库包括医学教材、医学百科等。
为使疾病图谱的内容更加丰富,使患者能够通过疾病图谱知晓疾病名称的别名、病因、如何治疗、如何预防、多发群体等信息,疾病图谱还包括以下三元组:{疾病名称,别名,别名描述}、{疾病名称,病因,病因描述}、{疾病名称,治疗,治疗描述}、{疾病名称,预防,预防描述}、{疾病名称,多发群体,多发群体描述},形成八个维度的疾病图谱,具体参见图4。
在上述三元组中,在不同的疾病名称之间,若影像特征描述、临床表现描述、并发症描述中存在相似内容,则关联相似内容,所述相似内容是指相同文字占比超90%;在实际诊断过程中,医学影像报告中根据影像特征仅能初步判断是某种疾病,具体确认还需要结合临床表现描述、并发症描述等内容进行联合诊断,才能进一步准确判断具体的疾病名称,通过关联相似内容,使具体的一个疾病实体(疾病名称)存在多个分支的疾病图谱结构关联起来,形成更加完善、准确的疾病图谱;也就是,将具有相似的影像特征描述(影像所见)或临床表现描述的不同疾病图谱进行关联,经关联后,向患者展示图谱时,不仅展示相同疾病名称的疾病图谱,还同时展示相类似的疾病图谱。
S5:建立疾病名称与所述疾病图谱的索引关系。具体地,步骤S1至S4,已经根据海量的历史医学影像报告,形成了以疾病名称为中心的疾病图谱,通过建立疾病名称与疾病图谱的索引关系,就可以在输入疾病名称时,实时地将该疾病名称相对应的疾病图谱检索出来,通过疾病图谱的形式向患者展示该种疾病的疾病别名、病因、如何治疗、如何预防、多发群体、临床表现、并发症、影像特征等八个方面的口语化解读信息,使患者及时地了解该疾病的信息,从而有助于减轻医生解读报告的工作量。除了建立疾病名称与所述疾病图谱的索引关系外,还可以建立影像特征描述或临床表现描述与疾病图谱的索引关系,这样有助于建立不同输入内容为检索基础的疾病图谱;通过建立疾病名称、影像特征描述或临床表现描述与疾病图谱的索引关系,在向患者展示疾病图谱时,既可以通过疾病名称进行检索,也可以通过影像特征描述或临床表现描述进行检索。
实施例2
参图5所示,本实施例揭示了一种基于疾病图谱的医学影像报告解读方法(以下简称“方法”)的一种具体实施方式。
基于疾病图谱的医学影像报告解读方法,参图5所示,包括以下步骤:
S6:加载新的医学影像报告并对所述医学影像报告进行分词,提取关键特征词,所述关键特征词包括人体部位、影像特征描述、疾病名称、临床表现描述。具体地,将新的医学影像报告加载后,将新的医学影像报告进行预处理,得到标准文本,在对标准文本通过医疗词汇进行分词,并通过已经成熟的命名实体识别算法训练模型提取关键特征词,关键特征词至少包括疾病名称,疾病名称是检索对应的疾病图谱的输入。
S7:基于疾病名称、影像特征描述或临床表现描述中的一种在实施例1所述的基于医学影像报告的疾病图谱构建方法所构建的疾病图谱中进行检索,将检索到的疾病图谱进行缓存并与新的医学影像报告建立对应关系。具体地,在实施例1中,已经将疾病名称、影像特征描述或临床表现描述与疾病图谱之间建立了索引关系,通过新的医学影像报告中提取到的关键特征词作为疾病图谱的检索输入,将疾病名称、影像特征描述或临床表现描述与新的医学影像报告建立对应关系,使新的医学影像报告增加了一份为患者进行口语化或者更详细的解读报告,通过缓存技术,使患者能够实时查看到解读报告,而不是通过等待医生解读或通过查询百科获得解读。
S8:在新的医学影像报告中的影像特征描述及疾病名称建立超链接,患者点击超链接,则呈现缓存的疾病图谱。具体地,在新的医学影像报告中,特别是在电子报告中,在影像特征描述及疾病名称建立超链接,使患者自行选择通过点击超链接,调出已经缓存的疾病图谱,向患者提供图谱化的详细解读,有助于减轻医生解读报告的工作量;超链接既可以建立在疾病名称处,还可以建立在影像特征描述或临床表现描述处,患者可选择点击不同位置的超链接,如点击疾病名称,则向患者展示疾病名称对应的疾病图谱,点击影像特征描述,则出现影像特征描述相似度超过90%的至少一个疾病图谱,点击临床表现描述,则出现临床表现描述相似度超过90%的至少一个疾病图谱,使患者不仅仅得到相同名称的疾病图谱,还会向患者展示相似影像特征或临床表现的疾病图谱。
当患者得到的是纸质的医学影像报告时,超级链接将无法点击,为方便患者或其家属对医学影像报告进行解读,在新的医学影像报告中设置二维码,二维码作为与缓存的疾病图谱的链接,患者得到纸质医学影像报告后,通过扫描所述二维码,呈现缓存的疾病图谱,实现纸质的医学影像报告可解读。
实施例3
参图6所示,本实施例揭示了一种基于疾病图谱的医学影像报告解读系统(以下简称“系统”)的一种具体实施方式。
基于疾病图谱的医学影像报告解读系统,参图6所示,包括:
疾病图谱模块,疾病图谱以三元组形式存储于JanusGraph图数据库。具体地,JanusGraph图数据库是一个分布式图数据库引擎,在该数据库中建立索引组合以供数据的检索,疾病图谱模块采用实施例1所述的方法进行构建,该疾病图谱的三元组包括{疾病名称,影像特征,影像特征描述}、{疾病名称,临床表现,临床表现描述}、{疾病名称,并发症,并发症描述}、{疾病名称,别名,别名描述}、{疾病名称,病因,病因描述}、{疾病名称,治疗,治疗描述}、{疾病名称,预防,预防描述}、{疾病名称,多发群体,多发群体描述}等八个方面,上述三元组以疾病名称为中心进行构建,通过向解读系统输入疾病名称,即可将疾病名称对应的疾病图谱展现给患者。
医学影像报告解读模块,对所述医学影像报告进行分词并提取关键特征词,基于关键特征词在所述疾病图谱中进行检索,将检索到的疾病图谱进行缓存并与新的医学影像报告建立对应关系,并在关键特征词与所述疾病图谱建立超链接。具体地,将新的医学影像报告加载后,将新的医学影像报告进行预处理,得到标准文本,在对标准文本通过医疗词汇进行分词,并通过已经成熟的命名实体识别算法训练模型提取关键特征词,关键特征词至少包括疾病名称,疾病名称是检索对应的疾病图谱的输入;在实施例1中,已经将疾病名称、影像特征描述或临床表现描述中的一种,特别是疾病名称与疾病图谱之间建立了索引关系,通过新的医学影像报告中提取到的关键特征词作为疾病图谱的检索输入,将疾病名称、影像特征描述或临床表现描述并与新的医学影像报告建立对应关系,使新的医学影像报告增加了一份为患者进行口语化或者更详细的解读报告,通过缓存技术,使患者能够实时查看到解读报告,而不是通过等待医生解读或通过查询百科获得解读;在新的医学影像报告中,特别是在电子报告中,在影像特征描述及疾病名称建立超链接,使患者自行选择通过点击超链接,调出已经缓存的疾病图谱,向患者提供图谱化的详细解读,有助于减轻医生解读报告的工作量。
医学影像报告读取终端,执行实施例2所述的基于疾病图谱的医学影像报告解读方法,查看医学影像报告。具体地,读取终端为PC、移动终端等,患者得到的医学影像报告为电子的或纸质的,电子的以超链接方式向患者提供解读报告,纸质的以二维码方式向患者提供解读报告。
患者通过超链接或二维码读取疾病图谱时,为保护患者隐私,在医学影像报告读取终端设置人脸识别模块,患者点击超链接或扫描二维码时,患者进行人脸识别后才可以进行读取疾病图谱。
实施例4
计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如实施例2所述的方法。
本实施例所揭示的计算机可读存储介质与实施例2中具有相同部分的技术方案,请参实施例2所述,在此不再赘述。
本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (10)

1.基于医学影像报告的疾病图谱构建方法,其特征在于,包括以下步骤:
将若干历史医学影像报告进行预处理,得到若干历史医学影像报告标准文本,所述标准文本包括历史医学影像报告的影像描述及影像诊断报告;
对标准文本进行分词,并提取关键特征词,所述关键特征词至少包括人体部位、影像特征描述、疾病名称、临床表现描述;
通过基于NEZHA的命名实体识别算法训练模型确定关键特征词中的疾病名称;
构建疾病图谱,所述疾病图谱至少包括以下三元组:{疾病名称,影像特征,影像特征描述}、{疾病名称,临床表现,临床表现描述}、{疾病名称,并发症,并发症描述},将疾病图谱信息以三元组形式存储于JanusGraph图数据库;
建立疾病名称与所述疾病图谱的索引关系。
2.如权利要求1所述的基于医学影像报告的疾病图谱构建方法,其特征在于,分词时采用医疗词库。
3.如权利要求1所述的基于医学影像报告的疾病图谱构建方法,其特征在于,所述命名实体识别算法训练模型通过以下步骤进行训练:
人工读取若干份历史医学影像报告,对关键特征词进行人工标注;
通过命名实体识别算法对人工标注进行机器学习,得到命名实体识别算法训练模型;
通过命名实体识别算法训练模型读取若干份历史医学影像报告,对关键特征词进行智能标注。
4.如权利要求1所述的基于医学影像报告的疾病图谱构建方法,其特征在于,所述疾病图谱是基于疾病名称通过爬虫技术自医学知识库中提取。
5.如权利要求1所述的基于医学影像报告的疾病图谱构建方法,其特征在于,所述疾病图谱还包括以下三元组:{疾病名称,别名,别名描述}、{疾病名称,病因,病因描述}、{疾病名称,治疗,治疗描述}、{疾病名称,预防,预防描述}、{疾病名称,多发群体,多发群体描述}。
6.如权利要求1或5所述的基于医学影像报告的疾病图谱构建方法,其特征在于,在所述三元组中,若影像特征描述、临床表现描述、并发症描述中存在相似内容,则关联相似内容,所述相似内容是指相同文字占比超90%。
7.基于疾病图谱的医学影像报告解读方法,其特征在于,包括以下步骤:
加载新的医学影像报告并对所述医学影像报告进行分词,提取关键特征词,所述关键特征词包括人体部位、影像特征描述、疾病名称、临床表现描述;
基于疾病名称、影像特征描述或临床表现描述中的一种在权利要求1-6任一所述的基于医学影像报告的疾病图谱构建方法所构建的疾病图谱中进行检索,将检索到的疾病图谱进行缓存并与新的医学影像报告建立对应关系;
在新的医学影像报告中的影像特征描述及疾病名称建立超链接,患者点击超链接,则呈现缓存的疾病图谱。
8.如权利要求7所述的基于疾病图谱的医学影像报告解读方法,其特征在于,在新的医学影像报告中设置二维码,患者得到纸质医学影像报告后,通过扫描所述二维码,呈现缓存的疾病图谱。
9.基于疾病图谱的医学影像报告解读系统,其特征在于,包括:
疾病图谱模块,疾病图谱以三元组形式存储于JanusGraph图数据库;
医学影像报告解读模块,对所述医学影像报告进行分词并提取关键特征词,基于关键特征词在所述疾病图谱中进行检索,将检索到的疾病图谱进行缓存并与新的医学影像报告建立对应关系,并在关键特征词与所述疾病图谱建立超链接;
医学影像报告读取终端,执行权利要求7-8任一所述的基于疾病图谱的医学影像报告解读方法,查看医学影像报告。
10.如权利要求9所述的基于疾病图谱的医学影像报告解读系统,其特征在于,所述三元组包括{疾病名称,影像特征,影像特征描述}、{疾病名称,临床表现,临床表现描述}、{疾病名称,并发症,并发症描述}、{疾病名称,别名,别名描述}、{疾病名称,病因,病因描述}、{疾病名称,治疗,治疗描述}、{疾病名称,预防,预防描述}、{疾病名称,多发群体,多发群体描述}。
CN202210481687.XA 2022-05-05 2022-05-05 基于医学影像报告的疾病图谱构建方法、解读方法及系统 Pending CN114708981A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210481687.XA CN114708981A (zh) 2022-05-05 2022-05-05 基于医学影像报告的疾病图谱构建方法、解读方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210481687.XA CN114708981A (zh) 2022-05-05 2022-05-05 基于医学影像报告的疾病图谱构建方法、解读方法及系统

Publications (1)

Publication Number Publication Date
CN114708981A true CN114708981A (zh) 2022-07-05

Family

ID=82177108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210481687.XA Pending CN114708981A (zh) 2022-05-05 2022-05-05 基于医学影像报告的疾病图谱构建方法、解读方法及系统

Country Status (1)

Country Link
CN (1) CN114708981A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115062120A (zh) * 2022-08-18 2022-09-16 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 读片知识图谱构建方法、装置、处理器及报告生成方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115062120A (zh) * 2022-08-18 2022-09-16 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 读片知识图谱构建方法、装置、处理器及报告生成方法

Similar Documents

Publication Publication Date Title
CN111709233B (zh) 基于多注意力卷积神经网络的智能导诊方法及系统
CN112527999B (zh) 引入农业领域知识的抽取式智能问答方法及系统
CN110363194B (zh) 基于nlp的智能阅卷方法、装置、设备及存储介质
CN111274365B (zh) 基于语义理解的智能问诊方法、装置、存储介质及服务器
US20200334249A1 (en) Automatic transformation of complex tables in documents into computer understandable structured format and providing schema-less query support data extraction
US7492949B1 (en) Process and system for the semantic selection of document templates
CN113724848A (zh) 基于人工智能的医疗资源推荐方法、装置、服务器及介质
CN112927776A (zh) 一种面向医学检验报告的人工智能自动解读系统
KR102279126B1 (ko) 이미지 기반의 데이터 처리 방법, 장치, 전자 기기 및 저장 매체
CN111627512A (zh) 一种相似病历的推荐方法、装置,电子设备及存储介质
CN113076411B (zh) 一种基于知识图谱的医疗查询扩展方法
CN112287069B (zh) 基于语音语义的信息检索方法、装置及计算机设备
CN111460095B (zh) 问答处理方法、装置、电子设备及存储介质
US11308083B2 (en) Automatic transformation of complex tables in documents into computer understandable structured format and managing dependencies
CN109299227B (zh) 基于语音识别的信息查询方法和装置
CN111191415A (zh) 基于原始手术数据的手术分类编码方法
CN113409907A (zh) 一种基于互联网医院的智能预问诊方法及系统
CN112837772A (zh) 一种预问诊病历生成方法及装置
CN114708981A (zh) 基于医学影像报告的疾病图谱构建方法、解读方法及系统
CN113553840B (zh) 一种文本信息处理方法、装置、设备及存储介质
CN113658690A (zh) 一种智能导医方法、装置、存储介质以及电子设备
CN113642562A (zh) 基于图像识别的数据解读方法、装置、设备及存储介质
CN113111660A (zh) 数据处理方法、装置、设备和存储介质
CN117894439A (zh) 一种基于人工智能的导诊方法、系统、电子设备及介质
CN113887422B (zh) 基于人工智能的表格图片内容提取方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination