CN110895580A - 一种基于深度学习的icd手术与操作编码自动匹配方法 - Google Patents

一种基于深度学习的icd手术与操作编码自动匹配方法 Download PDF

Info

Publication number
CN110895580A
CN110895580A CN201911271626.5A CN201911271626A CN110895580A CN 110895580 A CN110895580 A CN 110895580A CN 201911271626 A CN201911271626 A CN 201911271626A CN 110895580 A CN110895580 A CN 110895580A
Authority
CN
China
Prior art keywords
code
icd
modeling
neural network
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911271626.5A
Other languages
English (en)
Other versions
CN110895580B (zh
Inventor
张述睿
吴军
樊昭磊
张伯政
张福鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongyang Health Technology Group Co ltd
Original Assignee
Shandong Msunhealth Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Msunhealth Technology Group Co Ltd filed Critical Shandong Msunhealth Technology Group Co Ltd
Priority to CN201911271626.5A priority Critical patent/CN110895580B/zh
Publication of CN110895580A publication Critical patent/CN110895580A/zh
Application granted granted Critical
Publication of CN110895580B publication Critical patent/CN110895580B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9027Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

一种基于深度学习的ICD手术与操作编码自动匹配方法,使用了模块化建模的方法,每个模块只完成相对简单的一项任务,大大减小了模型参数的搜寻空间,缩减了所需要的数据量。本方法采用了双向自回归语言模型对自然语言序列进行建模,使用每一条手术描述和每一条ICD编码结合,计算出他们之间的语义空间权重,并使用语义空间权重对手术描述进行重构,最后使用重构之后的手术描述进行ICD编码分类匹配以解决概念拆分的问题,在计算中也使用了ICD手术与操作编码固有的的层级结构进行双向自回归模型建模,融入了业务先验知识。解决了临床中遇到的问题,可以快速、准确地进行ICD编码匹配。

Description

一种基于深度学习的ICD手术与操作编码自动匹配方法
技术领域
本发明涉及医疗技术领域,具体涉及一种基于深度学习的ICD手术与操作编码自动匹配方法。
背景技术
国际疾病分类手术与操作编码(ICD-9-CM-3)是医院病案信息汇总和统计的重要工具,在医院的医疗、研究、管理中起到重要作用。在实际的临床应用中,如何根据电子病历中医务人员录入的手术描述匹配到ICD手术与操作编码,是一件耗时费力的事情,需要大量的病历阅读工作和编码查阅工作。而且在实际的电子病历当中,医务人员录入的手术与操作描述可能会比较简短,也就是在简短的一段描述中含有若干个手术操作类别,所以如何将医务人员录入病历的手术描述进行概念拆分和匹配到标准ICD手术与操作编码是一件漫长而容易出错的事情。而一般的统计学习,机器学习和深度学习分类模型往往无法应对ICD编码这样的超大规模分类问题,因为分类空间过于庞大,使用标注数据直接进行训练往往会产生严重的过拟合或欠拟合,并且无法解决手术描述的概念拆分问题,例如“头面部裂伤清创缝合术”这个手术描述需要拆分为两个ICD手术与操作编码,分别是'86.2201皮肤伤口切除性清创术'和'86.5900x006皮肤缝合术',一般的分类模型无法找到合理的拆分方法,而且一般的算法需要大量的标注数据,在实际条件下受限于各方面条件获取大量标注数据往往是很困难的事情,而在临床应用中因为医疗工作容错率比较低,模型因为过拟合和欠拟合而产生的错误是无法接受的。
发明内容
本发明为了克服以上技术的不足,提供了一种快速、准确地进行ICD编码匹配的方法。
本发明克服其技术问题所采用的技术方案是:
一种基于深度学习的ICD手术与操作编码自动匹配方法,包括如下步骤:
a)利用医学文本语料进行字向量的预训练,字向量矩阵为Δ,
Figure BDA0002314004690000011
其中N为字典中字的个数,d为字向量的维度,
Figure BDA00023140046900000214
为实数空间,Δ∈{δ12,...,δn},δi为单个字的字向量,i为单个字的字向量的编号,1≤i≤n,通过公式
Figure BDA0002314004690000021
计算得到最大值的字向量矩阵
Figure BDA0002314004690000022
其中P为概率,ci为自然语言序列中的一个字,
Figure BDA0002314004690000023
为ci的上下文,
Figure BDA0002314004690000024
T为矩阵转置,W为上下文取的窗口范围的字数,
Figure BDA0002314004690000025
为在W范围内字向量的编号,1≤n≤N,n为正整数;
b)获取医生在电子病历中录入的手术描述,通过索引步骤a)中最大值的字向量矩阵
Figure BDA0002314004690000026
将电子病历中医生录入的手术描述中的每一个字用字向量hopt表示,
Figure BDA0002314004690000027
其中len为电子病历中医生录入的手术描述的字数,
Figure BDA0002314004690000028
为自然语言序列中的第j个字,j∈{1,2,...,len};
c)将hopt进行双向自回归神经网络建模,正向建模顺序为从j=1到j=len,反向建模顺序是从j=len到j=1,建模完成后输出的正向隐状态序列为
Figure BDA0002314004690000029
输出的反向隐状态序列为
Figure BDA00023140046900000210
将正向隐状态序列和反向隐状态序列在d的维度上进行矩阵级联,矩阵级联后进行线性映射,获得
Figure BDA00023140046900000211
Figure BDA00023140046900000212
为通过双休自回归神经网络建模后的电子病历中的手术描述,
Figure BDA00023140046900000213
linear()为线性映射;
d)获取国际疾病分类手术与操作编码中对于每一个标准手术编码的编码描述,通过索引步骤a)中最大值的字向量矩阵
Figure BDA0002314004690000031
将国际疾病分类手术与操作编码的字向量表示为hcode
e)将hcode进行双向自回归神经网络建模,正向建模顺序为从j=1到j=len,反向建模顺序是从j=len到j=1,建模完成后输出的正向隐状态序列为
Figure BDA0002314004690000032
输出的反向隐状态序列为
Figure BDA0002314004690000033
将正向隐状态序列和反向隐状态序列在d的维度上进行矩阵级联,矩阵级联后进行线性映射,获得
Figure BDA0002314004690000034
Figure BDA0002314004690000035
为通过双休自回归神经网络建模后的标准手术编码的编码描述,
Figure BDA0002314004690000036
clen为编码描述的字数;
f)将编码描述
Figure BDA0002314004690000037
进行树形自回归神经网络建模得到
Figure BDA0002314004690000038
g)通过公式
Figure BDA0002314004690000039
计算
Figure BDA00023140046900000310
中每个字对于
Figure BDA00023140046900000311
的语义空间权重,
Figure BDA00023140046900000312
为电子病历中手术描述中第i个字对应的隐状态,
Figure BDA00023140046900000313
为某个ICD手术编码所对应的编码描述,1≤l≤len,l为正整数,通过公式
Figure BDA00023140046900000314
计算使用语义空间权重αi
Figure BDA00023140046900000315
进行重构,得到重构后的
Figure BDA00023140046900000316
重构后的
Figure BDA00023140046900000317
为m,通过公式p=σ(Linear(m))对m进行线性映射,线性映射后用sigmoid概率映射函数激活,式中p为介于0到1之间的实数,
Figure BDA00023140046900000318
Z为ICD手术与操作编码的个数;
h)里通过公式Loss=-glogp-(1-g)log(1-p)计算模型的损失Loss,
式中g为标记的正确结果,使用梯度下降法使损失最小化。
进一步的,步骤c)中双向自回归神经网络建模的公式为:
Figure BDA0002314004690000041
Figure BDA0002314004690000042
Figure BDA0002314004690000043
Figure BDA0002314004690000044
cj=multiply(τjj)+multiply(μj,cj-1)、
Figure BDA0002314004690000045
Figure BDA0002314004690000046
式中,γτ、βτ、bτ、γμ、βμ、bμ、γo、βo、bo、γρ、βρ、bρ为自回归神经网络的引入的参数,使用标准正态分布初始化引入的参数,σ为sigmoid概率映射函数,multiply为矩阵元素相乘运算。
进一步的,步骤e)中双向自回归神经网络建模的公式为:
Figure BDA0002314004690000047
Figure BDA0002314004690000048
Figure BDA0002314004690000049
Figure BDA00023140046900000410
cj=multiply(τjj)+multiply(μj,cj-1)、
Figure BDA0002314004690000051
Figure BDA0002314004690000052
式中,γτ、βτ、bτ、γμ、βμ、bμ、γo、βo、bo、γρ、βρ、bρ为自回归神经网络的引入的参数,使用标准正态分布初始化引入的参数,σ为sigmoid概率映射函数,multiply为矩阵元素相乘运算。
进一步的,步骤f)中利用ICD-9-CM-3的树形结构进行树形自回归神经网络建模。本发明的有益效果是:使用了模块化建模的方法,每个模块只完成相对简单的一项任务,大大减小了模型参数的搜寻空间,缩减了所需要的数据量。本方法采用了双向自回归语言模型对自然语言序列进行建模,使用每一条手术描述和每一条ICD编码结合,计算出他们之间的语义空间权重,并使用语义空间权重对手术描述进行重构,最后使用重构之后的手术描述进行ICD编码分类匹配以解决概念拆分的问题,在计算中也使用了ICD手术与操作编码固有的的层级结构进行双向自回归模型建模,融入了业务先验知识。解决了临床中遇到的问题,可以快速、准确地进行ICD编码匹配。
具体实施方式
下面对本发明做进一步说明。
一种基于深度学习的ICD手术与操作编码自动匹配方法,包括如下步骤:
a)利用医学文本语料进行字向量的预训练,字向量矩阵为Δ,
Figure BDA0002314004690000053
其中N为字典中字的个数,d为字向量的维度,
Figure BDA0002314004690000054
为实数空间,Δ∈{δ12,...,δn},δi为单个字的字向量,i为单个字的字向量的编号,1≤i≤n,通过公式
Figure BDA0002314004690000055
计算得到最大值的字向量矩阵
Figure BDA0002314004690000061
argmax(f)表示指的是求可以使某个函数f取最大值所对应的f函数的参数的集合。其中P为概率,ci为自然语言序列中的一个字,
Figure BDA0002314004690000062
为ci的上下文,
Figure BDA0002314004690000063
T为矩阵转置,W为上下文取的窗口范围的字数,
Figure BDA0002314004690000064
为在W范围内字向量的编号,1≤n≤N,n为正整数。
b)获取医生在电子病历中录入的手术描述,在本发明中使用opt来表示。通过索引步骤a)中最大值的字向量矩阵
Figure BDA0002314004690000065
将电子病历中医生录入的手术描述中的每一个字用字向量hopt表示,
Figure BDA0002314004690000066
其中len为电子病历中医生录入的手术描述的字数,d为字向量的维度,
Figure BDA0002314004690000067
Figure BDA0002314004690000068
为自然语言序列中的第j个字或称之为第j时刻,j∈{1,2,...,len}是j的取值集合。
c)将hopt进行双向自回归神经网络建模,正向建模顺序为从j=1到j=len,反向建模顺序是从j=len到j=1,建模完成后输出的正向隐状态序列为
Figure BDA0002314004690000069
输出的反向隐状态序列为
Figure BDA00023140046900000610
将正向隐状态序列和反向隐状态序列在d的维度上进行矩阵级联,矩阵级联后进行线性映射,获得
Figure BDA00023140046900000611
Figure BDA00023140046900000612
为通过双休自回归神经网络建模后的电子病历中的手术描述,
Figure BDA00023140046900000613
linear()为线性映射。
d)获取国际疾病分类手术与操作编码中对于每一个标准手术编码的编码描述,也就是ICD-9-CM-3编码中对于每一个标准手术编码的编码描述,通过索引步骤a)中最大值的字向量矩阵
Figure BDA00023140046900000614
将国际疾病分类手术与操作编码的字向量表示为hcode
e)将hcode进行双向自回归神经网络建模,正向建模顺序为从j=1到j=len,反向建模顺序是从j=len到j=1,建模完成后输出的正向隐状态序列为
Figure BDA0002314004690000071
输出的反向隐状态序列为
Figure BDA0002314004690000072
将正向隐状态序列和反向隐状态序列在d的维度上进行矩阵级联,矩阵级联后进行线性映射,获得
Figure BDA0002314004690000073
Figure BDA0002314004690000074
为通过双休自回归神经网络建模后的标准手术编码的编码描述,
Figure BDA0002314004690000075
clen为编码描述的字数,在clen的维度求平均,也就是获取编码描述在语义空间内的中心表达,经过取平均后clen的维度被消掉,最终得到
Figure BDA0002314004690000076
f)将编码描述
Figure BDA0002314004690000077
进行树形自回归神经网络建模得到
Figure BDA0002314004690000078
g)通过公式
Figure BDA0002314004690000079
计算
Figure BDA00023140046900000710
中每个字对于
Figure BDA00023140046900000711
的语义空间权重,
Figure BDA00023140046900000712
为电子病历中手术描述中第i个字对应的隐状态,
Figure BDA00023140046900000713
为某个ICD手术编码所对应的编码描述,1≤l≤len,l为正整数,通过公式
Figure BDA00023140046900000714
计算使用语义空间权重αi
Figure BDA00023140046900000715
进行重构,得到重构后的
Figure BDA00023140046900000716
重构后的
Figure BDA00023140046900000717
为m,通过公式p=σ(Linear(m))对m进行线性映射,线性映射后用sigmoid概率映射函数激活,式中p为介于0到1之间的实数,
Figure BDA00023140046900000718
Z为ICD手术与操作编码的个数。
一个手术描述对于每个ICD手术与操作编码产生一个预测结果,所以
Figure BDA00023140046900000719
Z为ICD手术与操作编码的个数,我们需要对电子病历中的手术描述和ICD手术编码的编码描述进行两两配对,注意该计算方式,可以使一条电子病历中医生录入的手术描述匹配到若干个ICD编码,可以解决概念拆分的问题。而且医生录入的手术描述经过语义空间重构,可以得到手术描述中每一个字对于匹配到某个编码的重要性。
例1:
输入到模型的手术描述:“头面部裂伤清创缝合术”
模型的输出通过取阈值
Figure BDA0002314004690000081
并做阈值截断,之后模型输出小于
Figure BDA0002314004690000082
的结果变成0,大于或等于
Figure BDA0002314004690000083
的变成1,
Figure BDA0002314004690000084
是介于0到1之间实数,是一个超参数,其获取方式是调节
Figure BDA0002314004690000085
以使验证数据里面的ICD编码的匹配性能达到最优,之后通过取阈值的方法在p中获取到大于
Figure BDA0002314004690000086
的索引,并找到与索引对应的编码,并回溯语义空间权重α,可以得到:
“86.2201皮肤伤口切除性清创术”
手术描述
Alpha 0.07 0.06 0.08 0.15 0.11 0.23 0.19 0.02 0.03 0.08
可见对于86.2201这个编码,“清创”这两个字的语义空间权重较高。
“86.5900x006皮肤缝合术”
手术描述
Alpha 0.11 0.09 0.05 0.13 0.15 0.04 0.03 0.20 0.17 0.03
可见对于86.2201这个编码,“缝合”这两个字的语义空间权重较高。
h)里通过公式Loss=-glogp-(1-g)log(1-p)计算模型的损失Loss,
式中g为标记的正确结果,使用梯度下降法使损失最小化。
通过以上的ICD编码主动匹配算法使用了模块化建模的方法,每个模块只完成相对简单的一项任务,大大减小了模型参数的搜寻空间,缩减了所需要的数据量。本方法采用了双向自回归语言模型对自然语言序列进行建模,使用每一条手术描述和每一条ICD编码结合,计算出他们之间的语义空间权重,并使用语义空间权重对手术描述进行重构,最后使用重构之后的手术描述进行ICD编码分类匹配以解决概念拆分的问题,在计算中也使用了ICD手术与操作编码固有的的层级结构进行双向自回归模型建模,融入了业务先验知识。解决了临床中遇到的问题,可以快速、准确地进行ICD编码匹配。
本方法的实际的手术描述和拆分和匹配效果如下:输入到模型的手术描述:“头面部裂伤清创缝合术”
模型输出的拆分后并匹配好的ICD手术与操作编码:
“86.2201皮肤伤口切除性清创术”
手术描述
α 0.07 0.06 0.08 0.15 0.11 0.23 0.19 0.02 0.03 0.08
“86.5900x006皮肤缝合术”
手术描述
α 0.11 0.09 0.05 0.13 0.15 0.04 0.03 0.20 0.17 0.03
输入到模型的手术描述:“全子宫切除+左侧附件切除术”
模型输出的拆分后并匹配好的ICD手术与操作编码:
“68.4901经腹全子宫切除术”
Figure BDA0002314004690000091
“65.4900x001单侧输卵管-卵巢切除术”
Figure BDA0002314004690000092
进一步的,步骤c)中双向自回归神经网络建模的公式为:
Figure BDA0002314004690000093
Figure BDA0002314004690000101
Figure BDA0002314004690000102
Figure BDA0002314004690000103
cj=multiply(τjj)+multiply(μj,cj-1)、
Figure BDA0002314004690000104
Figure BDA0002314004690000105
式中,γτ、βτ、bτ、γμ、βμ、bμ、γo、βo、bo、γρ、βρ、bρ为自回归神经网络的引入的参数,使用标准正态分布初始化引入的参数,τj、μj、oj、ρj是自回归神经网络的中间计算步骤的结果,双向自回归指的是以不同的方向进行自回归运算,每个方向的,每个方向的γτ、βτ、bτ、γμ、βμ、bμ、γo、βo、bo、γρ、βρ、bρ参数不同。σ为sigmoid概率映射函数,multiply为矩阵元素相乘运算。
进一步的,步骤e)中双向自回归神经网络建模的公式为:
Figure BDA0002314004690000106
Figure BDA0002314004690000107
Figure BDA0002314004690000108
Figure BDA0002314004690000109
cj=multiply(τjj)+multiply(μj,cj-1)、
Figure BDA00023140046900001010
Figure BDA0002314004690000111
式中,γτ、βτ、bτ、γμ、βμ、bμ、γo、βo、bo、γρ、βρ、bρ为自回归神经网络的引入的参数,τj、μj、oj、ρj是自回归神经网络的中间计算步骤的结果,双向自回归指的是以不同的方向进行自回归运算,每个方向的,每个方向的γτ、βτ、bτ、γμ、βμ、bμ、γo、βo、bo、γρ、βρ、bρ参数不同,使用标准正态分布初始化引入的参数,σ为sigmoid概率映射函数,multiply为矩阵元素相乘运算。
进一步的,步骤f)中利用ICD-9-CM-3的树形结构进行树形自回归神经网络建模。树形结构一共分为5层:分别是根结点—章节—类目—亚目—细目。树形双向自回归建模的方向是从细目到根结点,再从根节点到细目,也就是从树形结构的叶子结点一直到根结点然后再返回,树形双向自回归神经网络的结构和步骤三中的序列双向自回归神经网络的结构相同,除了从子节点向父节点前进时,例如从细目向亚目的方向前进时,这里细目是子节点,亚目是父节点。

Claims (4)

1.一种基于深度学习的ICD手术与操作编码自动匹配方法,其特征在于,包括如下步骤:
a)利用医学文本语料进行字向量的预训练,字向量矩阵为Δ,
Figure FDA0002314004680000011
其中N为字典中字的个数,d为字向量的维度,
Figure FDA0002314004680000012
为实数空间,Δ∈{δ12,...,δn},δi为单个字的字向量,i为单个字的字向量的编号,1≤i≤n,通过公式
Figure FDA0002314004680000013
计算得到最大值的字向量矩阵
Figure FDA0002314004680000014
其中P为概率,ci为自然语言序列中的一个字,
Figure FDA0002314004680000015
为ci的上下文,
Figure FDA0002314004680000016
T为矩阵转置,W为上下文取的窗口范围的字数,
Figure FDA0002314004680000017
为在W范围内字向量的编号,1≤n≤N,n为正整数;
b)获取医生在电子病历中录入的手术描述,通过索引步骤a)中最大值的字向量矩阵
Figure FDA0002314004680000018
将电子病历中医生录入的手术描述中的每一个字用字向量hopt表示,
Figure FDA0002314004680000019
其中len为电子病历中医生录入的手术描述的字数,
Figure FDA00023140046800000110
Figure FDA00023140046800000111
为自然语言序列中的第j个字,j∈{1,2,...,len};
c)将hopt进行双向自回归神经网络建模,正向建模顺序为从j=1到j=len,反向建模顺序是从j=len到j=1,建模完成后输出的正向隐状态序列为
Figure FDA00023140046800000112
输出的反向隐状态序列为
Figure FDA00023140046800000113
将正向隐状态序列和反向隐状态序列在d的维度上进行矩阵级联,矩阵级联后进行线性映射,获得
Figure FDA0002314004680000021
Figure FDA0002314004680000022
为通过双休自回归神经网络建模后的电子病历中的手术描述,
Figure FDA0002314004680000023
linear()为线性映射;
d)获取国际疾病分类手术与操作编码中对于每一个标准手术编码的编码描述,通过索引步骤a)中最大值的字向量矩阵
Figure FDA0002314004680000024
将国际疾病分类手术与操作编码的字向量表示为hcode
e)将hcode进行双向自回归神经网络建模,正向建模顺序为从j=1到j=len,反向建模顺序是从j=len到j=1,建模完成后输出的正向隐状态序列为
Figure FDA0002314004680000025
输出的反向隐状态序列为
Figure FDA0002314004680000026
将正向隐状态序列和反向隐状态序列在d的维度上进行矩阵级联,矩阵级联后进行线性映射,获得
Figure FDA0002314004680000027
Figure FDA0002314004680000028
为通过双休自回归神经网络建模后的标准手术编码的编码描述,
Figure FDA0002314004680000029
clen为编码描述的字数;
f)将编码描述
Figure FDA00023140046800000210
进行树形自回归神经网络建模得到
Figure FDA00023140046800000211
g)通过公式
Figure FDA00023140046800000212
计算
Figure FDA00023140046800000213
中每个字对于
Figure FDA00023140046800000214
的语义空间权重,
Figure FDA00023140046800000215
为电子病历中手术描述中第i个字对应的隐状态,
Figure FDA00023140046800000216
为某个ICD手术编码所对应的编码描述,1≤l≤len,l为正整数,通过公式
Figure FDA00023140046800000217
计算使用语义空间权重αi
Figure FDA0002314004680000031
进行重构,得到重构后的
Figure FDA0002314004680000032
重构后的
Figure FDA0002314004680000033
为m,通过公式p=σ(Linear(m))对m进行线性映射,线性映射后用sigmoid概率映射函数激活,式中p为介于0到1之间的实数,
Figure FDA0002314004680000034
Z为ICD手术与操作编码的个数;
h)里通过公式Loss=-glogp-(1-g)log(1-p)计算模型的损失Loss,式中g为标记的正确结果,使用梯度下降法使损失最小化。
2.根据权利要求1所述的基于深度学习的ICD手术与操作编码自动匹配方法,其特征在于:步骤c)中双向自回归神经网络建模的公式为:
Figure FDA0002314004680000035
Figure FDA0002314004680000036
Figure FDA0002314004680000037
Figure FDA0002314004680000038
cj=multiply(τjj)+multiply(μj,cj-1)、
Figure FDA0002314004680000039
Figure FDA00023140046800000310
式中,γτ、βτ、bτ、γμ、βμ、bμ、γo、βo、bo、γρ、βρ、bρ为自回归神经网络的引入的参数,使用标准正态分布初始化引入的参数,σ为sigmoid概率映射函数,multiply为矩阵元素相乘运算。
3.根据权利要求1所述的基于深度学习的ICD手术与操作编码自动匹配方法,其特征在于:步骤e)中双向自回归神经网络建模的公式为:
Figure FDA00023140046800000311
Figure FDA0002314004680000041
Figure FDA0002314004680000042
Figure FDA0002314004680000043
cj=multiply(τjj)+multiply(μj,cj-1)、
Figure FDA0002314004680000044
Figure FDA0002314004680000045
式中,γτ、βτ、bτ、γμ、βμ、bμ、γo、βo、bo、γρ、βρ、bρ为自回归神经网络的引入的参数,使用标准正态分布初始化引入的参数,σ为sigmoid概率映射函数,multiply为矩阵元素相乘运算。
4.根据权利要求1所述的基于深度学习的ICD手术与操作编码自动匹配方法,其特征在于:步骤f)中利用ICD-9-CM-3的树形结构进行树形自回归神经网络建模。
CN201911271626.5A 2019-12-12 2019-12-12 一种基于深度学习的icd手术与操作编码自动匹配方法 Active CN110895580B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911271626.5A CN110895580B (zh) 2019-12-12 2019-12-12 一种基于深度学习的icd手术与操作编码自动匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911271626.5A CN110895580B (zh) 2019-12-12 2019-12-12 一种基于深度学习的icd手术与操作编码自动匹配方法

Publications (2)

Publication Number Publication Date
CN110895580A true CN110895580A (zh) 2020-03-20
CN110895580B CN110895580B (zh) 2020-07-07

Family

ID=69787976

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911271626.5A Active CN110895580B (zh) 2019-12-12 2019-12-12 一种基于深度学习的icd手术与操作编码自动匹配方法

Country Status (1)

Country Link
CN (1) CN110895580B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686306A (zh) * 2020-12-29 2021-04-20 山东众阳健康科技集团有限公司 基于图神经网络的icd手术分类自动匹配方法及系统
CN112700825A (zh) * 2020-12-30 2021-04-23 杭州依图医疗技术有限公司 医学数据的处理方法、装置及存储介质
CN117708339A (zh) * 2024-02-05 2024-03-15 中南大学 一种基于预训练语言模型的icd自动编码方法
CN117708339B (zh) * 2024-02-05 2024-04-23 中南大学 一种基于预训练语言模型的icd自动编码方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060052674A1 (en) * 2004-09-04 2006-03-09 Steven Eisenstein Software method of determining and treating psychiatric disorders
CN105069124A (zh) * 2015-08-13 2015-11-18 易保互联医疗信息科技(北京)有限公司 一种自动化的国际疾病分类编码方法及系统
US20160019356A1 (en) * 2013-02-20 2016-01-21 Vitalware, Llc Ontological medical coding method, system, and apparatus
CN106776711A (zh) * 2016-11-14 2017-05-31 浙江大学 一种基于深度学习的中文医学知识图谱构建方法
US20170228500A1 (en) * 2016-02-09 2017-08-10 Justin Massengale Process of generating medical records
CN107705839A (zh) * 2017-10-25 2018-02-16 山东众阳软件有限公司 疾病自动编码方法及系统
CN107833605A (zh) * 2017-03-14 2018-03-23 北京大瑞集思技术有限公司 一种医院病历信息的编码方法、装置、服务器及系统
CN109697285A (zh) * 2018-12-13 2019-04-30 中南大学 增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法
CN109994216A (zh) * 2019-03-21 2019-07-09 上海市第六人民医院 一种基于机器学习的icd智能诊断编码方法
CN110491465A (zh) * 2019-08-20 2019-11-22 山东众阳健康科技集团有限公司 基于深度学习的疾病分类编码方法、系统、设备及介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060052674A1 (en) * 2004-09-04 2006-03-09 Steven Eisenstein Software method of determining and treating psychiatric disorders
US20160019356A1 (en) * 2013-02-20 2016-01-21 Vitalware, Llc Ontological medical coding method, system, and apparatus
CN105069124A (zh) * 2015-08-13 2015-11-18 易保互联医疗信息科技(北京)有限公司 一种自动化的国际疾病分类编码方法及系统
US20170228500A1 (en) * 2016-02-09 2017-08-10 Justin Massengale Process of generating medical records
CN106776711A (zh) * 2016-11-14 2017-05-31 浙江大学 一种基于深度学习的中文医学知识图谱构建方法
CN107833605A (zh) * 2017-03-14 2018-03-23 北京大瑞集思技术有限公司 一种医院病历信息的编码方法、装置、服务器及系统
CN107705839A (zh) * 2017-10-25 2018-02-16 山东众阳软件有限公司 疾病自动编码方法及系统
CN109697285A (zh) * 2018-12-13 2019-04-30 中南大学 增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法
CN109994216A (zh) * 2019-03-21 2019-07-09 上海市第六人民医院 一种基于机器学习的icd智能诊断编码方法
CN110491465A (zh) * 2019-08-20 2019-11-22 山东众阳健康科技集团有限公司 基于深度学习的疾病分类编码方法、系统、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HAORANSHI, PENGTAOXIE,ET AL: ""Towards Automated ICD Coding Using Deep Learning"", 《HTTPS://ARXIV.ORG/ABS/1711.04075》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686306A (zh) * 2020-12-29 2021-04-20 山东众阳健康科技集团有限公司 基于图神经网络的icd手术分类自动匹配方法及系统
CN112686306B (zh) * 2020-12-29 2023-03-24 山东众阳健康科技集团有限公司 基于图神经网络的icd手术分类自动匹配方法及系统
CN112700825A (zh) * 2020-12-30 2021-04-23 杭州依图医疗技术有限公司 医学数据的处理方法、装置及存储介质
CN112700825B (zh) * 2020-12-30 2024-03-05 杭州依图医疗技术有限公司 医学数据的处理方法、装置及存储介质
CN117708339A (zh) * 2024-02-05 2024-03-15 中南大学 一种基于预训练语言模型的icd自动编码方法
CN117708339B (zh) * 2024-02-05 2024-04-23 中南大学 一种基于预训练语言模型的icd自动编码方法

Also Published As

Publication number Publication date
CN110895580B (zh) 2020-07-07

Similar Documents

Publication Publication Date Title
CN109670179B (zh) 基于迭代膨胀卷积神经网络的病历文本命名实体识别方法
US20210375404A1 (en) Medical question-answering method, medical question-answering system, electronic device, and computer readable storage medium
CN109920501B (zh) 基于卷积神经网络和主动学习的电子病历分类方法及系统
CN109697285A (zh) 增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法
Tashkandi et al. Efficient in-database patient similarity analysis for personalized medical decision support systems
Yan et al. A restricted Boltzmann machine based two-lead electrocardiography classification
CN108399163A (zh) 结合词聚合与词组合语义特征的文本相似性度量方法
CN107193919A (zh) 一种电子病历的检索方法及系统
Dabowsa et al. A hybrid intelligent system for skin disease diagnosis
CN110895580B (zh) 一种基于深度学习的icd手术与操作编码自动匹配方法
US20170193197A1 (en) System and method for automatic unstructured data analysis from medical records
CN113889219A (zh) 一种用于慢性阻塞性肺疾病的药物推荐方法及系统
Liu et al. Hierarchical label-wise attention transformer model for explainable ICD coding
CN107705853A (zh) 临床营养风险筛查方法及系统
CN116910172B (zh) 基于人工智能的随访量表生成方法及系统
CN116386800B (zh) 基于预训练语言模型的医疗病历数据分割方法和系统
CN110400610B (zh) 基于多通道随机森林的小样本临床数据分类方法及系统
Jiang et al. Features fusion of multichannel wrist pulse signal based on KL-MGDCCA and decision level combination
Hasan et al. Integrating text embedding with traditional NLP features for clinical relation extraction
CN111128388A (zh) 一种值域数据匹配方法、装置及相关产品
CN116092699A (zh) 一种基于预训练模型的癌症问答交互方法
CN109767817A (zh) 一种基于神经网络语言模型的药物潜在不良反应发现方法
Wang et al. Shape decomposition and classification by searching optimal part pruning sequence
Jia et al. Traditional Chinese medicine symptom normalization approach leveraging hierarchical semantic information and text matching with attention mechanism
Du et al. Chinese word segmentation in electronic medical record text via graph neural network-bidirectional LSTM-CRF model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 12 / F, building 1, Aosheng building, 1166 Xinluo street, hi tech Zone, Jinan City, Shandong Province

Patentee after: Zhongyang Health Technology Group Co.,Ltd.

Address before: 250001 floor 12, building 1, Aosheng building, 1166 Xinluo street, high tech Zone, Jinan, Shandong Province

Patentee before: SHANDONG MSUNHEALTH TECHNOLOGY GROUP Co.,Ltd.