CN109698017A - 医疗病历数据生成方法及装置 - Google Patents
医疗病历数据生成方法及装置 Download PDFInfo
- Publication number
- CN109698017A CN109698017A CN201811519023.8A CN201811519023A CN109698017A CN 109698017 A CN109698017 A CN 109698017A CN 201811519023 A CN201811519023 A CN 201811519023A CN 109698017 A CN109698017 A CN 109698017A
- Authority
- CN
- China
- Prior art keywords
- medical record
- record data
- data
- network
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供的医疗病历数据生成方法及装置,涉及医疗病历数据生成技术领域。方法包括:获得多个样本病历数据,对各样本病历数据进行处理并编码后输入至预设生成式对抗网络中进行训练以得到一医疗病历模型,并采用医疗病历模型生成预设数量的医疗编码数据后进行解码处理以得到预设数量的医疗病历数据。通过采用上述方法可获得大量接近样本病历数据的医疗病历数据,进而便于根据获得医疗病历数据在科研和应用领域进行研究。
Description
技术领域
本发明涉及医疗病历数据生成技术领域,具体而言,涉及一种医疗病 历数据生成方法及装置。
背景技术
医疗信息和大数据的结合形成医疗大数据是医疗事业发展的必然趋 势,近年来,随着我国医疗病例数据的收集逐渐变得标准化、规范化,利 用人工智能技术对医疗病例数据进行分析处理的可行性逐步增大。
发明人经研究发现,由于对用户既往病史的隐私保护及医疗病例数据 管制体系带来的影响,以及数据采集过程漫长且资源消耗过多,临床医疗 病例数据难以申请和获取真实的医疗病例数据,进而在临床数据稀少甚至 缺失的情况下,在科研和应用领域内很难进行实质性的研究及生产,因此, 如何获取准确的医疗病历数据成为了当下急需解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种医疗病历数据生成方法及装置, 以有以实现准确获取医疗病历数据。
为实现上述目的,本发明实施例采用如下技术方案:
一种医疗病历数据生成方法,所述方法包括:
获得多个样本病历数据;
针对每个样本病历数据,对该样本病历数据进行处理,并对处理后的 样本病历数据进行编码得到样本编码数据;
将各所述样本编码数据输入至一预设生成式对抗网络进行训练得到一 病历模型;
采用所述病历模型生成预设数量的医疗编码数据,并对各所述医疗编 码数据进行解码处理得到医疗病历数据。
可选的,在上述病历数据生成方法中,每个所述样本病历数据包括用 户的身份信息、该用户的患病类型、该患病类型对应的患病次数以及所述 患病类型对应的患病时间,所述针对每个样本病历数据,对该样本病历数 据进行处理,并对处理后的样本病历数据进行编码得到样本编码数据的步 骤包括:
针对每个样本病历数据,根据该样本病历数据中的身份信息中包括的 出生日期和所述患病类型对应的患病时间得到该患病类型对应的患病时间 权重;
对该样本病历数据中的用户的每个患病类型采用ONE-HOT编码方式 进行编码,并根据编码后的每个患病类型和该患病类型对应的患病时间权 重得到样本编码数据。
可选的,在上述病历数据生成方法中,所述将各所述样本编码数据输 入至一预设生成式对抗网络进行训练得到一病历模型的步骤包括:
针对每个所述样本编码数据,分别将该样本编码数据转换为样本编码 图片;
将各样本编码图片加入噪声后输入至预设生成式对抗网络以进行训练 得到一病历模型。
可选的,在上述病历数据生成方法中,采用所述病历模型生成预设数 量的医疗编码数据,并对各所述医疗编码数据进行解码处理得到医疗病历 数据的步骤包括:
采用所述病历模型生成预设数量的医疗编码图片,并对各所述医疗编 码图片进行处理以得到医疗编码数据;
针对每个医疗编码数据分别采用ONE-HOT解码方式进行解码,以得 到医疗病历数据。
可选的,在上述病历数据生成方法中,在执行将各所述样本编码数据 输入至一预设生成式对抗网络以进行训练得到一病历模型的步骤之前,所 述方法还包括:
采用深度卷积神经网络模型构造包括生成网络和判别网络的生成式对 抗网络,并将该生成网络的卷积层级设置为十一层且第一卷积层到第十卷 积层采用relu函数、第十一层采用sigmoid函数,以及将所述对抗网络的卷 积层级设置为十三层且第一卷积层到第十二卷积层采用sigmoid函数、第十 三层采用relu函数;
接收用户针对该生成式对抗网络输入的网络结构配置参数并进行初始 化以得到所述预设生成式对抗网络,其中,所述网络结构配置参数包括所 述生成网络和判别网络分别对应的卷积核以及步长。
本发明还提供一种医疗病历数据生成装置,所述装置包括:
样本获得模块,用于获得多个样本病历数据;
编码模块,用于针对每个样本病历数据,对该样本病历数据进行处理, 并对处理后的样本病历数据进行编码得到样本编码数据;
模型训练模块,用于将各所述样本编码数据输入至一预设生成式对抗 网络进行训练得到一病历模型;
数据获得模块,用于采用所述病历模型生成预设数量的医疗编码数据, 并对各所述医疗编码数据进行解码处理得到医疗病历数据。
可选的,在上述病历数据生成装置中,每个所述样本病历数据包括用 户的身份信息、该用户的患病类型、该患病类型对应的患病次数以及所述 患病类型对应的患病时间,所述编码模块包括:
权重计算子模块,用于针对每个样本病历数据,根据该样本病历数据 中的身份信息中包括的出生日期和所述患病类型对应的患病时间得到该患 病类型对应的患病时间权重;
编码子模块,用于对该样本病历数据中的用户的每个患病类型采用 ONE-HOT编码方式进行编码,并根据编码后的每个患病类型和该患病类型 对应的患病时间权重得到样本编码数据。
可选的,在上述病历数据生成装置中,所述模型训练模块包括:
转换子模块,用于针对每个所述样本编码数据,分别将该样本编码数 据转换为样本编码图片;
模型生成子模块,用于将各样本编码图片加入噪声后输入至预设生成 式对抗网络以进行训练得到一病历模型。
可选的,在上述病历数据生成装置中,所述数据获得模块包括:
处理子模块,用于采用所述病历模型生成预设数量的医疗编码图片, 并对各所述医疗编码图片进行处理以得到医疗编码数据;
解码子模块,用于针对每个医疗编码数据分别采用ONE-HOT解码方 式进行解码,以得到医疗病历数据。
可选的,在上述病历数据生成装置中,所述装置还包括:
网络构建模块,用于采用深度卷积神经网络模型构造包括生成网络和 判别网络的生成式对抗网络,并将该生成网络的卷积层级设置为十一层且 第一卷积层到第十卷积层采用relu函数、第十一层采用sigmoid函数,以及 将所述对抗网络的卷积层级设置为十三层且第一卷积层到第十二卷积层采 用sigmoid函数、第十三层采用relu函数;
配置模块,用于接收用户针对该生成式对抗网络输入的网络结构配置 参数并进行初始化以得到所述预设生成式对抗网络,其中,所述网络结构 配置参数包括所述生成网络和判别网络分别对应的卷积核以及步长。
本发明提供的一种医疗病历数据生成方法及装置,方法包括:获得多 个样本病历数据,对各样本病历数据进行处理并编码后输入至预设生成式 对抗网络中进行训练以得到一医疗病历模型,并采用医疗病历模型生成预 设数量的医疗编码数据后进行解码处理以得到预设数量的医疗病历数据。 通过采用上述方法可获得大量接近样本病历数据的医疗病历数据,进而便 于根据获得医疗病历数据在科研和应用领域进行研究。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实 施例,并配合所附附图,作详细说明如下。
附图说明
图1为本发明实施例提供的电子设备的结构框图。
图2为本发明实施例提供的医疗病历数据生成方法的流程示意图。
图3为本发明实施例提供的医疗病历数据生成方法的另一流程示意图。
图4为本发明实施例提供的医疗病历数据生成装置的结构框图。
图5为本发明实施例提供的医疗病历数据生成装置的另一结构框图。
图标:10-电子设备;12-存储器;14-处理器;100-医疗病历数据生成 装置;110-样本获得模块;120-编码模块;130-模型训练模块;140-数据获 得模块;150-网络构建模块;160-配置模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本 发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描 述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实 施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不 同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限 制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本 发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获 得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一 旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步 定义和解释。
在本发明的描述中,除非另有明确的规定和限定,术语“设置”、“相连”、 “连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一 体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以 通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通 技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
请参阅图1,本发明提供的一种电子设备10,所述电子设备10可以是 电脑、服务器、手机或平板电脑等具有数据处理能力的设备。所述电子设 备10包括:存储器12和处理器14。
所述存储器12与处理器14相互之间直接或间接地电性连接,以实现 数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线 或信号线实现电性连接。存储器12中存储有以软件或固件(Firmware)的形 式存储于所述存储器12中的软件功能模块,所述处理器14通过运行存储 在存储器12内的软件程序以及模块,如本发明实施例中的医疗病历数据生 成装置100,从而执行各种功能应用以及数据处理,即实现本发明实施例中 的医疗病历数据生成方法。
所述存储器12可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存 储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器 (Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储 器(Electrically Erasable Programmable Read-Only Memory,EEPROM)等。其 中,存储器12用于存储程序,所述处理器14在接收到执行指令后,执行 所述程序。
所述处理器14可能是一种集成电路芯片,具有信号的处理能力。上述 的处理器14可以是通用处理器,包括中央处理器(Central Processing Unit, CPU)、网络处理器(Network Processor,NP)等。还可以是数字信号处理器 14(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程 逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执 行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是 微处理器或者该处理器也可以是任何常规的处理器等。
请参图2,本发明提供一种医疗病历数据生成方法,所述医疗病历数据 生成方法可应用于上述电子设备10,所述医疗病历数据生成方法应用于所 述电子设备10时实现以下步骤:
步骤S110:获得多个样本病历数据。
其中,获得多个样本病历数据的方式可以是接收用户输入的病历数据, 也可以是从数据库中获取多个病历数据,在此不作具体限定,根据实际需 求进行设置即可。
需要说明的是,所述样本病历数据为真实的病历数据,所述样本病历 数据中至少包括用户的出生日期,用户的患病类型和患病时间等,可以理 解,所述样本病历数据还可以包括用户的姓名、性别、体型、身份证信息 和/或居住地等信息。
步骤S120:针对每个样本病历数据,对该样本病历数据进行处理,并 对处理后的样本病历数据进行编码得到样本编码数据。
其中,对该样本病历数据进行处理可以是对所述样本病历数据中的姓 名、身份证信息等进行清除,还可以是对所述样本病历数据中的患病类型 和患病时间等进行处理。
可选的,在本实施例中,每个所述样本病历数据包括用户的身份信息、 该用户的患病类型、该患病类型对应的患病次数以及所述患病类型对应的 患病时间,步骤S120的可以包括:
针对每个样本病历数据,根据该样本病历数据中的身份信息中包括的 出生日期和所述患病类型对应的患病时间得到该患病类型对应的患病时间 权重。
其中,根据所述出生日期和所述患病类型对应的患病时间得到所述患 病时间权重可以是按照公式:T(患病时间权重)=(患病日期-出生日期) ×365得到,也可以是根据出生年限和患病年限得到,还可以是根据患病日 期减去出生日期乘以一个常数得到,在此不作具体限定,根据实际需求进 行设置即可。需要说明的是,考虑到某些病症的患病次数可能不止一次, 因此针对同一患病类型,对应的患病时间权重可以为多个,即每次患病分别对应有一患病时间权重。
对该样本病历数据中的用户的每个患病类型采用ONE-HOT编码方式 进行编码,并根据编码后的每个患病类型和该患病类型对应的患病时间权 重得到样本编码数据。
其中,可以将所有的样本病历数据中的患病种类可以包括第一类、第 二类、第三类…第N类,同一患病种类的患病次数可以是第一次、第二次…、 第m次,例如,当用户第m次换第三种病,对应的编码为[0,0,1,0…0, m]。进一步地,以一个样本病历数据中,用户患病三次,其中,第一次患 病对应的患病时间权重为第一权重,第二次患病对应第二权重,第三次患 病对应第三权重,第一次和第三次的患病种类为第三类型,第二次患病种 类为第一类为例进行说明,则用户的编码信息可以表示为:E(编码信息) =T1(第一权重)×[0,0,1,0…0,1]+T2(第二权重)[1,0,0,0…0, 1]+T3(第三权重)×[0,0,1,0…0,2],可以理解,该用户的编码信息 还可以按照矩阵的方式进行排列。
步骤S130:将各所述样本编码数据输入至一预设生成式对抗网络进行 训练得到一病历模型。
其中,步骤S130可以是,直接将所述样本编码数据输入至所述预设生 成式对抗网络,也可以是将各所述样本编码数据转换为图片后输入至该预 设生成式对抗网络中以进行训练,还可以是在所述样本病历数据转换为样 本病历图片并向各样本病历图片中加入噪点后输入至所述预设生成式对抗 网络中以进行训练。
可选的,在本实施例中,所述步骤S130包括:
针对每个所述样本编码数据,分别将该样本编码数据转换为样本编码 图片。
将各样本编码图片加入噪声后输入至预设生成式对抗网络以进行训练 得到一病历模型。
具体的,在本实施例中,预设生成式对抗网络包括生成网络和判别网 络,上述步骤将各样本编码图片加入噪声后输入至预设生成式对抗网络以 进行训练得到一病历模型可以是:采用加入噪声后的样本编码图片来训练 判别网,并获得判别网络的输出值,其中,判别网络的输出值的范围为0~1, 当值大于0.5时表示输入数据为真,当值小于0.5时表示输入数据为假,当 趋于0.5时完成训练。利用服从标准正态分布的随机噪声、隐变量c以及生 成网络通过来生成与样本编码图片具有相似编码数据的医疗病例图片,然 后用判别网络来判别该医疗病例图片是否为真;利用损失函数来交替训练 生成网络和判别网络,直到判别网络的输出接近0.5时模型训练完成,保存 训练好的生成模型,并加载模型文件,并通过控制隐变量c来生成各种类 型的病例编码图片。
步骤S140:采用所述病历模型生成预设数量的医疗编码数据,并对各 所述医疗编码数据进行解码处理得到医疗病历数据。
其中,所述预设数量的具体值大小可以是任意的,例如,可以是但不 限于50、100、500或1000,在此不作具体限定,根据实际需求进行设置即 可。
需要说明的是,上述生成的医疗编码数据的真实性与所述样本编码数 据的真实性趋于一致。这些医疗编码数据不仅多样性丰富,同时不同的数 据所记录的病人的健康程度也有所不同,且不同的病历具有不同的健康程 度。对所述医疗编码数据进行解码的方式应当与对样本病历数据进行编码 的方式为互逆的,因此,在本实施例中,当对所述样本病历数据采用 ONE-HOT编码方式进行编码时,相应的,对所述医疗编码数据进行解码的 方式为:采用ONE-HOT解码方式进行解码。
具体的,在本实施例中,所述步骤S140包括:
采用所述病历模型生成预设数量的医疗编码图片,并对各所述医疗编 码图片进行处理以得到医疗编码数据。
其中,将所述医疗编码图片进行处理以得到医疗编码数据的方式可以 是,采用图像识别的方式得到所述医疗编码式数据,也可以是采用数据拟 合的方式得到所述医疗编码数据,还可以是采用解码的方式得到所述医疗 编码数据,在此不作具体限定,根据实际需求进行设置即可。
针对每个医疗编码数据分别采用ONE-HOT解码方式进行解码,以得 到医疗病历数据。
通过采用上述方式,以实现通过基于现有的样本病历数据进行编码后 采用预设生成式对抗网络进行建模得到的病历模型,并基于该病历模型生 成大量的接近真实的样本病历数据的医疗病历数据,以使生成的医疗病例 数据更具研究价值和实用价值。
请参阅图3,为实现使获得的医疗病历数据真实性更高,在本实施例中, 在执行步骤S130之前,所述方法还包括:
步骤S150:采用深度卷积神经网络模型构造包括生成网络和判别网络 的生成式对抗网络,并将该生成网络的卷积层级设置为十一层且第一卷积 层到第十卷积层采用relu函数、第十一层采用sigmoid函数,以及将所述对 抗网络的卷积层级设置为十三层且第一卷积层到第十二卷积层采用sigmoid 函数、第十三层采用relu函数。
步骤S160:接收用户针对该生成式对抗网络输入的网络结构配置参数 并进行初始化以得到所述预设生成式对抗网络。
其中,所述网络结构配置参数可以包括所述生成网络和判别网络分别 对应的卷积核以及步长,以及所述预设生成式对抗网络的学习率,还可以 包括优化参数等信息。
请结合图4,在上述基础上,本发明还提供一种可应用于上述电子设备 10的医疗病历数据生成装置100,所述医疗病历数据生成装置100包括: 样本获得模块110、编码模块120、模型训练模块130以及数据获得模块140。
所述样本获得模块110,用于获得多个样本病历数据。在本实施例中, 所述样本获得模块110可用于执行图2所示的步骤S110,关于所述样本获 得模块110的具体描述可以参照前文对步骤S110的描述。
所述编码模块120,用于针对每个样本病历数据,对该样本病历数据进 行处理,并对处理后的样本病历数据进行编码得到样本编码数据。在本实 施例中,所述编码模块120可用于执行图2所示的步骤S120,关于所述编 码模块120的具体描述可以参照前文对步骤S120的描述。
在本实施例中,每个所述样本病历数据包括用户的身份信息、该用户 的患病类型、该患病类型对应的患病次数以及所述患病类型对应的患病时 间,所述编码模块120可以包括权重计算子模块和编码子模块。
所述权重计算子模块,用于针对每个样本病历数据,根据该样本病历 数据中的身份信息中包括的出生日期和所述患病类型对应的患病时间得到 该患病类型对应的患病时间权重。关于所述权重计算子模块的具体描述, 请参照前文对步骤S120的具体描述。
所述编码子模块,用于对该样本病历数据中的用户的每个患病类型采 用ONE-HOT编码方式进行编码,并根据编码后的每个患病类型和该患病 类型对应的患病时间权重得到样本编码数据。关于所述编码子模块的具体 描述,请参照前文对步骤S120的具体描述。
所述模型训练模块130,用于将各所述样本编码数据输入至一预设生成 式对抗网络进行训练得到一病历模型。在本实施例中,所述模型训练模块 130可用于执行图2所示的步骤S130,关于所述模型训练模块130的具体 描述可以参照前文对步骤S130的描述。
在本实施例中,所述模型训练模块130可以包括转换子模块和模型生 成子模块。
所述转换子模块,用于针对每个所述样本编码数据,分别将该样本编 码数据转换为样本编码图片。关于所述转换子模块的具体描述,请参照前 文对步骤S130的具体描述。
所述模型生成子模块,用于将各样本编码图片加入噪声后输入至预设 生成式对抗网络以进行训练得到一病历模型。关于所述模型生成子模块的 具体描述,请参照前文对步骤S130的具体描述。
所述数据获得模块140,用于采用所述病历模型生成预设数量的医疗编 码数据,并对各所述医疗编码数据进行解码处理得到医疗病历数据。在本 实施例中,所述数据获得模块140可用于执行图2所示的步骤S140,关于 所述数据获得模块140的具体描述可以参照前文对步骤S140的描述。
在本实施例中,所述数据获得模块140包括:处理子模块和解码子模 块。
所述处理子模块,用于采用所述病历模型生成预设数量的医疗编码图 片,并对各所述医疗编码图片进行处理以得到医疗编码数据。关于所述处 理子模块的具体描述可以参照前文对步骤S140的描述。
所述解码子模块,用于针对每个医疗编码数据分别采用ONE-HOT解 码方式进行解码,以得到医疗病历数据。关于所述解码子模块的具体描述 可以参照前文对步骤S140的描述。
请参阅图5,在本实施例中,所述病历数据生成装置还包括网络构建模 块150和配置模块160。
所述网络构建模块150,用于采用深度卷积神经网络模型构造包括生成 网络和判别网络的生成式对抗网络,并将该生成网络的卷积层级设置为十 一层且第一卷积层到第十卷积层采用relu函数、第十一层采用sigmoid函数, 以及将所述对抗网络的卷积层级设置为十三层且第一卷积层到第十二卷积 层采用sigmoid函数、第十三层采用relu函数。在本实施例中,所述网络构 建模块150可用于执行图3所示的步骤S150,关于所述网络构建模块150 的具体描述可以参照前文对步骤S150的描述。
所述配置模块160,用于接收用户针对该生成式对抗网络输入的网络结 构配置参数并进行初始化以得到所述预设生成式对抗网络,其中,所述网 络结构配置参数包括所述生成网络和判别网络分别对应的卷积核以及步 长。在本实施例中,所述配置模块160可以用于执行图3所示的步骤S160, 关于所述配置模块160的具体描述可以参照前文对步骤S150描述。
综上所述,本发明提供的一种医疗病历数据生成方法及装置,方法包 括:获得多个样本病历数据,对各样本病历数据进行处理并编码后输入至 预设生成式对抗网络中进行训练以得到一医疗病历模型,并采用医疗病历 模型生成预设数量的医疗编码数据后进行解码处理以得到预设数量的医疗 病历数据。通过采用上述方法可获得大量接近样本病历数据的医疗病历数 据,进而便于根据获得医疗病历数据在科研和应用领域进行研究。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置 和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅 仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实 施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。 在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码 的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规 定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中, 方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两 个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序 执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个 方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动 作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的 组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个 独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集 成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使 用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发 明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的 部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储 介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电 子设备,或者网络设备等)执行本发明各个实施例所述方法的全部或部分 步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM, Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、 磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中, 术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使 得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且 还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品 或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……” 限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还 存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于 本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精 神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明 的保护范围之内。
Claims (10)
1.一种医疗病历数据生成方法,其特征在于,所述方法包括:
获得多个样本病历数据;
针对每个样本病历数据,对该样本病历数据进行处理,并对处理后的样本病历数据进行编码得到样本编码数据;
将各所述样本编码数据输入至一预设生成式对抗网络进行训练得到一病历模型;
采用所述病历模型生成预设数量的医疗编码数据,并对各所述医疗编码数据进行解码处理得到医疗病历数据。
2.根据权利要求1所述的病历数据生成方法,其特征在于,每个所述样本病历数据包括用户的身份信息、该用户的患病类型、该患病类型对应的患病次数以及所述患病类型对应的患病时间,所述针对每个样本病历数据,对该样本病历数据进行处理,并对处理后的样本病历数据进行编码得到样本编码数据的步骤包括:
针对每个样本病历数据,根据该样本病历数据中的身份信息中包括的出生日期和所述患病类型对应的患病时间得到该患病类型对应的患病时间权重;
对该样本病历数据中的用户的每个患病类型采用ONE-HOT编码方式进行编码,并根据编码后的每个患病类型和该患病类型对应的患病时间权重得到样本编码数据。
3.根据权利要求1所述的病历数据生成方法,其特征在于,所述将各所述样本编码数据输入至一预设生成式对抗网络进行训练得到一病历模型的步骤包括:
针对每个所述样本编码数据,分别将该样本编码数据转换为样本编码图片;
将各样本编码图片加入噪声后输入至预设生成式对抗网络以进行训练得到一病历模型。
4.根据权利要求1所述的病历数据生成方法,其特征在于,采用所述病历模型生成预设数量的医疗编码数据,并对各所述医疗编码数据进行解码处理得到医疗病历数据的步骤包括:
采用所述病历模型生成预设数量的医疗编码图片,并对各所述医疗编码图片进行处理以得到医疗编码数据;
针对每个医疗编码数据分别采用ONE-HOT解码方式进行解码,以得到医疗病历数据。
5.根据权利要求1所述的病历数据生成方法,其特征在于,在执行将各所述样本编码数据输入至一预设生成式对抗网络以进行训练得到一病历模型的步骤之前,所述方法还包括:
采用深度卷积神经网络模型构造包括生成网络和判别网络的生成式对抗网络,并将该生成网络的卷积层级设置为十一层且第一卷积层到第十卷积层采用relu函数、第十一层采用sigmoid函数,以及将所述对抗网络的卷积层级设置为十三层且第一卷积层到第十二卷积层采用sigmoid函数、第十三层采用relu函数;
接收用户针对该生成式对抗网络输入的网络结构配置参数并进行初始化以得到所述预设生成式对抗网络,其中,所述网络结构配置参数包括所述生成网络和判别网络分别对应的卷积核以及步长。
6.一种医疗病历数据生成装置,其特征在于,所述装置包括:
样本获得模块,用于获得多个样本病历数据;
编码模块,用于针对每个样本病历数据,对该样本病历数据进行处理,并对处理后的样本病历数据进行编码得到样本编码数据;
模型训练模块,用于将各所述样本编码数据输入至一预设生成式对抗网络进行训练得到一病历模型;
数据获得模块,用于采用所述病历模型生成预设数量的医疗编码数据,并对各所述医疗编码数据进行解码处理得到医疗病历数据。
7.根据权利要求6所述的病历数据生成装置,其特征在于,每个所述样本病历数据包括用户的身份信息、该用户的患病类型、该患病类型对应的患病次数以及所述患病类型对应的患病时间,所述编码模块包括:
权重计算子模块,用于针对每个样本病历数据,根据该样本病历数据中的身份信息中包括的出生日期和所述患病类型对应的患病时间得到该患病类型对应的患病时间权重;
编码子模块,用于对该样本病历数据中的用户的每个患病类型采用ONE-HOT编码方式进行编码,并根据编码后的每个患病类型和该患病类型对应的患病时间权重得到样本编码数据。
8.根据权利要求6所述的病历数据生成装置,其特征在于,所述模型训练模块包括:
转换子模块,用于针对每个所述样本编码数据,分别将该样本编码数据转换为样本编码图片;
模型生成子模块,用于将各样本编码图片加入噪声后输入至预设生成式对抗网络以进行训练得到一病历模型。
9.根据权利要求6所述的病历数据生成装置,其特征在于,所述数据获得模块包括:
处理子模块,用于采用所述病历模型生成预设数量的医疗编码图片,并对各所述医疗编码图片进行处理以得到医疗编码数据;
解码子模块,用于针对每个医疗编码数据分别采用ONE-HOT解码方式进行解码,以得到医疗病历数据。
10.根据权利要求6所述的病历数据生成装置,其特征在于,所述装置还包括:
网络构建模块,用于采用深度卷积神经网络模型构造包括生成网络和判别网络的生成式对抗网络,并将该生成网络的卷积层级设置为十一层且第一卷积层到第十卷积层采用relu函数、第十一层采用sigmoid函数,以及将所述对抗网络的卷积层级设置为十三层且第一卷积层到第十二卷积层采用sigmoid函数、第十三层采用relu函数;
配置模块,用于接收用户针对该生成式对抗网络输入的网络结构配置参数并进行初始化以得到所述预设生成式对抗网络,其中,所述网络结构配置参数包括所述生成网络和判别网络分别对应的卷积核以及步长。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811519023.8A CN109698017B (zh) | 2018-12-12 | 2018-12-12 | 医疗病历数据生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811519023.8A CN109698017B (zh) | 2018-12-12 | 2018-12-12 | 医疗病历数据生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109698017A true CN109698017A (zh) | 2019-04-30 |
CN109698017B CN109698017B (zh) | 2020-11-27 |
Family
ID=66231593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811519023.8A Active CN109698017B (zh) | 2018-12-12 | 2018-12-12 | 医疗病历数据生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109698017B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110111885A (zh) * | 2019-05-09 | 2019-08-09 | 腾讯科技(深圳)有限公司 | 属性预测方法、装置、计算机设备及计算机可读存储介质 |
CN110176311A (zh) * | 2019-05-17 | 2019-08-27 | 北京印刷学院 | 一种基于对抗神经网络的自动医疗方案推荐方法和系统 |
WO2021159740A1 (zh) * | 2020-09-28 | 2021-08-19 | 平安科技(深圳)有限公司 | 一种样本生成方法、装置、服务器及存储介质 |
CN114613496A (zh) * | 2022-03-24 | 2022-06-10 | 姜妹英 | 基于人工智能的电子档案大数据挖掘健康评估方法及系统 |
CN116759041A (zh) * | 2023-08-22 | 2023-09-15 | 之江实验室 | 一种考虑诊疗事件关系的医疗时序数据生成方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590531A (zh) * | 2017-08-14 | 2018-01-16 | 华南理工大学 | 一种基于文本生成的wgan方法 |
US20180174052A1 (en) * | 2016-12-15 | 2018-06-21 | WaveOne Inc. | Using generative adversarial networks in compression |
CN108491497A (zh) * | 2018-03-20 | 2018-09-04 | 苏州大学 | 基于生成式对抗网络技术的医疗文本生成方法 |
CN108563624A (zh) * | 2018-01-03 | 2018-09-21 | 清华大学深圳研究生院 | 一种基于深度学习的自然语言生成方法 |
CN108897769A (zh) * | 2018-05-29 | 2018-11-27 | 武汉大学 | 基于生成式对抗网络实现文本分类数据集扩展方法 |
KR101925913B1 (ko) * | 2017-07-07 | 2018-12-06 | (주)싸이언테크 | 이미지의 진위 판별 시스템 및 그 방법 |
-
2018
- 2018-12-12 CN CN201811519023.8A patent/CN109698017B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180174052A1 (en) * | 2016-12-15 | 2018-06-21 | WaveOne Inc. | Using generative adversarial networks in compression |
KR101925913B1 (ko) * | 2017-07-07 | 2018-12-06 | (주)싸이언테크 | 이미지의 진위 판별 시스템 및 그 방법 |
CN107590531A (zh) * | 2017-08-14 | 2018-01-16 | 华南理工大学 | 一种基于文本生成的wgan方法 |
CN108563624A (zh) * | 2018-01-03 | 2018-09-21 | 清华大学深圳研究生院 | 一种基于深度学习的自然语言生成方法 |
CN108491497A (zh) * | 2018-03-20 | 2018-09-04 | 苏州大学 | 基于生成式对抗网络技术的医疗文本生成方法 |
CN108897769A (zh) * | 2018-05-29 | 2018-11-27 | 武汉大学 | 基于生成式对抗网络实现文本分类数据集扩展方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110111885A (zh) * | 2019-05-09 | 2019-08-09 | 腾讯科技(深圳)有限公司 | 属性预测方法、装置、计算机设备及计算机可读存储介质 |
WO2020224433A1 (zh) * | 2019-05-09 | 2020-11-12 | 腾讯科技(深圳)有限公司 | 基于机器学习的目标对象属性预测方法及相关设备 |
CN110111885B (zh) * | 2019-05-09 | 2023-09-19 | 腾讯科技(深圳)有限公司 | 属性预测方法、装置、计算机设备及计算机可读存储介质 |
CN110176311A (zh) * | 2019-05-17 | 2019-08-27 | 北京印刷学院 | 一种基于对抗神经网络的自动医疗方案推荐方法和系统 |
WO2021159740A1 (zh) * | 2020-09-28 | 2021-08-19 | 平安科技(深圳)有限公司 | 一种样本生成方法、装置、服务器及存储介质 |
CN114613496A (zh) * | 2022-03-24 | 2022-06-10 | 姜妹英 | 基于人工智能的电子档案大数据挖掘健康评估方法及系统 |
CN116759041A (zh) * | 2023-08-22 | 2023-09-15 | 之江实验室 | 一种考虑诊疗事件关系的医疗时序数据生成方法及装置 |
CN116759041B (zh) * | 2023-08-22 | 2023-12-22 | 之江实验室 | 一种考虑诊疗事件关系的医疗时序数据生成方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109698017B (zh) | 2020-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109698017A (zh) | 医疗病历数据生成方法及装置 | |
Storrs et al. | Diverse deep neural networks all predict human inferior temporal cortex well, after training and fitting | |
CN108090093B (zh) | 生成推荐结果的方法和装置 | |
CN109670626B (zh) | 预测模型分布方法以及预测模型分布系统 | |
Gurchiek et al. | Estimating biomechanical time-series with wearable sensors: A systematic review of machine learning techniques | |
WO2021179852A1 (zh) | 图像检测方法、模型训练方法、装置、设备及存储介质 | |
CN110457994A (zh) | 人脸图像生成方法及装置、存储介质、计算机设备 | |
CN113159143B (zh) | 基于跳跃连接卷积层的红外与可见光图像融合方法和装置 | |
CN107833605A (zh) | 一种医院病历信息的编码方法、装置、服务器及系统 | |
CN108932974A (zh) | 在线问诊分配医生的方法、装置、计算机设备和存储介质 | |
CN109657890A (zh) | 一种转账欺诈的风险确定方法及装置 | |
CN110335276B (zh) | 医学图像分割模型、方法、存储介质及电子设备 | |
CN109785944A (zh) | 基于数据分析的医院评价方法及相关产品 | |
CN109460821A (zh) | 一种神经网络压缩方法、装置、电子设备及存储介质 | |
CN109447155A (zh) | 一种人脸表情识别模型训练方法、装置及设备 | |
Kwon et al. | Complex deep neural networks from large scale virtual imu data for effective human activity recognition using wearables | |
CN109242709A (zh) | 估算医疗费用的方法和装置 | |
CN117557331A (zh) | 一种产品推荐方法、装置、计算机设备及存储介质 | |
CN109784645A (zh) | 一种医院科室绩效排名方法及装置 | |
Hellman et al. | A survey on entropy and economic behaviour | |
Rule et al. | Optimal encoding in stochastic latent-variable models | |
Hajifar et al. | Investigation of heterogeneity sources for occupational task recognition via transfer learning | |
Neri | The statistical distribution of noisy transmission in human sensors | |
Benneyan et al. | Data envelopment analysis of national healthcare systems and their relative efficiencies | |
CN105117468B (zh) | 一种网络数据处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |