CN116703441A - 一种基于知识图谱的医疗项目成本核算可视分析方法 - Google Patents
一种基于知识图谱的医疗项目成本核算可视分析方法 Download PDFInfo
- Publication number
- CN116703441A CN116703441A CN202310594326.0A CN202310594326A CN116703441A CN 116703441 A CN116703441 A CN 116703441A CN 202310594326 A CN202310594326 A CN 202310594326A CN 116703441 A CN116703441 A CN 116703441A
- Authority
- CN
- China
- Prior art keywords
- medical
- entity
- data
- cost accounting
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000007 visual effect Effects 0.000 title claims abstract description 32
- 238000004458 analytical method Methods 0.000 title claims abstract description 24
- 230000004927 fusion Effects 0.000 claims abstract description 11
- 238000005516 engineering process Methods 0.000 claims abstract description 9
- 238000013528 artificial neural network Methods 0.000 claims abstract description 5
- 238000003058 natural language processing Methods 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 34
- 238000000034 method Methods 0.000 claims description 16
- 238000013136 deep learning model Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 238000013527 convolutional neural network Methods 0.000 claims description 7
- 239000000463 material Substances 0.000 claims description 6
- 239000003086 colorant Substances 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 238000004659 sterilization and disinfection Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 206010002091 Anaesthesia Diseases 0.000 claims description 2
- 230000037005 anaesthesia Effects 0.000 claims 1
- 238000012800 visualization Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 4
- 238000012216 screening Methods 0.000 abstract description 3
- 238000006243 chemical reaction Methods 0.000 abstract description 2
- 238000013480 data collection Methods 0.000 abstract description 2
- 238000012423 maintenance Methods 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- 238000000605 extraction Methods 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000009411 base construction Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 1
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 1
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 1
- 241000792859 Enema Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 229910052788 barium Inorganic materials 0.000 description 1
- DSAJWYNOEDNPEQ-UHFFFAOYSA-N barium atom Chemical compound [Ba] DSAJWYNOEDNPEQ-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 235000009120 camo Nutrition 0.000 description 1
- 235000005607 chanvre indien Nutrition 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000000645 desinfectant Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000007920 enema Substances 0.000 description 1
- 229940095399 enema Drugs 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000011487 hemp Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012567 medical material Substances 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Finance (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种基于知识图谱的医疗项目成本核算可视分析方法,包括从第三方接口获取结构化与非结构化成本核算的基础数据;通过数据筛选、数据转化和数据归集处理抽取医院成本核算中的本体及其属性,所述本体主要有医疗资源、作业中心和医疗项目;然后采用自然语言处理技术从非结构化语料从抽取实体,并进行实体融合,构建实体知识库;接着基于神经网络技术建立起医疗资源与作业中心的关系,形成关系知识库;最后以可视化图谱的形式,展示医疗资源分配到医疗作业的关系及路径,使用力导向布局展示作业中心与医疗项目的紧密程度,体现成本消耗中占比。从而实现对医院成本核算中各个复杂环节进行可视化地展现分析。
Description
技术领域
本发明涉及数据处理分析技术领域,尤其涉及一种基于知识图谱的医疗项目成本核算可视分析方法。
背景技术
当前医疗项目成本核算主要采用作业成本法来对服务项目所有作业活动的追踪和统计,是以成本动因为分配要素,体现“项目消耗作业,作业消耗资源”的原则。然而其涉及的数据具有类型复杂、数据量庞大冗杂的特点,使得多源异构医院成本核算数据的集中管理、可视分析成为两大难题。如现有技术一种医疗成本分摊及效益计算的方法及系统(CN109460898A)和医疗项目成本核算方法、系统、电子设备及存储介质(CN114240494A),介绍了对医疗系统中不同费用资源项进行分类和分摊的方法。可以准确地记录和计算各个资源细项在每个科室以及每个医疗项目上分摊权重比例,但是大型公立医院的资源种类繁多,医疗科室数量近百,具体细化后的不同医疗项目达上万个,通过这些方法虽然能够实现成本的合理分摊,但是难以直观地建立起项目、作业、资源不同元素之间的直复杂度关系,无法清晰地表达一个医疗项目的成本构成。
发明内容
针对现有技术的不足,本发明提出了一种基于知识图谱的医疗项目成本核算可视分析方法,能够帮助医疗机构深入了解医疗项目成本构成情况,以及各项资源与项目支出间的关系,以直观、清晰易懂地方式呈现复杂的成本核算过程,从而更好地进行医疗费用管理和优化,提高医疗资源利用效率,同时也能够为医院决策提供重要数据支持。
一种基于知识图谱的医疗项目成本核算可视分析方法,包括以下步骤:
步骤1、基础数据获取
通过数据中间件从第三方接口中获取用于成本核算的基础数据,包括结构化语料和非结构化语料,用于构建医院成本核算的知识图谱。
优选的,所述基础数据包括通过数据中间件从医院第三方HIS、LIS、PACS、物资系统、财务系统、门诊住院系统、手麻系统、消毒供应系统、卫生耗材核算系统、总账系统、固定资产核算系统、工资核算管理系统中抽取的数据。
步骤2、本体定义
对步骤1获取的基础数据进行筛选、转化和数据归集处理,抽取其中的医疗资源、作业中心和医疗项目作为构建知识图谱的本体,存入关系数据库中。
优选的,采用可视化界面定义本体的关键属性。
步骤3、实体知识库构建
对于步骤1中得到的非结构化语料,采用自然语言处理技术抽取实体,构建实体定义表与属性定义表,并保存在关系数据库中。通过实体知识融合,以图数据库的形式构建实体知识库。
优选的,实体知识库构建的具体步骤为:
步骤3.1、实体信息标注抽取
通过Doc2Vec将非结构化语料投影到向量空间,生成每个单词对应的词向量。
步骤3.2、实体信息自动识别
将类别已知的词向量输入深度学习模型,计算模型输出的预测类别与实际编码类别间的偏差,反向传播更新深度学习模型的参数,直至模型偏差满足预设目标,使用训练后的深度学习模型识别步骤3.1得到的词向量所属的类别。
步骤3.3、实体信息融合
对于本体中涉及的不同实体,将其名称文本转换为词向量,使用词向量相似度算法匹配与数据库中的名称词向量比较,对表示相同概念的实体进行融合,并存储至图数据库中。
步骤4、关系知识库构建
定义所需的关系类别,所述关系包括一系列的成本动因。基于神经网络技术建立医疗资源与作业中心的关系,存储于图数据库中,形成关系知识库。
优选的,关系知识库构建具体包括以下步骤:
步骤4.1、关系注意力机制特征抽取
给定一个实体对包,使用分段池化卷积神经网络依次计算包中句子的语义嵌入表示γ i j :
其中,j=1,2,…m,、/>是可学习参数,d b 是隐藏层数,d c 是卷积核个数。
为每个句子分配对应的注意力分数β i j :
通过上述注意力分数来得到包级别的特征表示r i ,用于关系分类:
特征表示r i 经过线性变换后被送入到 Softmax分类器当中,计算关系类别P(ri|Si;θ):
其中,M r 是变换矩阵,上标T表示矩阵转置,b r 是偏置项,θ表示模型中的所有参数。在包级别的特征表示r i 上使用dropout来防止过拟合。
作为优选,分段池化卷积神经网络中的卷积核个数,隐藏层。
步骤4.2、关系模型训练
采用最小化交叉熵损失函数J(θ)训练步骤4.1中的网络模型:
其中,表示实体对包的集合,|B|表示实体对包的数量,/>表示对应的关系标签。
优选的,使用随机梯度下降(stochastic gradient descent,SGD)进行网络模型优化。
步骤4.3、关系推理保存
完成模型训练后,使用softmax 函数计算每个实体属于不同种类的概率,推理出不同实体之间概率值最大的关系,并将两个实体及其之间概率值最大的关系形成三元组存入图数据库,形成知识图谱。
步骤5、图谱可视化展示
利用可视化模块展示医疗资源分配到医疗作业的关系及路径,使用力导向布局展示作业中心与医疗项目的紧密程度,体现成本消耗中占比。
优选的,通过不同颜色或形状的气泡节点展示各类实体,实体间的关系用边相连并标注关系名称。将散乱的医疗资源、作业中心、医疗项目基础数据关联起来,针对每个医疗项目,构建一个医疗资源成本逐级分配到作业中心,作业中心成本聚合到医疗项目的知识网络图谱。
本发明具有以下有益效果:
本发明将结构化数据、非结构化数据进行特征抽取、数据建模,挖掘医疗资源、作业中心、医疗项目的勾稽关系,将异构医疗成本核算涉及的大数据进行可视化表达。能够更好地分析成本核算过程及相关要素的关联关系,追溯各个医疗项目的成本构成。本发明能够更好地增强医疗资源有效配置,还能对医院收益进行细粒度评估,为医院的管理、优化提供有效的数据支撑。
附图说明
图1为基于知识图谱的医疗项目成本核算可视分析方法流程图。
图2为实体知识库构建流程图。
图3为关系知识库构建流程图。
图4为实施例2中构建的医疗项目成本核算的知识图谱。
图5为实施例2中构建的作业中心成本核算的知识图谱。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
实施例1
本实施例提供一种基于知识图谱的医疗项目成本核算可视分析方法,如图1所示,包括以下步骤:
步骤1、基础数据获取
通过数据中间件从第三方接口中获取用于成本核算的基础数据,包括从医院第三方HIS、LIS、PACS、物资系统、财务系统、门诊住院系统、手麻系统、消毒供应系统、卫生耗材核算系统、总账系统、固定资产核算系统、工资核算管理系统中抽取的数据。对于其中的结构化数据,直接存入关系数据库中。
步骤2、本体定义
对步骤1获取的基础数据进行进行筛选、数据转化和数据归集处理,抽取其中的医疗资源、作业中心和医疗项目作为构建知识图谱的本体,采用可视化界面定义其关键属性,存入关系数据库中。
步骤3、实体知识库构建
如图2所示,对于步骤1中得到的非结构化语料,采用自然语言处理技术进行信息抽取,构建实体定义表及属性定义表保存在关系数据库中,再进行知识融合,形成实体知识库存储于图数据库中,具体步骤如下:
步骤3.1、实体信息标注抽取
通过Doc2Vec将非结构化语料投影到向量空间,生成每个单词对应的词向量。所述Doc2Vec在Word2vec的基础上增加了段落的向量表示,用于表示当前段落的主题或上下文。Doc2Vec将段落的向量表示与滑动窗口内的单词向量累加或平均值作为一个新的向量,并使用这个新向量预测当前词的词向量,通过不断迭代,为每个单词生成词向量标注;
步骤3.2、实体信息自动识别
使用类别已知的单词词向量对BiLSTM-CRF深度学习模型进行训练,自适应生成模型的输入、输出超参数,计算模型输出的预测类别与单词词向量实际类别的偏差,并反向传播更新模型参数,直至模型偏差符合预期设置。将训练后的模型用于推理步骤3.1中抽取的实体类别。
步骤3.3、实体信息融合
通过实体匹配的方法,将不同的实体融合起来,形成明确的实体关系,使得知识更加结构化,从而更好地反映知识本身的实际情况。对于本体中涉及的医疗资源、作业中心、医疗项目,首先将待匹配实体名称文本转换为词向量,然后使用词向量相似度算法与数据库中名称词向量比较,计算两词向量间的欧氏距离,最小欧氏距离对应的即为可以融合的实体,将其融合后存储至图数据库中。
步骤4、关系知识库构建
通过可视化界面定义关系类别,包括关系名称、关系属性定义表,保存在关系数据库中。如图3所示,针对实体对包中的句子,使用分段池化卷积神经网络计算其语义嵌入表示γ i j ,然后为每个句子分配对应的注意力分数β i j ,加权相加,得到该实体对包的特征表示r i 。将实体对包的特征表示r i 经过线性变换后输入Softmax分类器中,推理不同实体之间的关系,然后将两个实体及其对应的概率值最大的关系作为一个三元组,存入图数据库中,得到关系知识库。
步骤5、图谱可视化展示
利用Neo4j软件进行可视化分析,构建知识图谱,通过不同颜色的气泡节点区分不同类别的实体,实体的关系用边相连并标注关系名称,展示医疗资源分配到医疗作业的关系及路径,将散乱的医疗资源、作业中心、医疗项目三元组数据关联起来,使用力导向布局展示作业中心与医疗项目的紧密程度,体现成本消耗中占比。针对每个医疗项目,构建一个医疗资源成本逐级分配到作业中心,作业中心成本聚合到医疗项目的知识网络图谱。
实施例2
本实施例以医院放射科为例,介绍通过本方法对放射科进行医疗项目成本核算可视分析的过程。具体步骤如下:
步骤1、从物资系统、财务系统、卫生耗材核算系统、总账系统、固定资产核算系统以及工资核算管理系统中抽取成本费用数据,这部分数据为结构化数据,可以用于反应知识图谱中各实体间的关系强弱。从HIS系统中抽取医疗项目的诊断记录描述,这部分数据为非结构化数据,通过后续的处理,用于知识图谱中的实体及其关系的建模。
步骤2、通过可视化界面设置本体名称,包括医疗资源、作业中心和医疗项目。
步骤3、以医疗资源为例,在HIS系统的诊断记录中,记载的医疗项目有CT扫描、MRI、X光等,涉及的医疗资源包括:①信息资源:放射科检查设备和系统;②人力资源:放射科医生、技师和护士等医疗人员,以及管理人员和支持人员等;③物质资源:卫生耗材、药品、放射性物品、影像记录介质等;④财务资源:建筑物折旧、无形资产摊销、办公费用、水费等。需要利用自然语言处理技术从原始数据中抽取出这些医疗资源实体,构建实体定义表及属性定义表保存在关系数据库中,再进行知识融合,存储于图数据库中得到医疗资源的实体知识库,具体步骤如下:
步骤3.1、收集医疗资源信息,剔除其中的无用数据和噪声数据后,手动标注实体类别。通过Doc2Vec抽取实体数据的特征信息,将文本数据转换为特征向量,存储在训练集中。设置可标注的实体类别包括:人员经费、卫生耗材、房屋及建筑物折旧、无形资产摊销、办公费用、水费、电费、房屋维修、租赁费、物业管理费、设备折旧。
步骤3.2、将步骤3.1中的训练集数据输入BiLSTM-CRF深度学习模型中,将模型输出的预测类别与手动标注的类别进行对比,更新模型参数。将步骤1收集的非结构化数据通过Doc2Vec进行特征抽取后,输入训练后的BiLSTM-CRF深度学习模型中,输出对应的实体类别,完成医疗资源实体信息的自动识别。
步骤3.3、由于抽取的一个实体可能有多种表达,或者一个特定的类别会对应多个不同的实体,为了消除这些矛盾和歧义,需要对识别的实体进行整合,即知识融合。该步骤通过提取每个医疗资源实体的代表性属性特征,与数据库中保存类别进行相似度计算,从而将不同的医疗资源实体融合,例如,在计算设备折旧费实体是否重复时,可以根据设备类型、购置时间、使用年限等多个属性特征进行比较。表1为医疗资源实体融合结果:
表1
医疗资源实体 | 相似医疗资源实体 | 成本数据来源 |
人员经费 | 医师收费、技师收费、护理费 | 工资核算管理系统 |
卫生耗材 | 卫生用品、医用材料、医疗耗材、医疗用品、医用耗材 | 卫生耗材核算系统 |
房屋及建筑物折旧 | 产权形成成本、投资回收成本、资本分摊 | 固定资产核算系统 |
设备折旧 | 固定资产折旧、设备价值减少费用、固定资产减值、设备损耗费用、设备耗损费 | 固定资产核算系统 |
无形资产摊销 | 无形资产折旧、无形资产分摊、无形资产摊销费用 | 财务系统 |
办公费用 | 办公用品支出、办公用品费用支出、办公设备维护支出、办公物资费用支出、办公室用品支出 | 财务系统 |
水费 | 水资源费用、水费支出、水消耗支出、水务支出、水务费用 | 财务系统 |
电费 | 电力支出、电力费用、电力消耗支出、电力管理费用、电网支出 | 财务系统 |
房屋维修 | 房屋修理费、建筑维护费用、房屋维护费、建筑保养费用、建筑物维修费用 | 财务系统 |
租赁费 | 租金费用、租金支出、租赁支出、租赁费用 | 财务系统 |
物业管理费 | 物业服务费用、物业维护费用、物业管理费用、物业费用 | 财务系统 |
同理,通过上述方法,构建作业中心与医疗项目的实体知识库。所述作业中心实体知识库中的实体包括:闲置中心作业、管理协调作业、医生开单作业、预约作业、拍片作业、后处理作业、报告作业。医疗项目实体知识库中的实体包括:DR项目、CT项目、MR项目、造影项目、CT下穿刺项目、CT下增强CTA项目、CT下灌肠项目、CT下增强项目。
步骤4、提取HIS系统诊断记录中的语义信息和上下文信息,建立作业中心与医疗资源之间的关联关系,构建关系知识库。例如,抽取拍片作业涉及的实体对包,经过数据清洗后的句子样例如表2所示,使用分段池化卷积神经网络计算其语义嵌入表示γ i j ,然后为每个句子分配对应的注意力分数β i j ,加权相加后将特征表示r i 输入Softmax分类器,推理两个实体之间的关系:
表2
实体对包的句子样例 | 实体对包 | 关系 |
拍片作业需要办公场所和相关设施支持 | 拍片作业—办公费用 | 平均分配 |
拍片作业需要相关专业技术人员进行操作和分析 | 拍片作业—人员经费 | 人员工时 |
拍片作业需要各种耗材支持,如胶片、钡剂、消毒液等 | 拍片作业—耗材 | 标准用量 |
拍片作业需要有一个固定场所进行操作和管理 | 拍片作业—房屋及建筑物折旧 | 固定资产折旧 |
拍片作业数字化X光机的电费开销就比较大 | 拍片作业—设备折旧 | 固定资产折旧 |
拍片作业需要使用各种设备,如数字化X光机、CT机等 | 拍片作业—电费 | 标准用量 |
步骤5、根据步骤4构建的关系知识库,可以得到医疗资源与作业中心、作业中心与医疗项目之间的关系,通过不同颜色的气泡节点区分不同类别的实体,实体的关系用边相连并标注关系名称,展示医疗资源分配到医疗作业的关系及路径。例如,与MR项目成本核算关联的作业中心实体有医生开单作业、预约作业、拍片作业、后处理作业和报告作业,其成本核算的知识图谱如图4所示。进一步建立作业中心与医疗资源之间的关系,分析当前作业的成本构成,根据医疗资源的实体名称,从第三方系统中获取对应资源的成本费用,成本费用的数值占比表示医疗资源与作业中心的实体之间的关系强弱。例如,拍片作业的成本核算关联的医疗资源实体有设备费、人员经费、办公费用、电费、设备折旧、房屋折旧和耗材,其成本核算的知识图谱如图5所示。
通过上述方式,即可为放射科中构建一个医疗资源成本逐级分配到作业中心,作业中心成本聚合到医疗项目的知识网络图谱。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种基于知识图谱的医疗项目成本核算可视分析方法,通过数据中间件从第三方接口中获取基础数据,包括结构化语料和非结构化语料,进行医疗项目的成本核算,其特征在于:该方法具体包括以下步骤:
步骤1、本体定义
抽取基础数据中的医疗资源、作业中心和医疗项目作为构建知识图谱的本体,定义其属性后,存入关系数据库中;
步骤2、实体知识库构建
采用自然语言处理技术从非结构化语料中抽取实体的特征向量,利用训练后的深度学习模型,判断实体类别;通过实体知识融合,消除不同实体间的矛盾和歧义,然后以图数据库的形式保存实体知识库;
步骤3、关系知识库构建
定义医疗项目成本核算相关的关系类别,所述关系为不同实体间的成本动因;基于神经网络技术建立医疗资源与作业中心、作业中心与医疗项目两两之间的关系,存储于图数据库中,形成关系知识库;
步骤4、图谱可视化展示
根据步骤3得到的关系知识库,利用可视化模块展示医疗资源成本逐级分配到作业中心,作业中心成本聚合到医疗项目的知识网络图谱。
2.如权利要求1所述一种基于知识图谱的医疗项目成本核算可视分析方法,其特征在于:所述基础数据包括通过数据中间件从医院第三方HIS、LIS、PACS、物资系统、财务系统、门诊住院系统、手麻系统、消毒供应系统、卫生耗材核算系统、总账系统、固定资产核算系统、工资核算管理系统中抽取的数据。
3.如权利要求1所述一种基于知识图谱的医疗项目成本核算可视分析方法,其特征在于:对关系数据库中存储的各类本体数据,手动标注其实体类别,作为数据标签;通过Doc2Vec语义分析模型投影到向量空间,得到对应的特征数据;将特征数据和数据标签组成训练数据,用于训练深度学习模型。
4.如权利要求1或3所述一种基于知识图谱的医疗项目成本核算可视分析方法,其特征在于:对于未知的非结构化语料,提取其向量特征,然后输入训练后的深度学习模型中,得到其对应的实体类别。
5.如权利要求1所述一种基于知识图谱的医疗项目成本核算可视分析方法,其特征在于:对于本体中涉及的医疗资源、作业中心、医疗项目,首先将待匹配实体名称文本转换为词向量,然后使用词向量相似度算法与关系数据库中的名称词向量比较,计算两词向量间的欧氏距离,将待匹配实体与关系数据库中距离最近的实体融合,并将结果存储至图数据库中。
6.如权利要求1所述一种基于知识图谱的医疗项目成本核算可视分析方法,其特征在于:非结构化语料中句子的语义信息和上下文信息隐藏了实体间的关系,将句子组成实体对包,利用神经网络技术推理不同实体之间的关系,得到关系知识库。
7.如权利要求1所述一种基于知识图谱的医疗项目成本核算可视分析方法,其特征在于:使用分段池化卷积神经网络依次计算实体对包中各个句子的语义嵌入表示γ i j :
;
其中,j=1,2,…m,、/>是可学习参数,d b 是隐藏层数,d c 是卷积核个数;为每个句子分配对应的注意力分数β i j :
;
对包中各句子的语义嵌入表示进行加权求和,得到包级别的特征表示r i :
;
特征表示r i 经过线性变换后被送入到 Softmax分类器当中,计算实体对之间的关系类别P(ri|Si;θ):
;
其中,M r 是变换矩阵,上标T表示矩阵转置,b r 是偏置项,θ表示分段池化卷积神经网络中的所有参数。
8.如权利要求7所述一种基于知识图谱的医疗项目成本核算可视分析方法,其特征在于:分段池化卷积神经网络中的卷积核个数,隐藏层/>。
9.如权利要求7所述一种基于知识图谱的医疗项目成本核算可视分析方法,其特征在于:采用最小化交叉熵损失函数J(θ)训练分段池化卷积神经网络,使用随机梯度下降进行优化参数θ:
;
其中,表示实体对包的集合,|B|表示实体对包的数量,/>表示对应的关系标签。
10.如权利要求1所述一种基于知识图谱的医疗项目成本核算可视分析方法,其特征在于:通过不同颜色或形状的气泡节点展示各类实体,实体间的关系用边相连并标注关系名称,边的长短对应该关系的成本费用占总费用的比例大小。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310594326.0A CN116703441A (zh) | 2023-05-25 | 2023-05-25 | 一种基于知识图谱的医疗项目成本核算可视分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310594326.0A CN116703441A (zh) | 2023-05-25 | 2023-05-25 | 一种基于知识图谱的医疗项目成本核算可视分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116703441A true CN116703441A (zh) | 2023-09-05 |
Family
ID=87828504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310594326.0A Pending CN116703441A (zh) | 2023-05-25 | 2023-05-25 | 一种基于知识图谱的医疗项目成本核算可视分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116703441A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109271530A (zh) * | 2018-10-17 | 2019-01-25 | 长沙瀚云信息科技有限公司 | 一种疾病知识图谱构建方法和平台系统、设备、存储介质 |
CN110019839A (zh) * | 2018-01-03 | 2019-07-16 | 中国科学院计算技术研究所 | 基于神经网络和远程监督的医学知识图谱构建方法和系统 |
CN111522961A (zh) * | 2020-04-09 | 2020-08-11 | 武汉理工大学 | 一种基于注意力机制及实体描述的产业图谱构建方法 |
CN111639190A (zh) * | 2020-04-30 | 2020-09-08 | 南京理工大学 | 医疗知识图谱构建方法 |
CN111832307A (zh) * | 2020-07-09 | 2020-10-27 | 北京工业大学 | 一种基于知识增强的实体关系抽取方法及系统 |
US20210004672A1 (en) * | 2019-07-03 | 2021-01-07 | International Business Machines Corporation | Unary relation extraction using distant supervision |
CN112800243A (zh) * | 2021-02-04 | 2021-05-14 | 天津德尔塔科技有限公司 | 一种基于知识图谱的项目预算分析方法及系统 |
CN113378573A (zh) * | 2021-06-24 | 2021-09-10 | 北京华成智云软件股份有限公司 | 面向内容大数据的小样本关系抽取方法和装置 |
WO2022022045A1 (zh) * | 2020-07-27 | 2022-02-03 | 平安科技(深圳)有限公司 | 基于知识图谱的文本比对方法、装置、设备及存储介质 |
-
2023
- 2023-05-25 CN CN202310594326.0A patent/CN116703441A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019839A (zh) * | 2018-01-03 | 2019-07-16 | 中国科学院计算技术研究所 | 基于神经网络和远程监督的医学知识图谱构建方法和系统 |
CN109271530A (zh) * | 2018-10-17 | 2019-01-25 | 长沙瀚云信息科技有限公司 | 一种疾病知识图谱构建方法和平台系统、设备、存储介质 |
US20210004672A1 (en) * | 2019-07-03 | 2021-01-07 | International Business Machines Corporation | Unary relation extraction using distant supervision |
CN111522961A (zh) * | 2020-04-09 | 2020-08-11 | 武汉理工大学 | 一种基于注意力机制及实体描述的产业图谱构建方法 |
CN111639190A (zh) * | 2020-04-30 | 2020-09-08 | 南京理工大学 | 医疗知识图谱构建方法 |
CN111832307A (zh) * | 2020-07-09 | 2020-10-27 | 北京工业大学 | 一种基于知识增强的实体关系抽取方法及系统 |
WO2022022045A1 (zh) * | 2020-07-27 | 2022-02-03 | 平安科技(深圳)有限公司 | 基于知识图谱的文本比对方法、装置、设备及存储介质 |
CN112800243A (zh) * | 2021-02-04 | 2021-05-14 | 天津德尔塔科技有限公司 | 一种基于知识图谱的项目预算分析方法及系统 |
CN113378573A (zh) * | 2021-06-24 | 2021-09-10 | 北京华成智云软件股份有限公司 | 面向内容大数据的小样本关系抽取方法和装置 |
Non-Patent Citations (3)
Title |
---|
刘鉴;张怡;张勇;: "基于双向LSTM和自注意力机制的中文关系抽取研究", 山西大学学报(自然科学版), no. 01 * |
尹鹏: "基于短语级注意力机制的关系抽取方法", 计算机技术与发展》, vol. 29, no. 9, pages 24 - 29 * |
张文学等: "《药品安全舆情的知识图谱获取方法与应用研究》", 燕山大学出版社, pages: 12 - 14 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zabin et al. | Applications of machine learning to BIM: A systematic literature review | |
US11562143B2 (en) | Artificial intelligence (AI) based document processor | |
Fu et al. | Data-driven multiple criteria decision making for diagnosis of thyroid cancer | |
Chute et al. | A framework for comprehensive health terminology systems in the United States: development guidelines, criteria for selection, and public policy implications | |
Liaw et al. | Towards an ontology for data quality in integrated chronic disease management: a realist review of the literature | |
Sentas et al. | Software productivity and effort prediction with ordinal regression | |
US7401057B2 (en) | Entity centric computer system | |
Payne et al. | Conceptual knowledge acquisition in biomedicine: A methodological review | |
Roy et al. | Healthcare services: A systematic review of patient-centric logistics issues using simulation | |
Morid et al. | Learning hidden patterns from patient multivariate time series data using convolutional neural networks: A case study of healthcare cost prediction | |
Post et al. | Protempa: A method for specifying and identifying temporal sequences in retrospective data for patient selection | |
CN111429161A (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
Tepe et al. | Spatio-temporal multinomial autologistic modeling of land-use change: A parcel-level approach | |
Chung et al. | Inventor group identification approach for selecting university-industry collaboration partners | |
Hu et al. | A practice mining system for the delivery of sustainable retirement villages | |
CA3118095C (en) | Artificial intelligence (ai) based document processor | |
Valmohammadi et al. | Analyzing the interaction of the challenges of big data usage in a cloud computing environment | |
Lin et al. | A content-boosted collaborative filtering algorithm for personalized training in interpretation of radiological imaging | |
Prokofyeva et al. | Clinical pathways analysis of patients in medical institutions based on hard and fuzzy clustering methods | |
Vathy-Fogarassy et al. | Multi-level process mining methodology for exploring disease-specific care processes | |
Wang et al. | Tourism demand interval forecasting amid COVID-19: a hybrid model with a modified multi-objective optimization algorithm | |
Khademolqorani et al. | Development of a decision support system for handling health insurance deduction | |
CN111383123A (zh) | 临床医疗开销的统计方法、装置、存储介质及电子设备 | |
CN116703441A (zh) | 一种基于知识图谱的医疗项目成本核算可视分析方法 | |
CN114188036A (zh) | 一种手术方案评估方法、装置、系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |