CN116894685B - 一种面向医疗行为片段的费用自动测算方法与系统 - Google Patents

一种面向医疗行为片段的费用自动测算方法与系统 Download PDF

Info

Publication number
CN116894685B
CN116894685B CN202311164978.7A CN202311164978A CN116894685B CN 116894685 B CN116894685 B CN 116894685B CN 202311164978 A CN202311164978 A CN 202311164978A CN 116894685 B CN116894685 B CN 116894685B
Authority
CN
China
Prior art keywords
medical
medical behavior
expense
behavior
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311164978.7A
Other languages
English (en)
Other versions
CN116894685A (zh
Inventor
李劲松
邢金栓
杨宗峰
吴承凯
周天舒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN202311164978.7A priority Critical patent/CN116894685B/zh
Publication of CN116894685A publication Critical patent/CN116894685A/zh
Application granted granted Critical
Publication of CN116894685B publication Critical patent/CN116894685B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种面向医疗行为片段的费用自动测算方法与系统。通过预处理医疗行为记录,获得每家医院每个患者目标文本集;针对不同医疗行为预定义费用类型,基于目标文本集属地标准医疗服务价格手册,构建多层级分类费用词库,然后使用智能文本分类技术将医疗行为记录切分为不同类型的医疗行为片段,精准定位费用支出线索,进一步地从医疗行为片段中生成关键短语,在关键短语和标准费用词库之间建立关联关系,确定每段医疗行为片段的费用。本发明实现了对临床医疗行为记录产生的实际费用的自动化、智能化测算,有利于为临床相关人员提供费用检查的参考依据,从而解决了人工工作量大和效率低下的问题。

Description

一种面向医疗行为片段的费用自动测算方法与系统
技术领域
本发明涉及医疗费用测算领域,尤其涉及一种面向医疗行为片段的费用自动测算方法与系统。
背景技术
公立医院医疗费用问题一直是全社会普遍关注的焦点。医疗费用信息的准确是医院业务管理的重要环节,也是医保基金有效使用的基本保障。
医疗总费用主要包括临床医疗行为过程中发生的医学检查、医学化验、手术、药物等类型的医疗服务项目。医院收费主要依据《全国医疗服务价格项目规范》和属地《公立医院医疗服务价格手册》。目前医疗机构费用管理主要以人工手段为主,涉及众多科室和不同角色,医生、护士、药剂人员、医技人员、物价库管理人员、收费人员等,不仅需要花费大量的时间和精力,而且存在一些可能的收费问题。例如,患者因为某些自身原因没有接受某项治疗,造成多收费,已收的费用需要患者自己去申请退费,找临床医生签字确认,容易出现不必要的医患纠纷;临床上患者因病情变化或和先前预期判断不一致,临时更换治疗方案,在完成治疗后需要人工进行其对应的治疗费和材料费的补录,这种情况下,可能会导致费用的错收、漏收。
为了保证医疗收费的真实性和准确性,在目前的医疗系统中,通常需要临床护士对患者出院时的总费用进行逐一比对,查阅医疗过程中化验检查、手术操作和药品耗材等方面的记录,分析收费项目和临床实际医疗行为的一致性,查看患者有无漏费情况或多收、错收费情况,工作量非常大,导致对人工收费的检查并未得到实质性的效果。
发明内容
本发明目的在于针对现有技术的不足,提出一种面向医疗行为片段的费用自动测算方法与系统。
本发明的目的是通过以下技术方案来实现的:第一方面,本发明提供了一种面向医疗行为片段的费用自动测算方法,该方法包括以下步骤:
(1)预处理医疗行为记录:对医疗行为记录进行预处理,获得每家医院每个患者待处理的医疗行为记录目标文本集;
(2)预设标准费用词库:针对不同医疗行为预定义费用类型,基于目标文本集属地标准医疗服务价格手册,构建多层级分类费用词库;
(3)医疗行为记录切分:基于目标文本集句子上下文关系,将医疗行为记录切分为多个医疗行为片段,计算每个医疗行为片段对应的标准费用类型;
(4)医疗行为片段费用测算:从医疗行为片段中生成关键短语,在关键短语和多层级分类费用词库之间建立关联关系,确定每段医疗行为片段的费用。
进一步地,步骤(1)中,医疗行为记录为对患者病情和诊疗过程所进行的连续性记录,包括入院记录、病程记录、护理记录和出院记录中的一种或多种,并去掉与过程无关的冗余信息,仅保留记录经过主体部分。
进一步地,步骤(2)中,预定义费用类型具体为针对不同医疗行为对应的费用类型的层级结构差异,将医疗行为记录中关联的医疗费用类型进行预设,包括化验检查费用、治疗患者病症的药品和耗材费用以及手术治疗费用。
进一步地,步骤(3)中,每个医疗行为片段包含医疗行为记录目标文本集中一个或者多个句子,每个医疗行为片段所属的标准费用类型为概率最大的一个类别;对于医疗行为记录目标文本集中的第一个句子,计算属于标准费用类型的最大概率,若大于设定的概率阈值,则记为医疗行为片段,继续进行计算第二个句子;否则,则将第一个句子和第二个句子组合一起计算属于标准费用类型的最大概率,继续判断是否大于设定的概率阈值,依此类推,直到大于设定的概率阈值,将对应的句子组合记为医疗行为片段。
进一步地,步骤(3)中,每个医疗行为片段包含一项完整的诊疗手段,计算每个医疗行为片段对应的标准费用类型,将医疗行为片段与标准费用类型下的多层级分类费用词库进行匹配,得到每个医疗行为片段产生的费用。
进一步地, 步骤(4)中,医疗行为片段包含若干个字符,将中英文的所有字符构成字符集合,并在字符集合中加入表示结束的字符,对于字符集合中任意字符,计算医疗行为片段的关键短语的第k个位置的字符的概率,包括两部分之和:从医疗行为片段原文中提取的关键短语的第k个位置字符概率和基于医疗行为片段的语义生成的关键短语的第k个位置字符的概率;
关键短语的第k个位置的字符的概率计算结果中概率最大的字符即为关键短语第k个位置实际取到的字符;依次计算关键短语每个位置实际的字符,当遇到字符集合中结束的字符时,表示已经到了关键短语的结尾处,将计算得到的每个位置上的字符连起来,得到医疗行为片段的关键短语。
进一步地,步骤(4)中,将医疗行为片段的关键短语匹配到多层级分类费用词库,优先匹配最深层级的费用词库,计算关键短语和最深层级费用词库的任意费用短语的相似度,若大于设定的相似度阈值,则将关键短语和对应费用短语所在的费用词库之间建立关联关系;否则取相似度最大的若干个费用短语,在对应类型的费用词库中找到每一个短语的父级费用短语,统计其中出现次数最多的父级费用短语,将其记作医疗行为片段的父级费用短语,提交给专家进行审核校验,将医疗行为记录包含的所有医疗行为片段的费用相加,得到医疗行为记录的全部费用。
第二方面,本发明还提供了一种面向医疗行为片段的费用自动测算系统,该系统包括预处理医疗行为记录模块、预设标准费用词库模块、医疗行为记录切分模块和医疗行为片段费用测算模块;
所述预处理医疗行为记录用于对医疗行为记录进行预处理,获得每家医院每个患者待处理的医疗行为记录目标文本集;
所述预设标准费用词库用于针对不同医疗行为预定义费用类型,基于目标文本集属地标准医疗服务价格手册,构建多层级分类费用词库;
所述医疗行为记录切分用于基于目标文本集句子上下文关系,将医疗行为记录切分为多个医疗行为片段,计算每个医疗行为片段对应的标准费用类型;
所述医疗行为片段费用测算用于从医疗行为片段中生成关键短语,在关键短语和多层级分类费用词库之间建立关联关系,确定每段医疗行为片段的费用。
第三方面,本发明还提供了一种面向医疗行为片段的费用自动测算装置,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现所述的一种面向医疗行为片段的费用自动测算方法。
第四方面,本发明还提供了一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时,实现所述的一种面向医疗行为片段的费用自动测算方法。
本发明的有益效果:本发明提出将医疗行为记录和基于医疗服务项目价格手册建立的标准费用词库结合,并且自动在两者之间建立关联关系,构建了一种面向医疗行为片段的费用自动测算方法,实现了对真实世界医疗行为产生的实际费用的有效近似。本发明首先预处理医疗行为记录,获得每家医院每个患者目标文本集,其次针对不同医疗行为预定义费用类型,基于目标文本集属地标准医疗服务价格手册,构建多层级分类费用词库,然后使用智能文本分类技术将医疗行为记录切分为不同类型的医疗行为片段,自动识别其中包含的医疗行为片段的数量及其对应的收费项目类别,具有较高的自由度和泛化性,并且保证得到的医疗行为片段恰好包含一个完整的收费项目,不会过长或过短。进一步地结合短语抽取和语义生成方法从医疗行为片段中获取标准费用的关键短语,用于医疗行为片段和标准费用词库之间建立关联关系,解决二者之间存在信息量不对等的问题,在这个过程中既丢弃了重要性较低的信息,也避免了有效信息的缺失。最后构建了针对医疗行为片段的关键短语和分类标准费用词库的分层匹配模型,这样做的优点是考虑到了费用子级匹配不足的情况,标注父级标准费用短语,以便缩小检索范围,降低人工匹配难度。本发明实现了对临床医疗行为记录产生的实际费用的自动化、智能化测算,有利于为临床相关人员提供费用检查的参考依据,从而解决了人工工作量大和效率低下的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1为本发明提供的一种面向医疗行为片段的费用自动测算方法流程图。
图2为本发明提供的一种面向医疗行为片段的费用自动测算过程逻辑图。
图3为本发明提供的医疗行为记录切分和费用测算的算法原理图。
图4为本发明提供的父级标准费用短语匹配示意图。
图5为本发明提供的一种面向医疗行为片段的费用自动测算系统的结构示意图。
图6为本发明提供的一种面向医疗行为片段的费用自动测算装置的结构图。
具体实施方式
以下结合附图对本发明具体实施方式作进一步详细说明。
本发明首先通过预处理医疗行为记录,获得每家医院每个患者目标文本集;其中医疗行为记录指一定时间周期,如一天、一周或一个治疗周期内,通过各种检查、使用药物、器械及手术等方法,帮助患者恢复健康采取的一系列医疗活动的详细记录。其次针对不同医疗行为预定义费用类型,基于目标文本集属地标准医疗服务价格手册,构建多层级分类费用词库,然后使用智能文本分类技术将医疗行为记录切分为不同类型的医疗行为片段,精准定位费用支出线索,进一步地从医疗行为片段中生成关键短语,在关键短语和标准费用词库之间建立关联关系,确定每段医疗行为片段的费用。医疗行为记录和医疗行为片段之间存在一对多的关系,每个医疗行为片段应该包含一项完整的诊疗手段,对应不同类型的收费项目。一段医疗行为记录可以同时包含检查、化验、手术记录等医疗行为片段。本发明实现了对临床医疗行为记录产生的实际费用的自动化、智能化测算,有利于为临床相关人员提供费用检查的参考依据,从而解决了人工工作量大和效率低下的问题。
如图1和图2所示,本发明提供的一种面向医疗行为片段的费用自动测算方法,自动为医疗行为数据和标准费用之间建立关联关系,具体步骤如下:
1. 预处理医疗行为记录:对原始医疗行为记录进行初步的预处理,获得每家医院每个患者待处理的医疗行为记录目标文本集。
医疗行为记录是指对患者病情和诊疗过程所进行的连续性记录,具体可以从多家医院的信息系统中获取,包括入院记录、病程记录、护理记录、出院记录的一种或多种。先对以上记录按照医院名称、患者唯一标识id进行梳理,去掉与过程无关的冗余信息,如患者信息、记录人、操作人等,仅保留记录经过主体部分。然后进行文档和字体格式的归一化处理,并且过滤掉不影响语义表达的连接词和常用词,去除文档中的换行符、特殊标点符号,中文繁体全部转为中文简体,英文字母大写全部转为小写等,获得每家医院每个患者待处理的医疗行为记录目标文本集。目标文本的示例如下:“患者于今晨出现胸骨后疼痛,呈压榨性疼痛,伴大汗、恶心,立即做常规心电图,结果显示窦性心律,ST段水平型向上升高。急查心肌酶,化验结果显示肌酸激酶270 u/l。给予5%葡萄糖250ml+硝酸甘油10ml临时静点,并嘱患者严格卧床。给药20分钟后,患者心前区疼痛有所缓解……全麻达成后,取仰卧位,常规消毒铺巾。作前胸正中切口,切开皮下组织,锯胸骨,打开心包,悬吊。探查如上所述。取右下肢内侧,沿大隐静脉走行切开皮肤及皮下组织,游离大隐静脉30公分备用,仔细止血后逐层缝合切口。取内乳动脉备用,固定左冠前降支,与乳内动脉行端侧吻合。固定对角支,将大隐静脉与对角支侧侧吻合,建立静脉桥,同法将大隐静脉与钝缘支行侧侧吻合,建立静脉桥,最后与后降支行端侧吻合,建立静脉桥……手术完毕,病人送入监护室。”
2. 预设标准费用词库:针对不同医疗行为预定义费用类型,基于目标文本集属地标准医疗服务价格手册,构建多层级分类费用词库。
2.1)定义标准费用类型:针对不同医疗行为对应的费用类型的层级结构差异,例如化验/检查对应的费用层级结构为方法/技术(临床血液、临床化学、临床免疫检验/X线透视、造影检查等)和项目名称,而手术对应的费用层级结构为解剖系统、部位分类、操作部位和手术术式等,因此需要将医疗行为记录中关联的医疗费用类型进行预设。在具体实施时,可以定义为以下三类:(1)化验检查费用,即为明确患者患病的种类、严重程度、预后情况等发生的化验及检查的费用,如超声心动图、数字化摄影、各类实验室检查等费用。对应上述目标文本属于此类型的标准费用项目名称应为常规心电图和心肌酶谱常规检查;(2)常规治疗费用,用于治疗患者病症的药品和耗材产生的费用,如上述目标文本属于此类型的标准费用名称应为5%葡萄糖和硝酸甘油,对应的指标值分别为250ml和10ml;(3)手术治疗费用,指应用外科手术的方法对病损器官或对患者某些具有形态缺陷的器官进行切除、修补或替换等产生的费用。患者病程记录中的“手术经过”记录通常是对某项手术操作过程的描述,这类文本一般比较长,可包含几百至上千字,其描述的对象是标准收费项目手册中的某条标准手术费用项目。因此可以将其描述的详细操作步骤,通过生成关键短语的方式关联到对应的费用标准名称,如上述目标文本属于此类型的标准费用名称应为冠状动脉搭桥术;
2.2)构建标准费用词库:基于《全国医疗服务价格项目规范》和属地《公立医院医疗服务价格手册》,根据预设的费用类型,构建多层级分类费用词库。以手术为例,如费用分类、解剖系统、部位分类、操作部位、手术术式、费用信息,具体见表1。
表1
3. 医疗行为记录切分:如图3所示,基于医疗行为记录文本句子上下文关系,将医疗行为记录切分为多个医疗行为片段,计算每个医疗行为片段对应的标准费用类型。
医疗行为记录是指对患者病情和诊疗过程所进行的连续性记录,其中会包含患者接受的一系列诊疗手段,而每一项诊疗手段会对应不同类型的收费项目。为了准确计算整个医疗行为记录中产生的费用,首先需要将医疗行为记录切分为多个医疗行为片段,其中每个医疗行为片段应该包含一项完整的诊疗手段,然后计算每个医疗行为片段对应的标准费用类型,最后将医疗行为片段与标准费用类型下的标准费用词库进行匹配,即可得到每个医疗行为片段产生的费用。具体如下:
将患者的医疗行为记录用D表示,其中包含了n个句子,则可将医疗行为记录D表示为,用/>表示从第/>个句子到第/>个句子之间的医疗行为记录片段,其中/>。用Y表示标准费用类型的集合,即,则可以用文本分类模型计算医疗行为记录片段/>属于某个标准费用类型y的概率为/>,其中/>。本实施例中使用的文本分类模型为循环神经网络GRU模型,计算方法如下:
其中为执行记录片段/>的第/>个位置的字符的语义向量,/>为执行记录片段/>的第/>个位置的隐藏状态,/>和/>分别表示GRU模型中的更新门和重置门,/>表示sigmoid函数,tanh表示双曲正切函数,/>、/>和/>均为训练得到的矩阵参数。则执行记录片段/>属于标准费用类型的概率分布计算方法为:
其中为矩阵参数,/>为向量参数,均通过训练得到,上面等式右边通过这两组参数的运算将/>转化为3维的向量。
基于执行记录片段的标准费用类型的分布,将医疗行为记录切分为多个医疗行为片段并计算每个医疗行为片段对应的标准费用类型。首先初始化,初始化医疗行为片段序列/>,设定阈值/>,然后执行以下步骤:
(1)计算执行记录片段属于标准费用类型的最大概率/>
(2)若满足条件,则执行记录片段/>就形成一个新的医疗行为片段,将其新增到医疗行为片段序列/>中,更新/>,/>,并重复执行步骤(1);
(3)若不满足条件,则更新/>,并重复执行步骤(1)。
重复执行以上步骤直到医疗行为记录的结尾处,最终得到医疗行为记录D的医疗行为片段序列,其中每个医疗行为片段所属的标准费用类型为概率最大的一个类别,即/>。本实施例取阈值/>
4. 医疗行为片段费用测算:从医疗行为片段中生成关键短语,在关键短语和标准费用词库之间建立关联关系,确定每段医疗行为片段的费用。
为了确定每个医疗行为片段的费用,需要在医疗行为片段和标准费用词库之间建立关联关系,但是二者之间存在信息量不对等的问题,医疗行为片段会详细描述手术操作或化验检查等诊疗过程的详细步骤,而标准费用词库中一般是手术名称或检查项目名称等短语。因此需要首先从医疗行为片段中抽取或生成关键短语,使得该关键短语能够概括整个医疗行为片段的中心思想,然后在关键短语和标准费用词库之间建立关联关系。具体如下:
4.1)生成医疗行为片段的关键短语:设医疗行为片段包含/>个字符,即,将整个医疗行为片段的文本输入BERT模型,将最后一层在字符/>位置的输出/>作为字符/>的向量编码。将中英文的所有字符集合记作/>,并在/>中加入表示结束的字符/>,对于任意字符/>,医疗行为片段/>的关键短语的第k个位置的字符为/>的概率记作/>。/>由两部分概率组成:从医疗行为片段/>的原文中提取/>的概率/>和基于医疗行为片段/>的语义生成/>的概率/>。其中提取/>的概率/>的计算方法为:
生成的概率的计算方法为
其中和/>为待训练的矩阵参数,/>和/>为待训练的标量参数,/>为位置k的向量编码,随机初始化并参与模型训练。关键短语的第k个位置的字符为/>的概率为。那么概率/>最大的字符即为关键短语第k个位置实际取到的字符/>。从/>开始从左到右依次计算关键短语每个位置实际的字符,当遇到/>时,表示已经到了关键短语的结尾处,将前面计算得到的每个位置上的字符连起来,就得到了医疗行为片段/>的关键短语/>
4.2)计算医疗行为片段的费用:如图4所示,将医疗行为片段的关键短语匹配到标准费用词库,优先匹配最深层级的标准费用词库,当关键短语和最深层级的所有标准费用短语的匹配分数都比较低时,则为关键短语匹配父级标准费用短语,将对应的医疗行为片段的费用记作待定,并提交专家审核。对于关键短语和标准费用词库中最深层级的任意短语/>,使用深度学习语言模型计算它们的向量编码/>和/>,本实施例使用的语言模型是BERT模型。用向量的余弦相似度计算关键短语/>和标准费用短语/>的匹配分数为/>。使得匹配分数达到最大的标准费用短语为/>。当/>时,即可认为在关键短语和标准费用短语为/>之间建立了关联关系,/>的费用/>即为医疗行为片段/>的实际费用,其中/>是匹配分数的阈值,本实施例取/>。当不满足条件时,说明关键短语和对应费用分类下最深层级的所有标准费用短语的匹配分数都比较低,需要为关键短语匹配父级标准费用短语。取匹配分数最大的/>个标准费用短语/>,在对应类型的标准费用词库中找到/>每一个短语的父级标准费用短语,统计其中出现次数最多的父级标准费用短语,将其记作医疗行为片段/>的父级标准费用短语,提交给专家进行审核校验,此时将医疗行为片段/>的费用标记为待定。本实施例取/>。将医疗行为记录D包含的所有医疗行为片段/>的费用相加,就得到D的全部费用/>
进一步地,基于手术行为片段生成的手术操作序列,依据实际费用消耗排序,可辅助校验患者病案首页的主要手术操作准确性。
如图5所示,本发明提供的一种面向医疗行为片段的费用自动测算系统,包括预处理医疗行为记录模块、预设标准费用词库模块、医疗行为记录切分模块和医疗行为片段费用测算模块;
所述预处理医疗行为记录用于对医疗行为记录进行预处理,获得每家医院每个患者待处理的医疗行为记录目标文本集;
所述预设标准费用词库用于针对不同医疗行为预定义费用类型,基于目标文本集属地标准医疗服务价格手册,构建多层级分类费用词库;
所述医疗行为记录切分用于基于目标文本集句子上下文关系,将医疗行为记录切分为多个医疗行为片段,计算每个医疗行为片段对应的标准费用类型;
所述医疗行为片段费用测算用于从医疗行为片段中生成关键短语,在关键短语和多层级分类费用词库之间建立关联关系,确定每段医疗行为片段的费用。
与前述一种面向医疗行为片段的费用自动测算方法的实施例相对应,本发明还提供了一种面向医疗行为片段的费用自动测算装置的实施例。
参见图6,本发明实施例提供的一种面向医疗行为片段的费用自动测算装置,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,用于实现上述实施例中的一种面向医疗行为片段的费用自动测算方法。
本发明提供的一种面向医疗行为片段的费用自动测算装置的实施例可以应用在任意具备数据处理能力的设备上,该任意具备数据处理能力的设备可以为诸如计算机等设备或装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在任意具备数据处理能力的设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图6所示,为本发明提供的一种面向医疗行为片段的费用自动测算装置所在任意具备数据处理能力的设备的一种硬件结构图,除了图6所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的任意具备数据处理能力的设备通常根据该任意具备数据处理能力的设备的实际功能,还可以包括其他硬件,对此不再赘述。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本发明实施例还提供一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,实现上述实施例中的一种面向医疗行为片段的费用自动测算方法。
所述计算机可读存储介质可以是前述任一实施例所述的任意具备数据处理能力的设备的内部存储单元,例如硬盘或内存。所述计算机可读存储介质也可以是任意具备数据处理能力的设备的外部存储设备,例如所述设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、SD卡、闪存卡(Flash Card)等。进一步的,所述计算机可读存储介质还可以既包括任意具备数据处理能力的设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述任意具备数据处理能力的设备所需的其他程序和数据,还可以用于暂时地存储已经输出或者将要输出的数据。
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (6)

1.一种面向医疗行为片段的费用自动测算方法,其特征在于,该方法包括以下步骤:
(1)预处理医疗行为记录:对医疗行为记录进行预处理,获得每家医院每个患者待处理的医疗行为记录目标文本集;
(2)预设标准费用词库:针对不同医疗行为预定义费用类型,基于目标文本集属地标准医疗服务价格手册,构建多层级分类费用词库;
(3)医疗行为记录切分:基于目标文本集句子上下文关系,将医疗行为记录切分为多个医疗行为片段,每个医疗行为片段包含医疗行为记录目标文本集中一个或者多个句子,每个医疗行为片段所属的标准费用类型为概率最大的一个类别;对于医疗行为记录目标文本集中的第一个句子,计算属于标准费用类型的最大概率,若大于设定的概率阈值,则记为医疗行为片段,继续进行计算第二个句子;否则,则将第一个句子和第二个句子组合一起计算属于标准费用类型的最大概率,继续判断是否大于设定的概率阈值,依此类推,直到大于设定的概率阈值,将对应的句子组合记为医疗行为片段;每个医疗行为片段包含一项完整的诊疗手段,计算每个医疗行为片段对应的标准费用类型,将医疗行为片段与标准费用类型下的多层级分类费用词库进行匹配,得到每个医疗行为片段产生的费用,计算每个医疗行为片段对应的标准费用类型;
(4)医疗行为片段费用测算:从医疗行为片段中生成关键短语,在关键短语和多层级分类费用词库之间建立关联关系,确定每段医疗行为片段的费用;具体如下:
医疗行为片段包含若干个字符,将中英文的所有字符构成字符集合,并在字符集合中加入表示结束的字符,对于字符集合中任意字符,计算医疗行为片段的关键短语的第k个位置的字符的概率,包括两部分之和:从医疗行为片段原文中提取的关键短语的第k个位置字符概率和基于医疗行为片段的语义生成的关键短语的第k个位置字符的概率;
关键短语的第k个位置的字符的概率计算结果中概率最大的字符即为关键短语第k个位置实际取到的字符;依次计算关键短语每个位置实际的字符,当遇到字符集合中结束的字符时,表示已经到了关键短语的结尾处,将计算得到的每个位置上的字符连起来,得到医疗行为片段的关键短语;
将医疗行为片段的关键短语匹配到多层级分类费用词库,优先匹配最深层级的费用词库,计算关键短语和最深层级费用词库的任意费用短语的相似度,若大于设定的相似度阈值,则将关键短语和对应费用短语所在的费用词库之间建立关联关系;否则取相似度最大的若干个费用短语,在对应类型的费用词库中找到每一个短语的父级费用短语,统计其中出现次数最多的父级费用短语,将其记作医疗行为片段的父级费用短语,提交给专家进行审核校验,将医疗行为记录包含的所有医疗行为片段的费用相加,得到医疗行为记录的全部费用。
2.根据权利要求1所述的一种面向医疗行为片段的费用自动测算方法,其特征在于,步骤(1)中,医疗行为记录为对患者病情和诊疗过程所进行的连续性记录,包括入院记录、病程记录、护理记录和出院记录中的一种或多种,并去掉与过程无关的冗余信息,仅保留记录经过主体部分。
3.根据权利要求1所述的一种面向医疗行为片段的费用自动测算方法,其特征在于,步骤(2)中,预定义费用类型具体为针对不同医疗行为对应的费用类型的层级结构差异,将医疗行为记录中关联的医疗费用类型进行预设,包括化验检查费用、治疗患者病症的药品和耗材费用以及手术治疗费用。
4.一种面向医疗行为片段的费用自动测算系统,其特征在于,该系统包括预处理医疗行为记录模块、预设标准费用词库模块、医疗行为记录切分模块和医疗行为片段费用测算模块;
所述预处理医疗行为记录用于对医疗行为记录进行预处理,获得每家医院每个患者待处理的医疗行为记录目标文本集;
所述预设标准费用词库用于针对不同医疗行为预定义费用类型,基于目标文本集属地标准医疗服务价格手册,构建多层级分类费用词库;
所述医疗行为记录切分用于基于目标文本集句子上下文关系,将医疗行为记录切分为多个医疗行为片段,每个医疗行为片段包含医疗行为记录目标文本集中一个或者多个句子,每个医疗行为片段所属的标准费用类型为概率最大的一个类别;对于医疗行为记录目标文本集中的第一个句子,计算属于标准费用类型的最大概率,若大于设定的概率阈值,则记为医疗行为片段,继续进行计算第二个句子;否则,则将第一个句子和第二个句子组合一起计算属于标准费用类型的最大概率,继续判断是否大于设定的概率阈值,依此类推,直到大于设定的概率阈值,将对应的句子组合记为医疗行为片段;每个医疗行为片段包含一项完整的诊疗手段,计算每个医疗行为片段对应的标准费用类型,将医疗行为片段与标准费用类型下的多层级分类费用词库进行匹配,得到每个医疗行为片段产生的费用,计算每个医疗行为片段对应的标准费用类型;
所述医疗行为片段费用测算用于从医疗行为片段中生成关键短语,在关键短语和多层级分类费用词库之间建立关联关系,确定每段医疗行为片段的费用;
医疗行为片段包含若干个字符,将中英文的所有字符构成字符集合,并在字符集合中加入表示结束的字符,对于字符集合中任意字符,计算医疗行为片段的关键短语的第k个位置的字符的概率,包括两部分之和:从医疗行为片段原文中提取的关键短语的第k个位置字符概率和基于医疗行为片段的语义生成的关键短语的第k个位置字符的概率;
关键短语的第k个位置的字符的概率计算结果中概率最大的字符即为关键短语第k个位置实际取到的字符;依次计算关键短语每个位置实际的字符,当遇到字符集合中结束的字符时,表示已经到了关键短语的结尾处,将计算得到的每个位置上的字符连起来,得到医疗行为片段的关键短语;
将医疗行为片段的关键短语匹配到多层级分类费用词库,优先匹配最深层级的费用词库,计算关键短语和最深层级费用词库的任意费用短语的相似度,若大于设定的相似度阈值,则将关键短语和对应费用短语所在的费用词库之间建立关联关系;否则取相似度最大的若干个费用短语,在对应类型的费用词库中找到每一个短语的父级费用短语,统计其中出现次数最多的父级费用短语,将其记作医疗行为片段的父级费用短语,提交给专家进行审核校验,将医疗行为记录包含的所有医疗行为片段的费用相加,得到医疗行为记录的全部费用。
5.一种面向医疗行为片段的费用自动测算装置,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,其特征在于,所述处理器执行所述可执行代码时,实现如权利要求1-3中任一项所述的一种面向医疗行为片段的费用自动测算方法。
6.一种计算机可读存储介质,其上存储有程序,其特征在于,所述程序被处理器执行时,实现如权利要求1-3中任一项所述的一种面向医疗行为片段的费用自动测算方法。
CN202311164978.7A 2023-09-11 2023-09-11 一种面向医疗行为片段的费用自动测算方法与系统 Active CN116894685B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311164978.7A CN116894685B (zh) 2023-09-11 2023-09-11 一种面向医疗行为片段的费用自动测算方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311164978.7A CN116894685B (zh) 2023-09-11 2023-09-11 一种面向医疗行为片段的费用自动测算方法与系统

Publications (2)

Publication Number Publication Date
CN116894685A CN116894685A (zh) 2023-10-17
CN116894685B true CN116894685B (zh) 2024-02-23

Family

ID=88309759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311164978.7A Active CN116894685B (zh) 2023-09-11 2023-09-11 一种面向医疗行为片段的费用自动测算方法与系统

Country Status (1)

Country Link
CN (1) CN116894685B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722507A (zh) * 2021-08-31 2021-11-30 平安科技(深圳)有限公司 基于知识图谱的住院费用预测方法、装置及计算机设备
CN113724883A (zh) * 2021-08-31 2021-11-30 平安科技(深圳)有限公司 医疗费用预测方法、装置、存储介质及计算机设备
CN114240494A (zh) * 2021-12-16 2022-03-25 浙江融健科技有限公司 医疗项目成本核算方法、系统、电子设备及存储介质
CN115660871A (zh) * 2022-11-08 2023-01-31 上海栈略数据技术有限公司 医学临床过程无监督建模方法、计算机设备、存储介质
CN116452347A (zh) * 2023-03-17 2023-07-18 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160078038A1 (en) * 2014-09-11 2016-03-17 Sameep Navin Solanki Extraction of snippet descriptions using classification taxonomies
US11488693B2 (en) * 2018-11-01 2022-11-01 Upmc Abstracting information from patient medical records

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722507A (zh) * 2021-08-31 2021-11-30 平安科技(深圳)有限公司 基于知识图谱的住院费用预测方法、装置及计算机设备
CN113724883A (zh) * 2021-08-31 2021-11-30 平安科技(深圳)有限公司 医疗费用预测方法、装置、存储介质及计算机设备
CN114240494A (zh) * 2021-12-16 2022-03-25 浙江融健科技有限公司 医疗项目成本核算方法、系统、电子设备及存储介质
CN115660871A (zh) * 2022-11-08 2023-01-31 上海栈略数据技术有限公司 医学临床过程无监督建模方法、计算机设备、存储介质
CN116452347A (zh) * 2023-03-17 2023-07-18 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于临床路径的单病种费用预算系统设计与实现;何皎;庄军;朱立强;;中国医疗设备(10);第98-100页 *

Also Published As

Publication number Publication date
CN116894685A (zh) 2023-10-17

Similar Documents

Publication Publication Date Title
Subramanian et al. Cephalometric analysis in orthodontics using artificial intelligence—A comprehensive review
CN102947832B (zh) 患者记录的身份匹配
US20160321414A1 (en) Diagnostic Test Planning
CA3082239A1 (en) System and method of using machine learning for extraction of symptoms from electronic health records
CN105184053B (zh) 一种中文医疗服务项目信息的自动编码方法及系统
Rasteau et al. Artificial intelligence for oral and maxillo-facial surgery: A narrative review
CN116631562A (zh) 一种生成电子病历出院记录的方法、装置及电子设备
Cios et al. A knowledge discovery approach to diagnosing myocardial perfusion
Hu et al. Expert knowledge-aware image difference graph representation learning for difference-aware medical visual question answering
Kaur et al. CADxReport: Chest x-ray report generation using co-attention mechanism and reinforcement learning
Karam et al. A progressive and cross-domain deep transfer learning framework for wrist fracture detection
Dalla Serra et al. Multimodal generation of radiology reports using knowledge-grounded extraction of entities and relations
CN116894685B (zh) 一种面向医疗行为片段的费用自动测算方法与系统
Yang et al. Token-Mixer: Bind Image and Text in One Embedding Space for Medical Image Reporting
Rienhoff et al. Expert Systems and Decision Support in Medicine: 33rd Annual Meeting of the GMDS EFMI Special Topic Meeting Peter L. Reichertz Memorial Conference Hannover, September 26–29, 1988 Proceedings
CN114417855A (zh) 医疗数据的处理方法及装置、存储介质、电子设备
Rao et al. Clinical and financial outcomes analysis with existing hospital patient records
Millan-Fernandez-Montes et al. Mapping clinical procedures to the ICD-10-PCS: The German operation and procedure classification system use case
Messina et al. Extracting and Encoding: Leveraging Large Language Models and Medical Knowledge to Enhance Radiological Text Representation
Ogungbe et al. Design and Implementation of Diagnosis System for Cardiomegaly from Clinical Chest X-ray Reports
KR102587222B1 (ko) Copd 환자를 위한 인공지능 기반의 약제 처방 시스템
CN118262220B (zh) 放射影像报告的质量评估方法、装置和设备
Mäkelä-Bengs et al. Manual annotation of narrative patient charts–Finnish experiences related to a multilingual text corpus
Hu et al. Medical-Diff-VQA: a large-scale medical dataset for difference visual question answering on chest x-ray images
Song et al. Rethinking Radiology Report Generation via Causal Reasoning and Counterfactual Augmentation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant