CN111985836B - 医保评分指标体系构建方法、装置、设备及存储介质 - Google Patents
医保评分指标体系构建方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111985836B CN111985836B CN202010893559.7A CN202010893559A CN111985836B CN 111985836 B CN111985836 B CN 111985836B CN 202010893559 A CN202010893559 A CN 202010893559A CN 111985836 B CN111985836 B CN 111985836B
- Authority
- CN
- China
- Prior art keywords
- medical insurance
- data set
- index
- text
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims abstract description 22
- 238000000605 extraction Methods 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000010606 normalization Methods 0.000 claims description 97
- 238000000034 method Methods 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 6
- 239000003814 drug Substances 0.000 description 31
- 229940079593 drug Drugs 0.000 description 9
- 238000012423 maintenance Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 229940126532 prescription medicine Drugs 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Tourism & Hospitality (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及大数据技术领域,公开了一种医保评分指标体系构建方法、装置、设备及存储介质,应用于智慧医疗领域,用于提高指标数据的复用率。医保评分指标体系构建方法包括:对多个医保规范性文件进行数据预处理,得到医保规范性文本数据集;对医保规范性文本数据集进行关键词提取操作,得到至少两组候选医保文本词汇特征集;按照预设主题维度对至少两组候选医保文本词汇特征集进行比对分析,得到标准指标数据集、基本指标数据集和附加指标数据集;将基本指标数据集和附加指标数据集组合为多个指标体系,并采用标准指标数据集和多个指标体系合并为医保评分指标体系。此外,本发明还涉及区块链技术,医保评分指标体系可存储于区块链节点中。
Description
技术领域
本发明涉及大数据技术的风险管控领域,尤其涉及一种医保评分指标体系构建方法、装置、设备及存储介质。
背景技术
指标数据是现有分析、统计、决策类互联网技术IT系统中的常用的度量单元。指标数据一般是由指标名称和指标值两部分组成,指标名称说明了事物质的规定性,而指标值则体现了事物量的规定性,一组指标数据可以从不同的方面反映总体的数量特征。
在现有技术中,为了分析、反映不同场景、不同纬度的事物特征,往往需要构建多组不同组合的指标,分析的纬度越广,所需要的指标数量也越庞大。由于不同纬度、不同场景下分析的侧重点不同,指标的计算规则和其他属性也存在不同,导致指标复用率低和指标维护效率低的问题。
发明内容
本发明的主要目的在于解决构建多组不同组合的指标,存在指标复用率低和指标维护效率低的问题。
为实现上述目的,本发明第一方面提供了一种医保评分指标体系构建方法,包括:获取多个医保规范性文件,并对所述多个医保规范性文件进行数据预处理,得到医保规范性文本数据集;按照预设指标数据集和预设主题维度对所述医保规范性文本数据集进行关键词提取操作,得到至少两组候选医保文本词汇特征集;按照所述预设主题维度对所述至少两组候选医保文本词汇特征集进行比对分析,得到标准指标数据集、基本指标数据集和附加指标数据集;采用预设业务场景属性将所述基本指标数据集和所述附加指标数据集组合为多个指标体系,并将所述标准指标数据集和所述多个指标体系合并为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则。
可选的,在本发明第一方面的第一种实现方式中,所述获取多个医保规范性文件,并对所述多个医保规范性文件进行数据预处理,得到医保规范性文本数据集,包括:从预设数据库中查询多个医保规范性文件路径信息;按照所述多个医保规范性文件路径信息读取多个医保规范性文件,并判断各医保规范性文件中是否包括文本图像;若各医保规范性文件中包括文本图像,则通过图像文字识别算法提取文本图像中的文本数据,得到第一文本数据集;若各医保规范性文件中不包括文本图像,则读取各医保规范性文件中的文本数据,得到第二文本数据集;对所述第一文本数据集和所述第二文本数据集按照预设标准章节拆分,得到医保规范性文本数据集,并将所述医保规范性文本数据集存储至所述预设数据库中。
可选的,在本发明第一方面的第二种实现方式中,所述按照预设指标数据集和预设主题维度对所述医保规范性文本数据集进行关键词提取操作,得到至少两组候选医保文本词汇特征集,包括:采用预设指标数据集从所述医保规范性文本数据集中匹配至少两段医保规范性文本数据,并按照所述预设指标数据集确定预设主题维度;利用所述预设主题维度对所述至少两段医保规范性文本数据进行分词处理,得到每段医保规范性文本数据对应的多个已处理词汇数据,并对每段医保规范性文本数据对应的多个已处理词汇数据分别进行关键词筛选,得到至少两组候选医保文本词汇特征集。
可选的,在本发明第一方面的第三种实现方式中,所述按照所述预设主题维度对所述至少两组候选医保文本词汇特征集进行比对分析,得到标准指标数据集、基本指标数据集和附加指标数据集,包括:按照所述预设主题维度将所述至少两组候选医保文本词汇特征集进行属性分类,得到已分类的两组候选医保文本词汇特征集;对所述已分类的两组候选医保文本词汇特征集按照分类顺序逐一计算各候选医保文本词汇特征之间的文本相似度,得到多个相似度值;按照预设相似度阈值和所述多个相似度值划分所述已分类的两组候选医保文本词汇特征集,得到第一医保文本词汇特征集和第二医保文本词汇特征集,所述第一医保文本词汇特征集用于指示各相似度值大于或者等于所述预设相似度阈值,所述第二医保文本词汇特征集用于指示各相似度值小于所述预设相似度阈值;从所述第一医保文本词汇特征集中过滤预设业务主体对应的医保文本词汇特征,得到标准指标数据集,所述预设业务场景属性用于指示不同的业务场景;采用预设业务场景对所述第二医保文本词汇特征集和所述预设业务主体对应的医保文本词汇特征进行业务属性划分,得到基本指标数据集和附加指标数据集。
可选的,在本发明第一方面的第四种实现方式中,所述采用预设业务场景属性将所述基本指标数据集和所述附加指标数据集组合为多个指标体系,并将所述标准指标数据集和所述多个指标体系合并为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则,包括:按照预设业务场景属性对所述基本指标数据集和所述附加指标数据集进行业务场景属性匹配和关联,得到多个指标体系,并将所述多个指标体系分类存储至分布式文件系统中;将所述标准指标数据集存储至所述分布式文件系统中,将所述标准指标数据集和所述多个指标体系设置为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则。
可选的,在本发明第一方面的第五种实现方式中,在所述采用预设业务场景属性将所述基本指标数据集和所述附加指标数据集组合为多个指标体系,并将所述标准指标数据集和所述多个指标体系合并为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则之后,所述医保评分指标体系构建方法还包括:当接收到医保评分规则配置请求时,采用所述医保评分规则配置请求从所述医保评分指标体系中读取对应的标准指标数据和对应的指标体系;将所述对应的标准指标数据和所述对应的指标体系进行规则配置,得到符合业务场景的目标医保评分规则。
可选的,在本发明第一方面的第六种实现方式中,在所述采用预设业务场景属性将所述基本指标数据集和所述附加指标数据集组合为多个指标体系,并将所述标准指标数据集和所述多个指标体系合并为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则之后,所述医保评分指标体系构建方法还包括:接收指标体系更新请求;按照所述指标体系更新请求对所述医保评分指标体系进行指标数据的添加、修改或删除操作。
本发明第二方面提供了一种医保评分指标体系构建装置,包括:获取模块,用于获取多个医保规范性文件,并对所述多个医保规范性文件进行数据预处理,得到医保规范性文本数据集;提取模块,用于按照预设指标数据集和预设主题维度对所述医保规范性文本数据集进行关键词提取操作,得到至少两组候选医保文本词汇特征集;分析模块,用于按照所述预设主题维度对所述至少两组候选医保文本词汇特征集进行比对分析,得到标准指标数据集、基本指标数据集和附加指标数据集;组合模块,用于采用预设业务场景属性将所述基本指标数据集和所述附加指标数据集组合为多个指标体系,并将所述标准指标数据集和所述多个指标体系合并为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则。
可选的,在本发明第二方面的第一种实现方式中,所述获取模块具体用于:从预设数据库中查询多个医保规范性文件路径信息;按照所述多个医保规范性文件路径信息读取多个医保规范性文件,并判断各医保规范性文件中是否包括文本图像;若各医保规范性文件中包括文本图像,则通过图像文字识别算法提取文本图像中的文本数据,得到第一文本数据集;若各医保规范性文件中不包括文本图像,则读取各医保规范性文件中的文本数据,得到第二文本数据集;对所述第一文本数据集和所述第二文本数据集按照预设标准章节拆分,得到医保规范性文本数据集,并将所述医保规范性文本数据集存储至所述预设数据库中。
可选的,在本发明第二方面的第二种实现方式中,所述提取模块具体用于:采用预设指标数据集从所述医保规范性文本数据集中匹配至少两段医保规范性文本数据,并按照预设指标数据集所述确定预设主题维度;利用所述预设主题维度对所述至少两段医保规范性文本数据进行分词处理,得到每段医保规范性文本数据对应的多个已处理词汇数据,并对每段医保规范性文本数据对应的多个已处理词汇数据分别进行关键词筛选,得到至少两组候选医保文本词汇特征集。
可选的,在本发明第二方面的第三种实现方式中,所述分析模块具体用于:按照所述预设主题维度将所述至少两组候选医保文本词汇特征集进行属性分类,得到已分类的两组候选医保文本词汇特征集;对所述已分类的两组候选医保文本词汇特征集按照分类顺序逐一计算各候选医保文本词汇特征之间的文本相似度,得到多个相似度值;按照预设相似度阈值和所述多个相似度值划分所述已分类的两组候选医保文本词汇特征集,得到第一医保文本词汇特征集和第二医保文本词汇特征集,所述第一医保文本词汇特征集用于指示各相似度值大于或者等于所述预设相似度阈值,所述第二医保文本词汇特征集用于指示各相似度值小于所述预设相似度阈值;从所述第一医保文本词汇特征集中过滤预设业务主体对应的医保文本词汇特征,得到标准指标数据集;采用预设业务场景对所述第二医保文本词汇特征集和所述预设业务主体对应的医保文本词汇特征进行业务属性划分,得到基本指标数据集和附加指标数据集。
可选的,在本发明第二方面的第四种实现方式中,所述组合模块具体用于:按照预设业务场景属性对所述基本指标数据集和所述附加指标数据集进行业务场景属性匹配和关联,得到多个指标体系,并将所述多个指标体系分类存储至分布式文件系统中,所述预设业务场景属性用于指示不同的业务场景;将所述标准指标数据集存储至所述分布式文件系统中,将所述标准指标数据集和所述多个指标体系设置为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则。
可选的,在本发明第二方面的第五种实现方式中,所述医保评分指标体系构建装置还包括:读取模块,当接收到医保评分规则配置请求时,用于采用所述医保评分规则配置请求从所述医保评分指标体系中读取对应的标准指标数据和对应的指标体系;配置模块,用于将所述对应的标准指标数据和所述对应的指标体系进行规则配置,得到符合业务场景的目标医保评分规则。
可选的,在本发明第二方面的第六种实现方式中,所述医保评分指标体系构建装置还包括:接收模块,用于接收指标体系更新请求;更新模块,用于按照所述指标体系更新请求对所述医保评分指标体系进行指标数据的添加、修改或删除操作。
本发明第三方面提供了一种医保评分指标体系构建设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述医保评分指标体系构建设备执行上述的医保评分指标体系构建方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的医保评分指标体系构建方法。
本发明提供的技术方案中,获取多个医保规范性文件,并对所述多个医保规范性文件进行数据预处理,得到医保规范性文本数据集;按照预设指标数据集和预设主题维度对所述医保规范性文本数据集进行关键词提取操作,得到至少两组候选医保文本词汇特征集;按照所述预设主题维度对所述至少两组候选医保文本词汇特征集进行比对分析,得到标准指标数据集、基本指标数据集和附加指标数据集;采用预设业务场景属性将所述基本指标数据集和所述附加指标数据集组合为多个指标体系,并将所述标准指标数据集和所述多个指标体系合并为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则。本发明实施例中,通过从医保规范性文件中抽取标准指标数据集,并对抽离的标准指标数据集外的指标数据集进行整合,得到一个多个业务场景的指标体系。并通过对标准指标数据集内指标与各指标体系进行灵活配置,构建应用于不同业务场景的医保评分指标体系,提高了医保评分指标数据的复用率和指标维护效率。
附图说明
图1为本发明实施例中医保评分指标体系构建方法的一个实施例示意图;
图2为本发明实施例中医保评分指标体系构建方法的另一个实施例示意图;
图3为本发明实施例中医保评分指标体系构建装置的一个实施例示意图;
图4为本发明实施例中医保评分指标体系构建装置的另一个实施例示意图;
图5为本发明实施例中医保评分指标体系构建设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种医保评分指标体系构建方法、装置、设备及存储介质,用于通过从医保规范性文件中抽取标准指标数据集,并对抽离的标准指标数据集外的指标数据集进行整合,得到一个多个业务场景的指标体系,提高医保评分指标数据的复用率和指标维护效率。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中医保评分指标体系构建方法的一个实施例包括:
101、获取多个医保规范性文件,并对多个医保规范性文件进行数据预处理,得到医保规范性文本数据集。
其中,在医疗保障领域的各种规范性文件中,均具有针对医保对象的条文规定信息,例如,对药店中药品摆放的条文规定信息,多个条文规定信息可构成医保规范性文件。相应的,医保规范性文件中包括医保规范性文本数据集。具体的,服务器获取多个医保规范性文件,服务器读取各医保规范性文件的内容信息,并对已读取的内容信息删除空行,得到医保规范性文本数据集。
可以理解的是,本发明的执行主体可以为医保评分指标体系构建装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
102、按照预设指标数据集和预设主题维度对医保规范性文本数据集进行关键词提取操作,得到至少两组候选医保文本词汇特征集。
其中,预设指标数据集为服务器预先设置的多个指标数据,例如,某医保规范性文件中包括的医保规范性文本数据为“药店应严格执行市场监管部门核准的经营范围,做到营业场所宽敞,卫生环境优良,药品摆放整齐,处方药与非处方药分柜摆放,标志明显。”,相应的,服务器可预先将其抽象简化为指标数据“药品摆放规定”,也就是说,医保规范性文本数据集对应多个指标数据。预设指标数据集还可以包括“药品过期处理规定”指标数据,具体此处不做限定。具体的,服务器按照预设指标数据集对医保规范性文本数据集进行分词处理并去除停用分词,得到多个文本词汇,并预设主题维度对多个文本词汇进行分类筛选,得到至少两组候选医保文本词汇特征集。
103、按照预设主题维度对至少两组候选医保文本词汇特征集进行比对分析,得到标准指标数据集、基本指标数据集和附加指标数据集。
具体的,服务器对至少两组候选医保文本词汇特征集进行关键字检索,得到至少一个标准指标数据,当标准指标数据为两个或者多个时,服务器对两个或者多个标准指标数据的内容进行对比,并在对比过程中,服务器按照预设主题维度选择待对比的标准指标数据,并将所有待对比的标准指标数据添加到标准指标数据对比列表(预设主题维度表)中,分别匹配标准指标数据的各项属性内容,得到匹配结果。进一步地,服务器逐层确定标准指标数据的各项属性的权重值,并根据属性值确定标准指标数据集、基本指标数据集和附加指标数据集。
104、采用预设业务场景属性将基本指标数据集和附加指标数据集组合为多个指标体系,并将标准指标数据集和多个指标体系合并为医保评分指标体系,医保评分指标体系用于定制医疗场景下的评分规则。
其中,各指标体系是根据不同的业务场景,对指标进行按需组合的同时,赋予指标满足实际业务场景的属性(预设业务场景属性)。例如,以《YY市2019-2020年度药店信用评分管理办法》为例,服务器按照预设指标体系将其抽象为一个“信用评分体系”,将YY市、2019-2020年、药店这些地区、时间、主体类型等业务属性作为指标体系“信用指标体系”的基本属性,将指标数据“药品摆放不合规”每发生一次扣一分这个场景中的触发条件中的“每发生一次”及“扣一分”的业务属性作为指标“药品摆放不合规”在指标体系“信用评分体系”中的附加属性。至此,便形成了由标准指标数据集合指标体系组成的满足实际业务场景需求的指标衡量体系(医保评分指标体系)。
本发明实施例中,通过从医保规范性文件中抽取标准指标数据集,并对抽离的标准指标数据集外的指标数据集进行整合,得到一个多个业务场景的指标体系。并通过对标准指标数据集内指标与各指标体系进行灵活配置,构建应用于不同业务场景的医保评分指标体系,提高了医保评分指标数据的复用率和指标维护效率。并且本实施例的方案可应用于智慧医疗领域中,从而推动智慧城市的建设。
请参阅图2,本发明实施例中医保评分指标体系构建方法的另一个实施例包括:
201、获取多个医保规范性文件,并对多个医保规范性文件进行数据预处理,得到医保规范性文本数据集。
其中,各医保规范性文件种可以包括文本图像,也可以包括文字数据,具体此处不做限定。可选的,服务器从预设数据库中查询多个医保规范性文件路径信息;服务器按照多个医保规范性文件路径信息读取多个医保规范性文件,并判断各医保规范性文件中是否包括文本图像;若各医保规范性文件中包括文本图像,则服务器通过图像文字识别算法提取文本图像中的文本数据,得到第一文本数据集,其中,图像文字识别算法利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够识别的数据格式;若各医保规范性文件中不包括文本图像,则服务器读取各医保规范性文件中的文本数据,得到第二文本数据集;服务器对第一文本数据集和第二文本数据集按照预设标准章节拆分,得到医保规范性文本数据集,并将医保规范性文本数据集存储至预设数据库中。
需要说明的是,每个医保规范性文件具有相应的医保规范性文件路径信息,各医保规范性文件路径信息可以采用相对路径信息,也可以采用绝对路径信息进行表示,例如,医保规范性文件路径信息为/var/www/html/file/a.pdf。服务器按照医保规范性文件路径信息确定各医保规范性文件的扩展名,并按照各医保规范性文件的扩展名确定对应的文本读取函数,并按照对应的文本读取函数读取各医保规范性文件中对应的文本数据。其中,各医保规范性文件的扩展名可以包括.pdf,也可以包括.excel,具体此处不做限定。
202、按照预设指标数据集和预设主题维度对医保规范性文本数据集进行关键词提取操作,得到至少两组候选医保文本词汇特征集。
需要说明的是,预设主题维度可以包括适用地区、适用年份、适用主体、适用现象、适用触发条件和适用处理结果,还可以包括其他主题维度,具体此处不做限定。
可选的,首先,服务器采用预设指标数据集从医保规范性文本数据集中匹配至少两段医保规范性文本数据,并按照预设指标数据集确定预设主题维度。以“药品摆放规定”这个指标数据为例,服务器匹配得到的两段医保规范性文本数据包括“在《XX市2020年度基本医疗保险定点零售药店服务协议》中规定如下:半年内出现三次违反‘药品摆放规定’的,对药店进行通报批评。”,以及“《YY市2019-2020年度药店信用评分管理办法》中,则规定:对药店药品摆放不合规的,每发现一次,扣除1分。”。
其次,服务器利用预设主题维度对至少两段医保规范性文本数据进行分词处理,得到每段医保规范性文本数据对应的多个已处理词汇数据,并对每段医保规范性文本数据对应的多个已处理词汇数据分别进行关键词筛选,得到至少两组候选医保文本词汇特征集。其中,每组候选医保文本词汇特征集中均具有预设主题维度对应的关键词,例如,两组候选医保文本词汇特征集分别为“某某市、2020年、药店、药品摆放不合规、不合规次数、约谈、通报批评”,以及“2019、2020年、药店、药品摆放不合规、扣分。”。
进一步地,服务器对每段医保规范性文本数据对应的多个已处理词汇数据按照各已处理文本词汇出现频率从高到低顺序筛选预设数量的词汇数据;服务器采用采用TF-IDF算法分别确定预设数量的词汇数据分别对应的得分,并将预设数量的词汇数据分别对应的得分,设置为至少两组候选医保文本词汇特征集分别对应元素的得分值,用于提高对至少两组候选医保文本词汇特征集进行文本相似度计算的准确率。
203、按照预设主题维度对至少两组候选医保文本词汇特征集进行比对分析,得到标准指标数据集、基本指标数据集和附加指标数据集。
其中,标准指标数据集中的各标准指标数据不具有业务属性,基本指标数据集和附加指标数据集具有业务属性。可选的,服务器按照预设主题维度将至少两组候选医保文本词汇特征集进行属性分类,得到已分类的两组候选医保文本词汇特征集;服务器对已分类的两组候选医保文本词汇特征集按照分类顺序逐一计算各候选医保文本词汇特征之间的文本相似度,得到多个相似度值,其中,相似度的取值范围为大于或者等于0,并且小于或者等于1;服务器按照预设相似度阈值和多个相似度值划分已分类的两组候选医保文本词汇特征集,得到第一医保文本词汇特征集和第二医保文本词汇特征集,第一医保文本词汇特征集用于指示各相似度值大于或者等于预设相似度阈值,第二医保文本词汇特征集用于指示各相似度值小于预设相似度阈值;服务器从第一医保文本词汇特征集中过滤预设业务主体对应的医保文本词汇特征,得到标准指标数据集;服务器采用预设业务场景对第二医保文本词汇特征集和预设业务主体对应的医保文本词汇特征进行业务属性划分,得到基本指标数据集和附加指标数据集。
可以理解的是,如表1所示,针对同一种“药品摆放不合规”的适用现象,在不同的医保规范性文本数据集中,具有不同的业务属性和业务应用场景,其中,两组候选医保文本词汇特征集除了适用主体和适用现象两个属性相同外,其他属性都不相同。为了实现指标“药品摆放”的通用性,服务器去除不同的属性,并抽取两者通用属性集组成一个通用指标,也就是,服务器抽取的适用主体和适用现象的指标数据为“药店药品摆放不合规”,为了实现标准化和通用化,服务器再抽取“药店药品摆放不合规”这个指标数据中的适用主体属性,形成指标数据“药品摆放不合规”,以适配其他业务场景中的其他主体的情况,形成通用化的和标准化的指标数据集。服务器将使用现象之外的其他主题维度对应的指标数据进行二次划分,得到基本指标数据集和附加指标数据集。
表1:预设主题维度表
预设主题维度 | 服务协议内容 | 评分管理规则 | 是否相同 |
适用地区 | XX市 | YY市 | 否 |
适用年份 | 2020年 | 2019年、2020年 | 否 |
适用主体 | 药店 | 药店 | 是 |
适用现象 | 药品摆放不合规 | 药品摆放不合规 | 是 |
适用触发条件 | 半年三次、一年三次 | 每次 | 否 |
适用处理结果 | 通报、约谈 | 扣分 | 否 |
204、采用预设业务场景属性将基本指标数据集和附加指标数据集组合为多个指标体系,并将标准指标数据集和多个指标体系合并为医保评分指标体系,医保评分指标体系用于定制医疗场景下的评分规则。
也就是说,医保评分指标体系能够按照不同的医疗场景,对标准指标数据集和多个指标体系进行组合,得到不同的评分体系。可选的,服务器按照预设业务场景属性对基本指标数据集和附加指标数据集进行业务场景属性匹配和关联,得到多个指标体系,并将多个指标体系分类存储至分布式文件系统中;服务器将标准指标数据集存储至分布式文件系统中,将标准指标数据集和多个指标体系设置为医保评分指标体系,医保评分指标体系用于定制医疗场景下的评分规则。
进一步地,服务器接收指标体系更新请求;服务器对指标体系更新请求进行参数解析,得到操作类型和待更新指标数据,操作类型包括插入类型、修改类型和删除类型;当操作类型为插入类型时,服务器按照待更新指标数据对医保评分指标体系添加指标数据;当操作类型为修改类型时,服务器按照待更新指标数据对医保评分指标体系修改指标数据;当操作类型为删除类型时,服务器按照待更新指标数据对医保评分指标体系清理指标数据。
205、当接收到医保评分规则配置请求时,采用医保评分规则配置请求从医保评分指标体系中读取对应的标准指标数据和对应的指标体系。
具体的,当接收到医保评分规则配置请求时,服务器解析医保评分规则配置请求,得到业务场景属性标识;服务器按照业务场景属性标识检索医保评分指标体系,得到查询结果;当查询结果不为空值时,服务器从查询结果中读取对应的标准指标数据和对应的指标体系,进一步地,服务器执行步骤206;当查询结果为空值时,服务器生成提示信息,并向终端发送提示信息,提示信息用于指示医保评分规则配置请求存在异常。
206、将对应的标准指标数据和对应的指标体系进行规则配置,得到符合业务场景的目标医保评分规则。
例如,服务器采用“药品摆放不合规”的标准指标加上一个指标体系“药店服务协议体系”,设置一个符合业务场景的目标医保评分规则,该目标医保评分规则包括评分计算公式,以及计分规则,例如,计分规则为加分或者扣分。可以理解的是,服务器采用标准指标数据集与指标体系,在满足实际业务场景的同时,实现了指标的复用性,并且通过配置指标的方式,可以方便、快速的搭建满足不同业务场景的医保评分指标体系。
需要说明的是,医保评分指标体系也可以采用知识图谱方式进行存储,进一步地,服务器可以将目标医保评分规则设置为知识图谱的实体属性,更新至医保评分指标体系中。
本发明实施例中,通过从医保规范性文件中抽取标准指标数据集,并对抽离的标准指标数据集外的指标数据集进行整合,得到一个多个业务场景的指标体系。并通过对标准指标数据集内指标与各指标体系进行灵活配置,构建应用于不同业务场景的医保评分指标体系,提高了医保评分指标数据的复用率和指标维护效率。并且本实施例的方案可应用于智慧医疗领域中,从而推动智慧城市的建设。
上面对本发明实施例中医保评分指标体系构建方法进行了描述,下面对本发明实施例中医保评分指标体系构建装置进行描述,请参阅图3,本发明实施例中医保评分指标体系构建装置的一个实施例包括:
获取模块301,用于获取多个医保规范性文件,并对多个医保规范性文件进行数据预处理,得到医保规范性文本数据集;
提取模块302,用于按照预设指标数据集和预设主题维度对医保规范性文本数据集进行关键词提取操作,得到至少两组候选医保文本词汇特征集;
分析模块303,用于按照预设主题维度对至少两组候选医保文本词汇特征集进行比对分析,得到标准指标数据集、基本指标数据集和附加指标数据集;
组合模块304,用于采用预设业务场景属性将基本指标数据集和附加指标数据集组合为多个指标体系,并将标准指标数据集和多个指标体系合并为医保评分指标体系,医保评分指标体系用于定制医疗场景下的评分规则。
进一步地,将医保评分指标体系存储于区块链数据库中,具体此处不做限定。
本发明实施例中,通过从医保规范性文件中抽取标准指标数据集,并对抽离的标准指标数据集外的指标数据集进行整合,得到一个多个业务场景的指标体系。并通过对标准指标数据集内指标与各指标体系进行灵活配置,构建应用于不同业务场景的医保评分指标体系,提高了医保评分指标数据的复用率和指标维护效率。
请参阅图4,本发明实施例中医保评分指标体系构建装置的另一个实施例包括:
获取模块301,用于获取多个医保规范性文件,并对多个医保规范性文件进行数据预处理,得到医保规范性文本数据集;
提取模块302,用于按照预设指标数据集和预设主题维度对医保规范性文本数据集进行关键词提取操作,得到至少两组候选医保文本词汇特征集;
分析模块303,用于按照预设主题维度对至少两组候选医保文本词汇特征集进行比对分析,得到标准指标数据集、基本指标数据集和附加指标数据集;
组合模块304,用于采用预设业务场景属性将基本指标数据集和附加指标数据集组合为多个指标体系,并将标准指标数据集和多个指标体系合并为医保评分指标体系,医保评分指标体系用于定制医疗场景下的评分规则。
可选的,获取模块301还可以具体用于:
从预设数据库中查询多个医保规范性文件路径信息;
按照多个医保规范性文件路径信息读取多个医保规范性文件,并判断各医保规范性文件中是否包括文本图像;
若各医保规范性文件中包括文本图像,则通过图像文字识别算法提取文本图像中的文本数据,得到第一文本数据集;
若各医保规范性文件中不包括文本图像,则读取各医保规范性文件中的文本数据,得到第二文本数据集;
对第一文本数据集和第二文本数据集按照预设标准章节拆分,得到医保规范性文本数据集,并将医保规范性文本数据集存储至预设数据库中。
可选的,提取模块302还可以具体用于:
采用预设指标数据集从医保规范性文本数据集中匹配至少两段医保规范性文本数据,并按照预设指标数据集确定预设主题维度;
利用预设主题维度对至少两段医保规范性文本数据进行分词处理,得到每段医保规范性文本数据对应的多个已处理词汇数据,并对每段医保规范性文本数据对应的多个已处理词汇数据分别进行关键词筛选,得到至少两组候选医保文本词汇特征集。
可选的,分析模块303还可以具体用于:
按照预设主题维度将至少两组候选医保文本词汇特征集进行属性分类,得到已分类的两组候选医保文本词汇特征集;
对已分类的两组候选医保文本词汇特征集按照分类顺序逐一计算各候选医保文本词汇特征之间的文本相似度,得到多个相似度值;
按照预设相似度阈值和多个相似度值划分已分类的两组候选医保文本词汇特征集,得到第一医保文本词汇特征集和第二医保文本词汇特征集,第一医保文本词汇特征集用于指示各相似度值大于或者等于预设相似度阈值,第二医保文本词汇特征集用于指示各相似度值小于预设相似度阈值;
从第一医保文本词汇特征集中过滤预设业务主体对应的医保文本词汇特征,得到标准指标数据集;
采用预设业务场景对第二医保文本词汇特征集和预设业务主体对应的医保文本词汇特征进行业务属性划分,得到基本指标数据集和附加指标数据集。
可选的,组合模块304还可以具体用于:
按照预设业务场景属性对基本指标数据集和附加指标数据集进行业务场景属性匹配和关联,得到多个指标体系,并将多个指标体系分类存储至分布式文件系统中,预设业务场景属性用于指示不同的业务场景;
将标准指标数据集存储至分布式文件系统中,将标准指标数据集和多个指标体系设置为医保评分指标体系,医保评分指标体系用于定制医疗场景下的评分规则。
可选的,医保评分指标体系构建装置还包括:
读取模块305,当接收到医保评分规则配置请求时,用于采用医保评分规则配置请求从医保评分指标体系中读取对应的标准指标数据和对应的指标体系;
配置模块306,用于将对应的标准指标数据和对应的指标体系进行规则配置,得到符合业务场景的目标医保评分规则。
可选的,医保评分指标体系构建装置还包括:
接收模块307,用于接收指标体系更新请求;
更新模块308,用于按照指标体系更新请求对医保评分指标体系进行指标数据的添加、修改或删除操作。
本发明实施例中,通过从医保规范性文件中抽取标准指标数据集,并对抽离的标准指标数据集外的指标数据集进行整合,得到一个多个业务场景的指标体系。并通过对标准指标数据集内指标与各指标体系进行灵活配置,构建应用于不同业务场景的医保评分指标体系,提高了医保评分指标数据的复用率和指标维护效率。
上面图3和图4从模块化的角度对本发明实施例中的医保评分指标体系构建装置进行详细描述,下面从硬件处理的角度对本发明实施例中医保评分指标体系构建设备进行详细描述。
图5是本发明实施例提供的一种医保评分指标体系构建设备的结构示意图,该医保评分指标体系构建设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对医保评分指标体系构建设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在医保评分指标体系构建设备500上执行存储介质530中的一系列指令操作。
医保评分指标体系构建设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的医保评分指标体系构建设备结构并不构成对医保评分指标体系构建设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述医保评分指标体系构建方法的步骤。
本发明还提供一种医保评分指标体系构建设备,所述医保评分指标体系构建设备包括存储器和处理器,存储器中存储有指令,所述指令被处理器执行时,使得处理器执行上述各实施例中的所述医保评分指标体系构建方法的步骤。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种医保评分指标体系构建方法,其特征在于,所述医保评分指标体系构建方法包括:
获取多个医保规范性文件,并对所述多个医保规范性文件进行数据预处理,得到医保规范性文本数据集;
按照预设指标数据集和预设主题维度对所述医保规范性文本数据集进行关键词提取操作,得到至少两组候选医保文本词汇特征集;
按照所述预设主题维度对所述至少两组候选医保文本词汇特征集进行比对分析,得到标准指标数据集、基本指标数据集和附加指标数据集;
采用预设业务场景属性将所述基本指标数据集和所述附加指标数据集组合为多个指标体系,并将所述标准指标数据集和所述多个指标体系合并为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则;
所述按照所述预设主题维度对所述至少两组候选医保文本词汇特征集进行比对分析,得到标准指标数据集、基本指标数据集和附加指标数据集,包括:
按照所述预设主题维度将所述至少两组候选医保文本词汇特征集进行属性分类,得到已分类的两组候选医保文本词汇特征集;
对所述已分类的两组候选医保文本词汇特征集按照分类顺序逐一计算各候选医保文本词汇特征之间的文本相似度,得到多个相似度值;
按照预设相似度阈值和所述多个相似度值划分所述已分类的两组候选医保文本词汇特征集,得到第一医保文本词汇特征集和第二医保文本词汇特征集,所述第一医保文本词汇特征集用于指示各相似度值大于或者等于所述预设相似度阈值,所述第二医保文本词汇特征集用于指示各相似度值小于所述预设相似度阈值;
从所述第一医保文本词汇特征集中过滤预设业务主体对应的医保文本词汇特征,得到标准指标数据集;
采用预设业务场景对所述第二医保文本词汇特征集和所述预设业务主体对应的医保文本词汇特征进行业务属性划分,得到基本指标数据集和附加指标数据集;
所述采用预设业务场景属性将所述基本指标数据集和所述附加指标数据集组合为多个指标体系,并将所述标准指标数据集和所述多个指标体系合并为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则,包括:
按照预设业务场景属性对所述基本指标数据集和所述附加指标数据集进行业务场景属性匹配和关联,得到多个指标体系,并将所述多个指标体系分类存储至分布式文件系统中,所述预设业务场景属性用于指示不同的业务场景;
将所述标准指标数据集存储至所述分布式文件系统中,并将所述标准指标数据集和所述多个指标体系设置为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则。
2.根据权利要求1所述的医保评分指标体系构建方法,其特征在于,所述获取多个医保规范性文件,并对所述多个医保规范性文件进行数据预处理,得到医保规范性文本数据集,包括:
从预设数据库中查询多个医保规范性文件路径信息;
按照所述多个医保规范性文件路径信息读取多个医保规范性文件,并判断各医保规范性文件中是否包括文本图像;
若各医保规范性文件中包括文本图像,则通过图像文字识别算法提取文本图像中的文本数据,得到第一文本数据集;
若各医保规范性文件中不包括文本图像,则读取各医保规范性文件中的文本数据,得到第二文本数据集;
对所述第一文本数据集和所述第二文本数据集按照预设标准章节拆分,得到医保规范性文本数据集,并将所述医保规范性文本数据集存储至所述预设数据库中。
3.根据权利要求1所述的医保评分指标体系构建方法,其特征在于,所述按照预设指标数据集和预设主题维度对所述医保规范性文本数据集进行关键词提取操作,得到至少两组候选医保文本词汇特征集,包括:
采用预设指标数据集从所述医保规范性文本数据集中匹配至少两段医保规范性文本数据,并按照所述预设指标数据集确定预设主题维度;
利用所述预设主题维度对所述至少两段医保规范性文本数据进行分词处理,得到每段医保规范性文本数据对应的多个已处理词汇数据,并对每段医保规范性文本数据对应的多个已处理词汇数据分别进行关键词筛选,得到至少两组候选医保文本词汇特征集。
4.根据权利要求1-3中任意一项所述的医保评分指标体系构建方法,其特征在于,在所述采用预设业务场景属性将所述基本指标数据集和所述附加指标数据集组合为多个指标体系,并将所述标准指标数据集和所述多个指标体系合并为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则之后,所述医保评分指标体系构建方法还包括:
当接收到医保评分规则配置请求时,采用所述医保评分规则配置请求从所述医保评分指标体系中读取对应的标准指标数据和对应的指标体系;
将所述对应的标准指标数据和所述对应的指标体系进行规则配置,得到符合业务场景的目标医保评分规则。
5.根据权利要求1-3中任意一项所述的医保评分指标体系构建方法,其特征在于,在所述采用预设业务场景属性将所述基本指标数据集和所述附加指标数据集组合为多个指标体系,并将所述标准指标数据集和所述多个指标体系合并为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则之后,所述医保评分指标体系构建方法还包括:
接收指标体系更新请求;
按照所述指标体系更新请求对所述医保评分指标体系进行指标数据的添加、修改或删除操作。
6.一种医保评分指标体系构建装置,其特征在于,所述医保评分指标体系构建装置包括:
获取模块,用于获取多个医保规范性文件,并对所述多个医保规范性文件进行数据预处理,得到医保规范性文本数据集;
提取模块,用于按照预设指标数据集和预设主题维度对所述医保规范性文本数据集进行关键词提取操作,得到至少两组候选医保文本词汇特征集;
分析模块,用于按照所述预设主题维度对所述至少两组候选医保文本词汇特征集进行比对分析,得到标准指标数据集、基本指标数据集和附加指标数据集;
组合模块,用于采用预设业务场景属性将所述基本指标数据集和所述附加指标数据集组合为多个指标体系,并将所述标准指标数据集和所述多个指标体系合并为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则;
所述分析模块具体用于:
按照所述预设主题维度将所述至少两组候选医保文本词汇特征集进行属性分类,得到已分类的两组候选医保文本词汇特征集;
对所述已分类的两组候选医保文本词汇特征集按照分类顺序逐一计算各候选医保文本词汇特征之间的文本相似度,得到多个相似度值;
按照预设相似度阈值和所述多个相似度值划分所述已分类的两组候选医保文本词汇特征集,得到第一医保文本词汇特征集和第二医保文本词汇特征集,所述第一医保文本词汇特征集用于指示各相似度值大于或者等于所述预设相似度阈值,所述第二医保文本词汇特征集用于指示各相似度值小于所述预设相似度阈值;
从所述第一医保文本词汇特征集中过滤预设业务主体对应的医保文本词汇特征,得到标准指标数据集;
采用预设业务场景对所述第二医保文本词汇特征集和所述预设业务主体对应的医保文本词汇特征进行业务属性划分,得到基本指标数据集和附加指标数据集;
所述组合模块具体用于:
按照预设业务场景属性对所述基本指标数据集和所述附加指标数据集进行业务场景属性匹配和关联,得到多个指标体系,并将所述多个指标体系分类存储至分布式文件系统中,所述预设业务场景属性用于指示不同的业务场景;
将所述标准指标数据集存储至所述分布式文件系统中,并将所述标准指标数据集和所述多个指标体系设置为医保评分指标体系,所述医保评分指标体系用于定制医疗场景下的评分规则。
7.根据权利要求6所述的医保评分指标体系构建装置,其特征在于,所述获取模块具体用于:
从预设数据库中查询多个医保规范性文件路径信息;
按照所述多个医保规范性文件路径信息读取多个医保规范性文件,并判断各医保规范性文件中是否包括文本图像;
若各医保规范性文件中包括文本图像,则通过图像文字识别算法提取文本图像中的文本数据,得到第一文本数据集;
若各医保规范性文件中不包括文本图像,则读取各医保规范性文件中的文本数据,得到第二文本数据集;
对所述第一文本数据集和所述第二文本数据集按照预设标准章节拆分,得到医保规范性文本数据集,并将所述医保规范性文本数据集存储至所述预设数据库中。
8.根据权利要求6所述的医保评分指标体系构建装置,其特征在于,所述提取模块具体用于:
采用预设指标数据集从所述医保规范性文本数据集中匹配至少两段医保规范性文本数据,并按照所述预设指标数据集确定预设主题维度;
利用所述预设主题维度对所述至少两段医保规范性文本数据进行分词处理,得到每段医保规范性文本数据对应的多个已处理词汇数据,并对每段医保规范性文本数据对应的多个已处理词汇数据分别进行关键词筛选,得到至少两组候选医保文本词汇特征集。
9.一种医保评分指标体系构建设备,其特征在于,所述医保评分指标体系构建设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述医保评分指标体系构建设备执行如权利要求1-5中任意一项所述的医保评分指标体系构建方法。
10.一种计算机可读存储介质,其上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-5中任意一项所述的医保评分指标体系构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010893559.7A CN111985836B (zh) | 2020-08-31 | 2020-08-31 | 医保评分指标体系构建方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010893559.7A CN111985836B (zh) | 2020-08-31 | 2020-08-31 | 医保评分指标体系构建方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111985836A CN111985836A (zh) | 2020-11-24 |
CN111985836B true CN111985836B (zh) | 2024-04-05 |
Family
ID=73440373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010893559.7A Active CN111985836B (zh) | 2020-08-31 | 2020-08-31 | 医保评分指标体系构建方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111985836B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113657545B (zh) * | 2021-08-30 | 2024-05-21 | 平安医疗健康管理股份有限公司 | 用户业务数据的处理方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108062306A (zh) * | 2017-12-29 | 2018-05-22 | 国信优易数据有限公司 | 一种营商环境评价的指标体系构建系统及方法 |
CN109857992A (zh) * | 2018-12-29 | 2019-06-07 | 医渡云(北京)技术有限公司 | 医疗数据结构化解析方法、装置、可读介质及电子设备 |
CN111048188A (zh) * | 2019-11-19 | 2020-04-21 | 福建亿能达信息技术股份有限公司 | 一种三级公立医院绩效考核指标体系动态监测方法及系统 |
CN111221939A (zh) * | 2019-11-22 | 2020-06-02 | 华中师范大学 | 评分方法、装置和电子设备 |
WO2020140620A1 (zh) * | 2019-01-04 | 2020-07-09 | 平安科技(深圳)有限公司 | 基于智能决策的文本分类方法、装置、服务器及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10282468B2 (en) * | 2015-11-05 | 2019-05-07 | International Business Machines Corporation | Document-based requirement identification and extraction |
US10878003B2 (en) * | 2018-08-31 | 2020-12-29 | Accenture Global Solutions Limited | System and method for extracting structured information from implicit tables |
-
2020
- 2020-08-31 CN CN202010893559.7A patent/CN111985836B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108062306A (zh) * | 2017-12-29 | 2018-05-22 | 国信优易数据有限公司 | 一种营商环境评价的指标体系构建系统及方法 |
CN109857992A (zh) * | 2018-12-29 | 2019-06-07 | 医渡云(北京)技术有限公司 | 医疗数据结构化解析方法、装置、可读介质及电子设备 |
WO2020140620A1 (zh) * | 2019-01-04 | 2020-07-09 | 平安科技(深圳)有限公司 | 基于智能决策的文本分类方法、装置、服务器及存储介质 |
CN111048188A (zh) * | 2019-11-19 | 2020-04-21 | 福建亿能达信息技术股份有限公司 | 一种三级公立医院绩效考核指标体系动态监测方法及系统 |
CN111221939A (zh) * | 2019-11-22 | 2020-06-02 | 华中师范大学 | 评分方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111985836A (zh) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113657545B (zh) | 用户业务数据的处理方法、装置、设备及存储介质 | |
US10838919B2 (en) | Automated interpretation for the layout of structured multi-field files | |
CN112037920A (zh) | 医疗知识图谱构建方法、装置、设备及存储介质 | |
US11423030B2 (en) | Record matching system | |
US20040167886A1 (en) | Production of role related information from free text sources utilizing thematic caseframes | |
CN111986792A (zh) | 医疗机构评分方法、装置、设备及存储介质 | |
WO2008063973A2 (en) | Method and system for high performance data metatagging and data indexing using coprocessors | |
WO2021196934A1 (zh) | 一种基于字段相似度计算的问题推荐方法、装置和服务器 | |
CN111984792A (zh) | 网站分类方法、装置、计算机设备及存储介质 | |
Ghankutkar et al. | Modelling machine learning for analysing crime news | |
CN115274122A (zh) | 健康医疗数据的管理方法、系统、电子设备及存储介质 | |
CN113486187A (zh) | 佛学知识图谱构建方法、装置、设备及存储介质 | |
CN112783825B (zh) | 数据归档方法、装置、计算机装置及存储介质 | |
CN111985836B (zh) | 医保评分指标体系构建方法、装置、设备及存储介质 | |
CN113626618B (zh) | 基于跨篇章事件提取的案件串联方法、装置及相关组件 | |
CN112115271B (zh) | 知识图谱构建方法及装置 | |
CN111428037B (zh) | 一种分析行为政策匹配性的方法 | |
CN113139498A (zh) | 医疗票据对码方法及装置 | |
CN113129057A (zh) | 软件造价信息的处理方法、装置、计算机设备及存储介质 | |
CN113672457A (zh) | 识别数据库中的异常操作的方法和装置 | |
Eberius et al. | Publish-time data integration for open data platforms | |
CN113064597B (zh) | 一种冗余代码的识别方法、装置和设备 | |
US20240176954A1 (en) | Information complementing apparatus, information complementing method, and computer readable recording medium | |
CN113470823A (zh) | 用户生理期预测方法、装置、设备及存储介质 | |
Peng et al. | The Challenge of Pairing Big Datasets: Probabilistic Record Linkage Methods and Diagnosis of Their Empirical Viability |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |