CN111429288A - 用户画像的构建方法及装置、计算机设备、存储介质 - Google Patents
用户画像的构建方法及装置、计算机设备、存储介质 Download PDFInfo
- Publication number
- CN111429288A CN111429288A CN202010141845.8A CN202010141845A CN111429288A CN 111429288 A CN111429288 A CN 111429288A CN 202010141845 A CN202010141845 A CN 202010141845A CN 111429288 A CN111429288 A CN 111429288A
- Authority
- CN
- China
- Prior art keywords
- portrait
- value
- calculating
- data
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 22
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 230000005540 biological transmission Effects 0.000 claims abstract description 33
- 238000004364 calculation method Methods 0.000 claims description 27
- 238000000034 method Methods 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 18
- 238000013507 mapping Methods 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 8
- 230000001360 synchronised effect Effects 0.000 claims 1
- 239000003814 drug Substances 0.000 abstract description 33
- 238000003745 diagnosis Methods 0.000 abstract description 5
- 229940079593 drug Drugs 0.000 description 8
- 238000012545 processing Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000032683 aging Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0428—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/16—Implementing security features at a particular protocol layer
- H04L63/168—Implementing security features at a particular protocol layer above the transport layer
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Business, Economics & Management (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Epidemiology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明实施例提供了一种用户画像的构建方法及装置、计算机设备、存储介质。一方面,该方法包括:通过代理服务器从web客户端采集目标医院的画像要素,其中,画像要素包括:服务能力信息、药品费用信息、服务对象信息、诊疗费用信息,代理服务器部署在应用层;在应用层和传输层之间对画像要素进行SSL加密,在传输层通过代理服务器的HTTPS接口同步存储加密后的画像要素,其中,HTTPS接口用于对传输协议进行加密;计算画像要素的标签值;根据标签值构建目标医院的用户画像。通过本发明,解决了相关技术不能针对医疗机构构建用户画像的技术问题,实现了对包括多个人和物的实体画像构建,延伸了用户画像的使用范围和使用场景。
Description
【技术领域】
本发明涉及大数据领域,尤其涉及一种用户画像的构建方法及装置、计算机设备、存储介质。
【背景技术】
为了加强医保基金的使用监管,辅助医保人员进行精细化管理,医保局人员需要对医疗机构有真实、全面客观认知,目前几乎没有一款工具可以从真实数据出发,对医疗机构做一个整体画像。在需要分析医院的用户画像时,只能使用患者或者医生的用户画像,相关技术中还没有基于医院等实体的用户画像。
针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。
【发明内容】
有鉴于此,本发明实施例提供了一种用户画像的构建方法及装置、计算机设备、存储介质。
一方面,本发明实施例提供了一种用户画像的构建方法,所述方法包括:通过代理服务器从web客户端采集目标医院的画像要素,其中,所述画像要素包括:服务能力信息、药品费用信息、服务对象信息、诊疗费用信息,所述代理服务器部署在应用层;在应用层和传输层之间对所述画像要素进行安全套接层SSL加密,在传输层通过所述代理服务器的超文本传输安全协议HTTPS接口同步存储加密后的画像要素,其中,所述HTTPS接口用于对传输协议进行加密;计算所述画像要素的标签值;根据所述标签值构建所述目标医院的用户画像。
可选的,计算所述画像要素的标签值包括:针对所述画像要素的要素指标,获取所述目标医院的第一指标数据,以及获取多个样本医院的第二指标数据;根据所述第一指标数据和所述第二指标数据计算所述画像要素的标签值。
可选的,根据所述第一指标数据和所述第二指标数据计算所述画像要素的标签值包括:统计n个样本医院的观测值xi,其中,1≤i≤n,i为正整数;通过以下公式计算所述第二指标数据的样本均值:在所述第一指标数据大于所述样本均值时,生成第一标签值;在所述第一指标数据小于或等于所述样本均值时,生成第二标签值。
可选的,根据所述第一指标数据和所述第二指标数据计算所述画像要素的标签值包括:以所述多个第二指标数据为基数,计算所述第一指标数据的次序排名;在次序排名大于预设比例时,生成第一标签值;在次序排名小于等于所述预设比例时,生成第二标签值。
可选的,计算所述画像要素的标签值包括:将所述画像要素拆分为第一要素和第二要素,其中,所述第一要素为定量数据,所述第二要素为定性数据;计算所述第一要素的绝对值,以及计算所述第二要素的比例值;根据所述绝对值和所述比例值加权计算所述画像要素的标签值。
可选的,计算所述画像要素的标签值包括:针对所述画像要素的要素指标,采集所述要素指标的历史数据和当前数据;根据所述历史数据计算所述画像要素的标杆值;比较所述当前数据和所述标杆值;若所述当前数据大于所述标杆值,生成第一标签值;若所述当前数据小于或等于所述标杆值,生成第二标签值。
可选的,根据所述标签值构建所述目标医院的用户画像包括:基于画像要素生成用户壳体画像;将每个画像要素的标签值映射为对应画像要素的特征内容;将所述特征内容填入对应画像要素的内容字段,以构建所述目标医院的用户实体画像。
另一方面,本发明实施例提供了一种用户画像的构建装置,所述装置包括:采集模块,用于通过代理服务器从web客户端采集目标医院的画像要素,其中,所述画像要素包括:服务能力信息、药品费用信息、服务对象信息、诊疗费用信息,所述代理服务器部署在应用层;同步模块,用于在应用层和传输层之间对所述画像要素进行安全套接层SSL加密,在传输层通过所述代理服务器的超文本传输安全协议HTTPS接口同步存储加密后的画像要素,其中,所述HTTPS接口用于对传输协议进行加密;计算模块,用于计算所述画像要素的标签值;构建模块,用于根据所述标签值构建所述目标医院的用户画像。
可选的,所述计算模块包括:获取单元,用于针对所述画像要素的要素指标,获取所述目标医院的第一指标数据,以及获取多个样本医院的第二指标数据;第一计算单元,用于根据所述第一指标数据和所述第二指标数据计算所述画像要素的标签值。
可选的,所述第一计算单元包括:统计子单元,用于统计n个样本医院的观测值xi,其中,1≤i≤n,i为正整数;第一计算子单元,用于通过以下公式计算所述第二指标数据的样本均值:第一生成子单元,用于在所述第一指标数据大于所述样本均值时,生成第一标签值;在所述第一指标数据小于或等于所述样本均值时,生成第二标签值。
可选的,所述第一计算单元包括:第二计算子单元,用于以所述多个第二指标数据为基数,计算所述第一指标数据的次序排名;第二生成子单元,用于在次序排名大于预设比例时,生成第一标签值;在次序排名小于等于所述预设比例时,生成第二标签值。
可选的,所述计算模块包括:拆分单元,用于将所述画像要素拆分为第一要素和第二要素,其中,所述第一要素为定量数据,所述第二要素为定性数据;第二计算单元,用于计算所述第一要素的绝对值,以及计算所述第二要素的比例值;第三计算单元,用于根据所述绝对值和所述比例值加权计算所述画像要素的标签值。
可选的,所述计算模块包括:采集单元,用于针对所述画像要素的要素指标,采集所述要素指标的历史数据和当前数据;第四计算单元,用于根据所述历史数据计算所述画像要素的标杆值;比较单元,用于比较所述当前数据和所述标杆值;生成单元,用于若所述当前数据大于所述标杆值,生成第一标签值;若所述当前数据小于或等于所述标杆值,生成第二标签值。
可选的,所述构建模块包括:生成单元,用于基于画像要素生成用户壳体画像;映射单元,用于将每个画像要素的标签值映射为对应画像要素的特征内容;构建单元,用于将所述特征内容填入对应画像要素的内容字段,以构建所述目标医院的用户实体画像。
根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,采集目标医院的画像要素,然后计算画像要素的标签值,最后根据标签值构建目标医院的用户画像,通过采集医院在多个维度的画像要素并计算标签值,解决了相关技术不能针对医疗机构构建用户画像的技术问题,实现了对非个体用户的画像构建,实现了对包括多个人和物的实体画像构建,延伸了用户画像的使用范围和使用场景。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例的一种用户画像的构建计算机的硬件结构框图;
图2是根据本发明实施例的用户画像的构建方法的流程图;
图3是本发明实施例的服务能力信息的标签值的计算流程图;
图4是根据本发明实施例的用户画像的构建装置的结构框图。
【具体实施方式】
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
实施例1
本申请实施例一所提供的方法实施例可以在服务器、计算机或者类似的运算装置中执行。以运行在计算机上为例,图1是本发明实施例的一种用户画像的构建计算机的硬件结构框图。如图1所示,计算机10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述计算机还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机的结构造成限定。例如,计算机10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的用户画像的构建方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种用户画像的构建方法,图2是根据本发明实施例的用户画像的构建方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,通过代理服务器从web客户端采集目标医院的画像要素,其中,画像要素包括:服务能力信息、药品费用信息、服务对象信息、诊疗费用信息,代理服务器部署在应用层;
代理服务器与web客户端进行签约,只接收来自已签约客户端的数据,可以防止在数据源篡改和伪造数据,同时在代理服务器还可以设置WAF(web应用防火墙)软件,对源数据进行筛选和拦截,防止恶意爬取数据。
本实施例的画像要素除了服务能力信息、药品费用信息、服务对象信息、诊疗费用信息四个维度之外,还可以包括其他维度的要素信息。每个画像要素对应一个特征,每个特征又分别包含多个标签,分别用于描述以医院为对象的属性。服务能力信息用于表征目标医院的硬件条件和软件条件,药品费用信息用于表征目标医院的药品价格和费用分布情况、服务对象信息用于表征目标医院的病患人群结构和年龄分布、诊疗费用信息用于表征目标医院的总费用规律和医保费用占比情况。
步骤S204,在应用层和传输层之间对画像要素进行安全套接层SSL加密,在传输层通过代理服务器的超文本传输安全协议HTTPS接口同步存储加密后的画像要素,其中,HTTPS接口用于对传输协议进行加密;
本实施例的SSL加密可以在,可以网络传输的画像要素不会被未经授权的网元拦截或修改,从而确保只有合法的发送者和接收者才能完全访问并传输信息。SSL协议中使用非对称和对称加密,密钥通过发送端和接收端的身份标识(如MAC地址)生成,可以通过散列函数来计算得到,该密钥仅数据的发送者和接收者知道。
本实施例的传输协议包括SSL加密方式和密钥等信息,通过对数据本身和数据传输方式的加密,可以保证数据在传输过程中的安全性,防止被窃取。
步骤S206,计算画像要素的标签值;
本实施例的标签值是将画像要素量化后的一个信息熵;
步骤S208,根据标签值构建目标医院的用户画像。
本实施例的用户画像是一个机构画像,可以直接量化体现医院的服务水平等属性信息。
通过本实施例的方案,采集目标医院的画像要素,然后计算画像要素的标签值,最后根据标签值构建目标医院的用户画像,通过采集医院在多个维度的画像要素并计算标签值,解决了相关技术不能针对医疗机构构建用户画像的技术问题,实现了对非个体用户的画像构建,实现了对包括多个人和物的实体画像构建,延伸了用户画像的使用范围和使用场景。
本实施例的执行主体是客户端,手机、平板、电脑、服务器等,也可以应在服务后台,服务中台等数据处理系统或业务系统中。
在本实施例中,服务能力信息、药品费用信息、服务对象信息、诊疗费用信息分别对应服务特征、用药特征、病患特征及费用特征,为用户画像在四个维度的画像要素(画像标签)。其中每个特征又分别包含多个标签,分别用于描述以医院为对象的属性。其中,服务特征的内容包含:服务能力完善、服务能力不足、服务品质良好、服务品质待提高;用药特征的内容包含:用药费用变化波动大、用药费用变化平稳、用药费用结构平衡、用药费用结构倾斜;病患特征的内容包含:患者规模波动大、患者规模波动平稳、患者年龄老年化、患者年龄平稳;费用特征的内容包含:总费用规模波动大、总费用规模平稳、医保费用占比平衡、医保费用占比倾斜。
在本实施例中,在计算画像要素的标签值时,可以针对不同的画像要素执行不同的计算逻辑。
在一个示例中,根据样本数据来计算标签值,计算画像要素的标签值包括:
S11,针对画像要素的要素指标,获取目标医院的第一指标数据,以及获取多个样本医院的第二指标数据;
在本实施例中,每一个画像要素包括至少一个要素指标;如服务能力信息包括医院医生人数、医院专家人数、医院医护人员数量、大型设备数、医院床位数等要素指标;
S12,根据第一指标数据和第二指标数据计算画像要素的标签值。
在本示例的一个实施方式中,根据第一指标数据和第二指标数据计算画像要素的标签值包括:统计n个样本医院的观测值xi,其中,1≤i≤n,i为正整数;通过以下公式计算第二指标数据的样本均值:在第一指标数据大于样本均值时,生成第一标签值;在第一指标数据小于或等于样本均值时,生成第二标签值。
在本示例的另一个实施方式中,根据第一指标数据和第二指标数据计算画像要素的标签值包括:以多个第二指标数据为基数,计算第一指标数据的次序排名;在次序排名大于预设比例时,生成第一标签值;在次序排名小于等于预设比例时,生成第二标签值。
在本实施例的一个实施方式中,计算画像要素的标签值包括:将画像要素拆分为第一要素和第二要素,其中,第一要素为定量数据,第二要素为定性数据;计算第一要素的绝对值,以及计算第二要素的比例值;根据绝对值和比例值加权计算画像要素的标签值。
在本实施例的一个实施方式中,服务能力信息的标签值通过医院医生人数、医院专家人数、医院医护人员数量、大型设备数、医院床位数这些指标计算所得,服务品质标签分为服务品质良好和服务品质待提高,该标签是通过住院率、平均住院日、平均住院床日费、次均住院天数增幅这些指标计算所得,图3是本发明实施例的服务能力信息的标签值的计算流程图,将每个画像要素的标签划分为第一类标签和第二类标签,分别对应可以定量计算的对象和定性计算的对象,分别用于统计绝对值和比例值,每一类标签包括至少一个指标。
通过绝对值和比例值来量化特征的标签值,计算流程说明:指标值分为两类,绝对值类和比例值类。数据的处理流程包括:
从目标数据源(目标医院)中获取与画像要素对应的指标对象集合(医院医生人数、医院专家人数、大型设备数等);从样本数据源(多个样本医院)中获取与指标对象集合相对应的样本对象集合,样本对象集合中的每一个样本对象包含指标对象集合中的所有指标;利用样本对象集合中的指标对象集合,计算目标的各个指标值,进而迭代计算标签值。
在绝对值类计算时:首先计算样本均值,N为样本机构数,每个样本指标的观测值为xi,样本均值为如果指标值大于样本均值计1分;小于等于均值计0分,采用绝对值计算法,以3分为标杆,划分正负标签值偏向;即机构得分>=3,对应标签赋“完善”值、机构得分<3,对应标签赋“不足”。
在比例值类计算时:所有同级机构(医院)计分去重排名,得分前60%的分值X作为标杆,即机构得分>=X,对应标签赋“完善”值、机构得分<X,对应标签赋“不足”。
在本实施例的另一个示例中,根据历史数据计算标签值,计算画像要素的标签值包括:
S21,针对画像要素的要素指标,采集要素指标的历史数据和当前数据;
在本实施例中,每一个画像要素包括至少一个要素指标;
S22,根据历史数据计算画像要素的标杆值;
S23,比较当前数据和标杆值;
S24,若当前数据大于标杆值,生成第一标签值;若当前数据小于或等于标杆值,生成第二标签值。
在药品费用信息的实施场景示例中,将药品费用信息分为用药费用变化标签和用药费用结构标签。用药费用变化标签通过药品费用月同环比增幅、次均药品费用月同环比增幅、职工和居民药品费用月同环比增幅、职工和居民贵重药品费用月同环比增幅这些指标计算所得。在一个示例中,标签值的计算逻辑包括,首先计算近12个月的所有指标的3倍标准差作为标杆值,如果指标值高于标杆值,异常数加1。总的异常数大于等于1时,则标签记为波动大;没有异常则记为平稳。用药费用结构标签是通过药占比、药品费占住院费用比例、门诊药品占总费用比率、住院费用中药品费用占总费用的比例、抗微生物药品费用占总费用的比例、贵重药品费用占总费用的比例、自费药品费用占总费用的比例这些指标计算所得。在一个示例中,计算逻辑包括,首先计算同级均值作为标杆值,如果占比超出标杆值+-5%范围内,记为不合理。总的不合理数量大于等于1时,则标签记为倾斜;否则记为平衡。
在服务对象信息的实施场景示例中,服务对象信息包括患者规模标签和患者年龄标签。患者规模标签是通过职工和居民门诊月增长率、职工和居民门特月增长率、职工和居民住院月增长率这些指标计算所得。在一个示例中,计算逻辑包括,首先计算近12个月的所有指标的3倍标准差作为标杆值,如果指标值高于标杆值,异常数加1。总的异常数大于等于1时,则标签记为波动大;没有异常则记为平稳。患者年龄标签是通过老年患者就诊增长率、患者平均年龄增长率计算所得。在一个示例中,计算逻辑包括,首先计算同级均值作为标杆值,如果指标值高于标杆值,异常数加1。两个指标都超标杆值,则老年化;除此情况下标签为平稳。
在诊疗费用信息的实施场景示例中,诊疗费用信息包括总费用规模标签和医保费用占比标签。总费用规模标签是通过总费用增长率、门诊费用增长率、门特费用增长率、住院费用增长率、居民和职工费用增长率、居民和职工门诊费用增长率、居民和职工门特费用增长率、居民和职工住院费用增长率这些指标计算所得。在一个示例中,计算逻辑包括,首先计算近12个月的所有指标的3倍标准差作为标杆值,如果指标值高于标杆值,异常数加1。总的异常数大于等于1时,则标签记为波动大;没有异常则记为平稳。医保费用占比标签通过门诊报销比例、门特报销比例、住院报销比例、居民和职工门诊报销比例、居民和职工门特报销比例、居民和职工住院报销比例计算所得。在一个示例中,计算逻辑包括,首先计算同级均值作为标杆值,如果占比超出标杆值+-5%范围内,记为不合理。总的不合理数量大于等于1时,则标签记为倾斜;否则记为平衡。
在本实施例的一个实施方式中,根据标签值构建目标医院的用户画像包括:基于画像要素生成用户壳体画像;将每个画像要素的标签值映射为对应画像要素的特征内容;将特征内容填入对应画像要素的内容字段,以构建目标医院的用户实体画像。
本实施例的用户壳体画像是一个初步的用户画像,相当于一个素描,通过用户壳体画像,用户可以看到医院的基本轮廓,如人包括脑袋,躯干和四肢,但脑袋,躯干和四肢的具体信息还不知道,通过将标签值映射为对应画像要素的特征内容,即可构建清晰完整的用户实体画像。
标签计算完毕,系统会自动组装所有指标值,并展示标签计算所关联的标签值,然后将标签值映射成特征内容,与特征关联,填入画像要素的内容字段,生成机构最终画像,如:华南第一医院,服务能力完善、服务品质良好、用药费用变化波动大、用药费用结构平衡、患者规模平稳、患者年龄老龄化、总费用规模波动大、医保费用占比平衡等。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
在本实施例中还提供了一种用户画像的构建装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本发明实施例的用户画像的构建装置的结构框图,如图4所示,该装置包括:采集模块40,同步模块42,计算模块44,构建模块46,其中,
采集模块40,用于通过代理服务器从web客户端采集目标医院的画像要素,其中,所述画像要素包括:服务能力信息、药品费用信息、服务对象信息、诊疗费用信息,所述代理服务器部署在应用层;
同步模块42,用于在应用层和传输层之间对所述画像要素进行安全套接层SSL加密,在传输层通过所述代理服务器的超文本传输安全协议HTTPS接口同步存储加密后的画像要素,其中,所述HTTPS接口用于对传输协议进行加密;
计算模块44,用于计算所述画像要素的标签值;
构建模块46,用于根据所述标签值构建所述目标医院的用户画像。
可选的,所述计算模块包括:获取单元,用于针对所述画像要素的要素指标,获取所述目标医院的第一指标数据,以及获取多个样本医院的第二指标数据;第一计算单元,用于根据所述第一指标数据和所述第二指标数据计算所述画像要素的标签值。
可选的,所述第一计算单元包括:统计子单元,用于统计n个样本医院的观测值xi,其中,1≤i≤n,i为正整数;第一计算子单元,用于通过以下公式计算所述第二指标数据的样本均值:第一生成子单元,用于在所述第一指标数据大于所述样本均值时,生成第一标签值;在所述第一指标数据小于或等于所述样本均值时,生成第二标签值。
可选的,所述第一计算单元包括:第二计算子单元,用于以所述多个第二指标数据为基数,计算所述第一指标数据的次序排名;第二生成子单元,用于在次序排名大于预设比例时,生成第一标签值;在次序排名小于等于所述预设比例时,生成第二标签值。
可选的,所述计算模块包括:拆分单元,用于将所述画像要素拆分为第一要素和第二要素,其中,所述第一要素为定量数据,所述第二要素为定性数据;第二计算单元,用于计算所述第一要素的绝对值,以及计算所述第二要素的比例值;第三计算单元,用于根据所述绝对值和所述比例值加权计算所述画像要素的标签值。
可选的,所述计算模块包括:采集单元,用于针对所述画像要素的要素指标,采集所述要素指标的历史数据和当前数据;第四计算单元,用于根据所述历史数据计算所述画像要素的标杆值;比较单元,用于比较所述当前数据和所述标杆值;生成单元,用于若所述当前数据大于所述标杆值,生成第一标签值;若所述当前数据小于或等于所述标杆值,生成第二标签值。
可选的,所述构建模块包括:生成单元,用于基于画像要素生成用户壳体画像;映射单元,用于将每个画像要素的标签值映射为对应画像要素的特征内容;构建单元,用于将所述特征内容填入对应画像要素的内容字段,以构建所述目标医院的用户实体画像。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
实施例3
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,通过代理服务器从web客户端采集目标医院的画像要素,其中,所述画像要素包括:服务能力信息、药品费用信息、服务对象信息、诊疗费用信息,所述代理服务器部署在应用层;
S2,在应用层和传输层之间对所述画像要素进行安全套接层SSL加密,在传输层通过所述代理服务器的超文本传输安全协议HTTPS接口同步存储加密后的画像要素,其中,所述HTTPS接口用于对传输协议进行加密;
S3,计算所述画像要素的标签值;
S4,根据所述标签值构建所述目标医院的用户画像。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,通过代理服务器从web客户端采集目标医院的画像要素,其中,所述画像要素包括:服务能力信息、药品费用信息、服务对象信息、诊疗费用信息,所述代理服务器部署在应用层;
S2,在应用层和传输层之间对所述画像要素进行安全套接层SSL加密,在传输层通过所述代理服务器的超文本传输安全协议HTTPS接口同步存储加密后的画像要素,其中,所述HTTPS接口用于对传输协议进行加密;
S3,计算所述画像要素的标签值;
S4,根据所述标签值构建所述目标医院的用户画像。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (10)
1.一种用户画像的构建方法,其特征在于,所述方法包括:
通过代理服务器从web客户端采集目标医院的画像要素,其中,所述画像要素包括:服务能力信息、药品费用信息、服务对象信息、诊疗费用信息,所述代理服务器部署在应用层;
在应用层和传输层之间对所述画像要素进行安全套接层SSL加密,在传输层通过所述代理服务器的超文本传输安全协议HTTPS接口同步存储加密后的画像要素,其中,所述HTTPS接口用于对传输协议进行加密;
计算所述画像要素的标签值;
根据所述标签值构建所述目标医院的用户画像。
2.根据权利要求1所述的方法,其特征在于,计算所述画像要素的标签值包括:
针对所述画像要素的要素指标,获取所述目标医院的第一指标数据,以及获取多个样本医院的第二指标数据;
根据所述第一指标数据和所述第二指标数据计算所述画像要素的标签值。
4.根据权利要求2所述的方法,其特征在于,根据所述第一指标数据和所述第二指标数据计算所述画像要素的标签值包括:
以多个所述第二指标数据为基数,计算所述第一指标数据的次序排名;
在次序排名大于预设比例时,生成第一标签值;在次序排名小于等于所述预设比例时,生成第二标签值。
5.根据权利要求1所述的方法,其特征在于,计算所述画像要素的标签值包括:
将所述画像要素拆分为第一要素和第二要素,其中,所述第一要素为定量数据,所述第二要素为定性数据;
计算所述第一要素的绝对值,以及计算所述第二要素的比例值;
根据所述绝对值和所述比例值加权计算所述画像要素的标签值。
6.根据权利要求1所述的方法,其特征在于,计算所述画像要素的标签值包括:
针对所述画像要素的要素指标,采集所述要素指标的历史数据和当前数据;
根据所述历史数据计算所述画像要素的标杆值;
比较所述当前数据和所述标杆值;
若所述当前数据大于所述标杆值,生成第一标签值;若所述当前数据小于或等于所述标杆值,生成第二标签值。
7.根据权利要求1所述的方法,其特征在于,根据所述标签值构建所述目标医院的用户画像包括:
基于所述画像要素生成用户壳体画像;
将每个画像要素的标签值映射为对应画像要素的特征内容;
将所述特征内容填入对应画像要素的内容字段,以构建所述目标医院的用户实体画像。
8.一种用户画像的构建装置,其特征在于,所述装置包括:
采集模块,用于通过代理服务器从web客户端采集目标医院的画像要素,其中,所述画像要素包括:服务能力信息、药品费用信息、服务对象信息、诊疗费用信息,所述代理服务器部署在应用层;
同步模块,用于在应用层和传输层之间对所述画像要素进行安全套接层SSL加密,在传输层通过所述代理服务器的超文本传输安全协议HTTPS接口同步存储加密后的画像要素,其中,所述HTTPS接口用于对传输协议进行加密;
计算模块,用于计算所述画像要素的标签值;
构建模块,用于根据所述标签值构建所述目标医院的用户画像。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010141845.8A CN111429288A (zh) | 2020-03-04 | 2020-03-04 | 用户画像的构建方法及装置、计算机设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010141845.8A CN111429288A (zh) | 2020-03-04 | 2020-03-04 | 用户画像的构建方法及装置、计算机设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111429288A true CN111429288A (zh) | 2020-07-17 |
Family
ID=71547508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010141845.8A Pending CN111429288A (zh) | 2020-03-04 | 2020-03-04 | 用户画像的构建方法及装置、计算机设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111429288A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112837769A (zh) * | 2021-01-12 | 2021-05-25 | 山东众阳健康科技集团有限公司 | 一种基于深度学习和知识图谱的患者画像方法及系统 |
CN113657809A (zh) * | 2021-08-31 | 2021-11-16 | 平安医疗健康管理股份有限公司 | 医院画像的构建方法、装置、设备及存储介质 |
CN116563038A (zh) * | 2023-06-26 | 2023-08-08 | 江南大学附属医院 | 一种基于区域大数据的医保控费推荐方法、系统及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106302391A (zh) * | 2016-07-27 | 2017-01-04 | 上海华为技术有限公司 | 一种加密数据传输方法和代理服务器 |
CN108197132A (zh) * | 2017-10-09 | 2018-06-22 | 国网陕西省电力公司 | 一种基于图数据库的电力资产画像构建方法及装置 |
CN109660980A (zh) * | 2018-09-27 | 2019-04-19 | 深圳壹账通智能科技有限公司 | 基于历史连接WiFi构建用户画像的方法、装置、设备及介质 |
CN110768940A (zh) * | 2018-07-27 | 2020-02-07 | 深信服科技股份有限公司 | 基于https协议密文数据管控方法、系统及相关装置 |
CN110852338A (zh) * | 2019-07-26 | 2020-02-28 | 平安科技(深圳)有限公司 | 用户画像的构建方法及装置 |
-
2020
- 2020-03-04 CN CN202010141845.8A patent/CN111429288A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106302391A (zh) * | 2016-07-27 | 2017-01-04 | 上海华为技术有限公司 | 一种加密数据传输方法和代理服务器 |
CN108197132A (zh) * | 2017-10-09 | 2018-06-22 | 国网陕西省电力公司 | 一种基于图数据库的电力资产画像构建方法及装置 |
CN110768940A (zh) * | 2018-07-27 | 2020-02-07 | 深信服科技股份有限公司 | 基于https协议密文数据管控方法、系统及相关装置 |
CN109660980A (zh) * | 2018-09-27 | 2019-04-19 | 深圳壹账通智能科技有限公司 | 基于历史连接WiFi构建用户画像的方法、装置、设备及介质 |
CN110852338A (zh) * | 2019-07-26 | 2020-02-28 | 平安科技(深圳)有限公司 | 用户画像的构建方法及装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112837769A (zh) * | 2021-01-12 | 2021-05-25 | 山东众阳健康科技集团有限公司 | 一种基于深度学习和知识图谱的患者画像方法及系统 |
CN113657809A (zh) * | 2021-08-31 | 2021-11-16 | 平安医疗健康管理股份有限公司 | 医院画像的构建方法、装置、设备及存储介质 |
CN116563038A (zh) * | 2023-06-26 | 2023-08-08 | 江南大学附属医院 | 一种基于区域大数据的医保控费推荐方法、系统及存储介质 |
CN116563038B (zh) * | 2023-06-26 | 2023-09-22 | 江南大学附属医院 | 一种基于区域大数据的医保控费推荐方法、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021051610A1 (zh) | 数据的训练方法及装置、系统 | |
CN111429288A (zh) | 用户画像的构建方法及装置、计算机设备、存储介质 | |
Le et al. | A hybrid approach of secret sharing with fragmentation and encryption in cloud environment for securing outsourced medical database: a revolutionary approach | |
CN111552734A (zh) | 用户画像的生成方法及装置、计算机设备、存储介质 | |
CN110457425B (zh) | 一种案例存储方法、装置、设备及存储介质 | |
CN108429718A (zh) | 账号识别方法及装置 | |
Demirbaga et al. | MapChain: A blockchain-based verifiable healthcare service management in IoT-based big data ecosystem | |
US20150254783A1 (en) | Systems and methods for estate account discovery | |
CN112530604A (zh) | 一种基于云平台的远程智慧医疗系统 | |
Khan et al. | Health data integration with Secured Record Linkage: A practical solution for Bangladesh and other developing countries | |
Kodituwakku et al. | Insight2: A modular visual analysis platform for network situational awareness in large-scale networks | |
Scheidt et al. | Identification of iot devices for forensic investigation | |
Shams et al. | Internet of things in telemedicine: a discussion regarding to several implementation | |
CN117153419B (zh) | 一种面向医疗机构的数据集成工具 | |
Lai et al. | Edge intelligent collaborative privacy protection solution for smart medical | |
Boddy et al. | An investigation into healthcare-data patterns | |
Chen et al. | Hadoop-based healthcare information system design and wireless security communication implementation | |
CN108922632A (zh) | 一种数据管理方法及系统 | |
US8566352B2 (en) | Methods, systems and program products for classifying and storing a data handling method and for associating a data handling method with a data item | |
Yu et al. | Verifiable, privacy-assured, and accurate signal collection for cloud-assisted wireless sensor networks | |
CN110035057A (zh) | 用于投票的系统、方法和装置 | |
Sun et al. | A Novel Blockchain-Based IoT Data Provenance Model | |
CN108449306A (zh) | 一种离群度检测方法 | |
Avraam et al. | The network limits of infectious disease control via occupation-based targeting | |
Guo et al. | Find referral social networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220520 Address after: 518000 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province Applicant after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd. Address before: Room 12G, Area H, 666 Beijing East Road, Huangpu District, Shanghai 200001 Applicant before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd. |
|
TA01 | Transfer of patent application right |