CN112907000A - 基于大数据的医院选址方法、装置、电子设备、存储介质 - Google Patents
基于大数据的医院选址方法、装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN112907000A CN112907000A CN201911146807.5A CN201911146807A CN112907000A CN 112907000 A CN112907000 A CN 112907000A CN 201911146807 A CN201911146807 A CN 201911146807A CN 112907000 A CN112907000 A CN 112907000A
- Authority
- CN
- China
- Prior art keywords
- feature vector
- hospital
- site selection
- address
- ith
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010187 selection method Methods 0.000 title claims abstract description 24
- 239000013598 vector Substances 0.000 claims abstract description 159
- 238000007635 classification algorithm Methods 0.000 claims abstract description 17
- 238000012549 training Methods 0.000 claims abstract description 12
- 238000000034 method Methods 0.000 claims abstract description 10
- 239000003086 colorant Substances 0.000 claims description 13
- 230000002860 competitive effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 5
- 230000004931 aggregating effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000005265 energy consumption Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供一种基于大数据的医院选址方法、装置、电子设备、存储介质,基于大数据的医院选址方法包括:基于向量机分类算法建立医院选址模型;生成样本数据,所述样本数据至少包括多个医院的特征向量集,所述特征向量集至少包括人口因素类特征向量、交通设施类特征向量、竞争强度类特征向量、用户意图反馈类特征向量以及综合类特征向量;根据所述样本数据训练所述医院选址模型;获取多个待选址的特征向量集;将多个待选址的特征向量集输入经训练的医院选址模型;以及根据所述医院选址模型的输出确定是否将各候选址作为选址地址。本发明提供的方法和装置实现基于大数据的医院选址。
Description
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种基于大数据的医院选址方法、装置、电子设备、存储介质。
背景技术
目前,民营医院在其落地发展过程中首先需要进行选址。
一方面,如何解析民营医院需求,提取医院选址要素特征,获取要素数据集,为医院选址提供有力的证据。但如何定义选址要素对选址位置影响程度是本发明待解决的技术问题之一。
另一方面,如何构建选址模型,依据数据更新和优化模型,并通过模型输出对选址位置的准确判别,是本发明要解决的另一个技术问题。
发明内容
本发明为了克服上述相关技术存在的缺陷,提供一种基于大数据的医院选址方法、装置、电子设备、存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
根据本发明的一个方面,提供一种基于大数据的医院选址方法,包括:基于向量机分类算法建立医院选址模型;生成样本数据,所述样本数据至少包括多个医院的特征向量集,所述特征向量集至少包括人口因素类特征向量、交通设施类特征向量、竞争强度类特征向量、用户意图反馈类特征向量以及综合类特征向量;根据所述样本数据训练所述医院选址模型;获取多个待选址的特征向量集;将多个待选址的特征向量集输入经训练的医院选址模型;以及根据所述医院选址模型的输出确定是否将各候选址作为选址地址。
在本发明的一些实施例中,所述多个待选址于总候选区域内选取,所述根据所述医院选址模型的输出确定是否将各候选址作为选址地址还包括:展示所述总候选区域的地图,并以不同的颜色、形状、大小或他们的组合标记确定为选址地址的候选址以及确定为非选址地址的候选址,
在本发明的一些实施例中,所述总候选区域的地图具有多级缩放模式,当所述总候选区域的地图以最高级放大模式显示时,确定为选址地址的候选址以及确定为非选址地址的候选址以不同的颜色标记;以及当所述总候选区域的地图自最高级逐级缩小时,聚合相近区域内的标记,并以不同颜色的比例图标显示该区域内确定为选址地址的候选址以及确定为非选址地址的候选址的比例。
在本发明的一些实施例中,所述人口因素类特征向量至少包括人口数量特征向量及购买水平特征向量,
所述人口数量特征向量x11为:
其中,ai表示第i个人,n1为人口总数;当(ai)f∈P:dist((ai)f,o)<r时,ai=1,否则ai=0,其中(ai)f表示第i个人处于f位置,P表示在总候选区域范围内的所有位置点集合,o为待选址的位置,dist((ai)f,o)表示ai这个人处于f位置与 o位置之间的距离,r为可行半径;
所述购买水平特征向量x12为:
否则,x12=0,
在本发明的一些实施例中,所述交通设施类特征向量至少包括交通枢纽站特征向量及交通流量特征向量,
所述交通枢纽站特征向量x21为:
其中,ci表示第i个公交或地铁站点,n3为公交和地铁站点总数;当(ci)h∈P: dist((ci)h,o)<r时,ci=1,否则ci=0,其中(ci)h表示第i个公交或地铁站点处于 h位置,P表示在总候选区域范围内的所有位置点集合,o为待选址的位置;
所述交通流量特征向量x22为:
其中,其中,ci’表示通过第i个公交或地铁站点的平均人数n4,当(ci)h∈ P:dist((ci)h,o)<r时,ci’=n4,否则ci’=0。
在本发明的一些实施例中,所述竞争强度类特征向量至少包括竞争数量特征向量及竞争实力特征向量,
所述竞争数量特征向量x31为:
其中,di表示第i个同类型医院点,n5为同类型医院点总数;当(di)j∈P: dist((di)j,o)<r时,di=1,否则di=0,其中(di)j表示第i个同类型医院点处于j 位置,P表示在总候选区域范围内的所有位置点集合,o为待选址的位置;
所述竞争实力特征向量x32为:
其中,dm表示第m个同类型医院点;当(bi)g∈P:dist((bi)g,o)<r时,bi=1,否则bi=0;当(dm)j∈P:dist((dm)j,o)<r时,dm=1,否则dm=0。
在本发明的一些实施例中,所述用户意图反馈类特征向量至少包括用户点击因素特征向量,
所述用户点击因素特征向量x41为:
其中,ei表示第i个同类型医院;en表示第n个消费点;当(ei)q∈P: dist((ei)q,o)<r时, 为第i个同类型医院点击总数,否则ei=0,其中(ei)q表示第i个同类型医院点处于q位置;当(en)p∈P:dist((en)p,o)<r时,en=为第n个消费点点击总数,否则en=0,其中(en)p表示第n个同类型医院点处于p位置,P表示在总候选区域范围内的所有位置点集合,o为待选址的位置。
根据本发明的另一方面,还提供一种基于大数据的医院选址装置,包括:模型建立模块,用于基于向量机分类算法建立医院选址模型;样本生成模块,用于生成样本数据,所述样本数据至少包括多个医院的特征向量集,所述特征向量集至少包括人口因素类特征向量、交通设施类特征向量、竞争强度类特征向量、用户意图反馈类特征向量以及综合类特征向量;训练模块,用于根据所述样本数据训练所述医院选址模型;获取模块,用于获取多个待选址的特征向量集;输入模块,用于将多个待选址的特征向量集输入经训练的医院选址模型;以及确定模块,用于根据所述医院选址模型的输出确定是否将各候选址作为选址地址。
根据本发明的再一方面,还提供一种电子设备,所述电子设备包括:处理器;存储介质,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行如上所述的步骤。
根据本发明的又一方面,还提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上所述的步骤。
相比现有技术,本发明的优势在于:
一方面,解析民营医院需求,提取医院选址要素特征,获取要素数据集,并定义选址要素对选址位置影响程度,从而为医院选址提供有力的证据;另一方面,利用向量机分类算法建立医院选址模型,相较于其它算法而言,样本需求量较小,且累积误差小,同时,向量机分类算法尤其适用样本数据线性不可分的医院选址场景中。再一方面,通过选址结果针对用户视觉,形成直观的可视化显示,优化展示选址结果的展示方式。
附图说明
通过参照附图详细描述其示例实施方式,本发明的上述和其它特征及优点将变得更加明显。
图1示出了根据本发明实施例的基于大数据的医院选址方法的流程图。
图2示出了根据本发明具体实施例的展示医院选址方法的流程图。
图3出了根据本发明实施例的基于大数据的医院选址装置的模块图。
图4出了根据本发明另一实施例的基于大数据的医院选址装置的模块图。
图5意性示出本发明示例性实施例中一种计算机可读存储介质示意图。
图6意性示出本发明示例性实施例中一种电子设备示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此,实际执行的顺序有可能根据实际情况改变。
图1示出了根据本发明实施例的基于大数据的医院选址方法的流程图。参考图1,所述基于大数据的医院选址方法包括如下步骤:
步骤S110:基于向量机分类算法建立医院选址模型。
具体而言,支持向量机(Support Vector Machine,SVM)是Cortes和Vapnik 于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度) 和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力(或称泛化能力)。
基于向量机分类算法建立的医院选址模型将结合下述步骤S120的样本数据进行具体的描述。
步骤S120:生成样本数据,所述样本数据至少包括多个医院的特征向量集,所述特征向量集至少包括人口因素类特征向量、交通设施类特征向量、竞争强度类特征向量、用户意图反馈类特征向量以及综合类特征向量。
如下描述的各个特征向量中,在生成样本数据时,医院的位置即为待选址的位置,医院所在的行政区域(或用户自行设定的区域范围)作为该医院的总候选区域范围。
在本发明的一些实施例中,所述人口因素类特征向量至少包括人口数量特征向量及购买水平特征向量。
所述人口数量特征向量x11为:
其中,ai表示第i个人,n1为人口总数;当(ai)f∈P:dist((ai)f,o)<r时,ai=1,否则ai=0,其中(ai)f表示第i个人处于f位置,P表示在总候选区域范围内的所有位置点集合,o为待选址的位置,dist((ai)f,o)表示ai这个人处于f位置与 o位置之间的距离,r为可行半径。可行半径表示用户行走即可到达的距离,可行半径可由用户设定为500米、1000米、1500米等,本发明并非以此为限制。换言之,人口数量特征向量表示,在总候选区域范围内,与该医院的位置(待选址的位置)之间的距离小于可行半径的人数。
所述购买水平特征向量x12为:
否则,x12=0,
消费点可以由用户事先定义,例如,一个商场为一个消费点;又例如,一个商场里的一个商家为一个消费点;消费点可以包含医院也可以不包含医院。消费点的设定可以实际需求进行变更和修改,在此不予赘述。消费点、消费点总数、消费人数、消费点的平均花费例如可以通过每个商家的系统获取。
人口因素类特征向量所包含的特征向量并非以此为限制。
在本发明的一些实施例中,所述交通设施类特征向量至少包括交通枢纽站特征向量及交通流量特征向量。
所述交通枢纽站特征向量x21为:
其中,ci表示第i个公交或地铁站点,n3为公交和地铁站点总数;当(ci)h∈P: dist((ci)h,o)<r时,ci=1,否则ci=0,其中(ci)h表示第i个公交或地铁站点处于 h位置,P表示在总候选区域范围内的所有位置点集合,o为待选址的位置, r为可行半径。可行半径表示用户行走即可到达的距离,可行半径可由用户设定为500米、1000米、1500米等,本发明并非以此为限制。换言之,交通枢纽站特征向量表示,在总候选区域范围内,与该医院的位置(待选址的位置)之间的距离小于可行半径的公交和地铁站点的数量。
所述交通流量特征向量x22为:
其中,其中,ci’表示通过第i个公交或地铁站点的平均人数n4,当(ci)h∈ P:dist((ci)h,o)<r时,ci’=n4,否则ci’=0。P表示在总候选区域范围内的所有位置点集合,o为待选址的位置,r为可行半径。
交通设施类特征向量所包含的特征向量并非以此为限制。
在本发明的一些实施例中,所述竞争强度类特征向量至少包括竞争数量特征向量及竞争实力特征向量,
所述竞争数量特征向量x31为:
其中,di表示第i个同类型医院点,n5为同类型医院点总数;当(di)j∈P: dist((di)j,o)<r时,di=1,否则di=0,其中(di)j表示第i个同类型医院点处于j 位置,P表示在总候选区域范围内的所有位置点集合,o为待选址的位置,r 为可行半径。可行半径表示用户行走即可到达的距离,可行半径可由用户设定为500米、1000米、1500米等,本发明并非以此为限制。换言之,竞争数量特征向量表示,在总候选区域范围内,与该医院的位置(待选址的位置) 之间的距离小于可行半径的同类型医院的数量。医院的类型可以由用户划分,例如,医院的类型可以是按出资方区分的公立医院、民营医院;又例如,医院的类型可以是按看诊科室区分的齿科医院、五官科医院等;再例如,医院的类型可以是按规模大小区分的大型医院、中型医院和小型医院。本发明并非以此为限制。
所述竞争实力特征向量x32为:
其中,dm表示第m个同类型医院点;当(bi)g∈P:dist((bi)g,o)<r时,bi=1,否则bi=0;当(dm)j∈P:dist((dm)j,o)<r时,dm=1,否则dm=0。换言之,所述竞争实力特征向量表示在总候选区域范围内,与该医院的位置(待选址的位置) 之间的距离小于可行半径的消费点中,除同类型医院之外的其余消费点的占比。
在本发明的一些实施例中,所述用户意图反馈类特征向量至少包括用户点击因素特征向量,所述用户点击因素特征向量x41为:
其中,ei表示第i个同类型医院;en表示第n个消费点;当(ei)q∈P: dist((ei)q,o)<r时, 为第i个同类型医院点击总数,否则ei=0,其中(ei)q表示第i个同类型医院点处于q位置;当(en)p∈P:dist((en)p,o)<r时,en=为第n个消费点点击总数,否则en=0,其中(en)p表示第n个同类型医院点处于p位置,P表示在总候选区域范围内的所有位置点集合,o为待选址的位置,r为可行半径。可行半径表示用户行走即可到达的距离,可行半径可由用户设定为500米、1000米、1500米等,本发明并非以此为限制。换言之,用户点击因素特征向量表示在总候选区域范围内,与该医院的位置 (待选址的位置)之间的距离小于可行半径的同类型医院的点击总数与消费点点击总数之比。其中,点击次数可以从业务系统获得。例如,点击次数可以从大众点评、百度地图等具有消费点查询、评价功能的系统中获得。
在本发明的一些实施例中,所述综合类特征向量至少包括城市基础设施特征向量、商业氛围特征向量、城市规划特征向量中的一项或多项。
可以定义城市基础设施特征向量以一线、二线、三线和四线城市为标准,分别给定城市基础设施特征向量x51为1,0.8,0.6和0.5的等级划分。
可以定义商业氛围特征向量以中心、普通和边缘为标准,分别给定商业氛围特征向量x52为1,0.6和0.3的等级划分。
可以定义城市规划特征向量以一线、二线、三线和四线城市为标准,分别给定城市规划特征向量x53为1,0.8,0.6和0.5的等级划分。
步骤S130:根据所述样本数据训练所述医院选址模型;
由此,以上述特征向量包含x=[x11,x12,x21,x22,x31,x32,x41,x51,x52,x53]为例,对基于向量机分类算法建立和训练医院选址模型进行具体描述和说明。
首先,构建分类优化超平面为:
g=w·ok
=w(x11+x12+x21+x22+x31+x32+x41+x51+x52+x53)+ν
=0
其中,ok为输入向量x=[x11,x12,x21,x22,x31,x32,x41,x51,x52,x53],w为权重向量w=[w1,w2,…,wi…,w8],wi为第i个特征的权重,特征总数为10;v为超平面偏置。
决策函数定义为:
f=sgn(g)
其中sgn()为符号函数,输出结果仅为±1。
能耗函数定义为:
约束条件定义为:
其中,N为选址点总数,λi和λj分别是第i组和第j组样本的线性系数, yi和yj分别是第i组和第j组输出类别值。其中,在本发明的一些实施例中,设置医院的位置可以作为正样本,未设置医院的位置可以作为负样本,由此将正样本和负样本皆作为样本以对模型进行训练,由此,正样本的输出类别值为1(表示设置医院),负样本的输出类别值为0(标识未设置医院)。
<>表示核函数计算:
其中,C为惩罚因子,γ为径向基函数系数,X表示特征向量集。
通过最小化能耗函数获取最优线性系数向量λ=[λ1,λ2,…,λN],进而计算出可行权重系数:
选择λ的一个正分量,即0≤λi≤C,i=1,2,....,N,计算可行偏置:
由此,可以获得经训练的决策函数:
f■=sgn(w■·onew+v■)
其中,onew为待选址的特征向量集。
步骤S140:获取多个待选址的特征向量集。
在本发明的一些实施例中,所述多个待选址于总候选区域P内选取。总候选区域P中各待选址点o的编码可以通过该位置地点的经度y和纬度z坐标以及可行半径r表示为o(y,z,r)。多个待选址的特征向量集的获取与步骤 S120中样本数据的特征向量集的生成方式类似,在此不予赘述。
步骤S150:将多个待选址的特征向量集输入经训练的医院选址模型。
步骤S160:根据所述医院选址模型的输出确定是否将各候选址作为选址地址。
由此,将多个待选址的特征向量集onew输入经训练的决策函数 f■=sgn(w■·onew+v■),根据f■的值即可确定是否将各候选址作为选址地址。
在本发明的示例性实施方式的基于大数据的医院选址方法中,一方面,解析民营医院需求,提取医院选址要素特征,获取要素数据集,并定义选址要素对选址位置影响程度,从而为医院选址提供有力的证据;另一方面,利用向量机分类算法建立医院选址模型,相较于其它算法而言,样本需求量较小,且累积误差小,同时,向量机分类算法尤其适用样本数据线性不可分的医院选址场景中。
在本发明的一些具体实现和应用中,对于从患者购买保险、医疗的线上预约到线下就诊等服务的闭环运营的业务系统中将储存大量数据,尤其是门店的服务指标数据:统计出销售额、预约处理及时率,满意度统计、数据回传率、客户爽约占率等,对于数据分析,门店的分类,门店的特征提取有重要意义。由此,在前述的人口因素、交通因素、市场竞争因素之外,还可以提取出一些影响门店选址的其他特征因素:用户行为日志反馈意向因素、品牌影响因素、门店绩效因素等特征以作为特征向量,从而增加模型的准确性。
在本发明的一些具体实现和应用中,选址模型还可以通过输出的修正进行不断得训练和更新。
进一步地,本发明还提供了进一步的实施例,以通过视觉的方式,展示选址结果。具体而言,在图1所示步骤S160根据所述医院选址模型的输出确定是否将各候选址作为选址地址还可以包括展示步骤。展示步骤为展示所述总候选区域的地图,并以不同的颜色、形状、大小或他们的组合标记确定为选址地址的候选址以及确定为非选址地址的候选址,例如,通过绿色圆点、气泡、图钉在地图上的相应位置显示确定为选址地址的候选址;通过红色圆点、气泡、图钉在地图上的相应位置显示确定为选址地址的候选址。
在上述实施例的进一步的实现中,参见图2,当所述总候选区域的地图具有多级缩放模式时,展示步骤包括:
步骤S161:当所述总候选区域的地图以最高级放大模式显示时,确定为选址地址的候选址以及确定为非选址地址的候选址以不同的颜色标记。
最高级放大模式为地图比例尺最大的显示模式,显示更细节的内容。在该模式下,通过绿色气泡或图钉在地图上的相应位置显示确定为选址地址的候选址;通过红色气泡或图钉在地图上的相应位置显示确定为选址地址的候选址。
步骤S162:当所述总候选区域的地图自最高级逐级缩小时,聚合相近区域内的标记,并以不同颜色的比例图标显示该区域内确定为选址地址的候选址以及确定为非选址地址的候选址的比例。
当地图比例尺逐步减小时,地图显示更大范围。比例图标例如可以是圆形/圆环图标,通过该图标中不同颜色的扇形填充显示该区域内确定为选址地址的候选址以及确定为非选址地址的候选址的比例。本发明并非以此为限制。
以上仅仅是示意性的描述本发明的多个实现方式,各个实施例可以单独或组合来实现,本发明并非以此为限。
下面结合图3描述本发明提供的基于大数据的医院选址装置。图3示出了根据本发明实施例的基于大数据的医院选址装置的模块图。基于大数据的医院选址装置200包括模型建立模块210、样本生成模块220、训练模块230、获取模块240、输入模块250以及确定模块260。
模型建立模块210用于基于向量机分类算法建立医院选址模型;
样本生成模块220用于生成样本数据,所述样本数据至少包括多个医院的特征向量集,所述特征向量集至少包括人口因素类特征向量、交通设施类特征向量、竞争强度类特征向量、用户意图反馈类特征向量以及综合类特征向量;
训练模块230用于根据所述样本数据训练所述医院选址模型;
获取模块240用于获取多个待选址的特征向量集;
输入模块250用于将多个待选址的特征向量集输入经训练的医院选址模型;以及
确定模块260用于根据所述医院选址模型的输出确定是否将各候选址作为选址地址。
在本发明的示例性实施方式的基于大数据的医院选址装置中,一方面,解析民营医院需求,提取医院选址要素特征,获取要素数据集,并定义选址要素对选址位置影响程度,从而为医院选址提供有力的证据;另一方面,利用向量机分类算法建立医院选址模型,相较于其它算法而言,样本需求量较小,且累积误差小,同时,向量机分类算法尤其适用样本数据线性不可分的医院选址场景中。
在上述实施例的一个变化例中,如图4所示,基于大数据的医院选址装置的确定模块260还包括一展示模块261。展示模块261用于展示所述总候选区域的地图,并以不同的颜色、形状、大小或他们的组合标记确定为选址地址的候选址以及确定为非选址地址的候选址。
在该实施例的一些具体实现中,所述总候选区域的地图具有多级缩放模式,当所述总候选区域的地图以最高级放大模式显示时,确定为选址地址的候选址以及确定为非选址地址的候选址以不同的颜色标记;以及当所述总候选区域的地图自最高级逐级缩小时,聚合相近区域内的标记,并以不同颜色的比例图标显示该区域内确定为选址地址的候选址以及确定为非选址地址的候选址的比例。
由此,在该实施例中,还通过选址结果针对用户视觉,形成直观的可视化显示,优化展示选址结果的展示方式。
以上仅仅是示意性地示出本发明各个实施例的模块图,在不违背本发明构思的前提下,模块的合并及模块的拆分皆在本发明的保护范围之内。各模块可以由软件、硬件、固件或它们之间的任意组合来实现。
以上仅仅是示意性地描述本发明的一个具体实施方式,在此不予赘述。在本发明的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被例如处理器执行时可以实现上述任意一个实施例中所述基于大数据的医院选址方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述基于大数据的医院选址方法部分中描述的根据本发明各种示例性实施方式的步骤。
参考图5所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品700,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、 C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在租户计算设备上执行、部分地在租户设备上执行、作为一个独立的软件包执行、部分在租户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到租户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
在本发明的示例性实施例中,还提供一种电子设备,该电子设备可以包括处理器,以及用于存储所述处理器的可执行指令的存储器。其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一个实施例中所述基于大数据的医院选址方法的步骤。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图6来描述根据本发明的这种实施方式的电子设备800。图6 显示的电子设备800仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,电子设备800以通用计算设备的形式表现。电子设备800 的组件可以包括但不限于:至少一个处理单元810、至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830、显示单元840等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元810执行,使得所述处理单元810执行本说明书上述基于大数据的医院选址方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元810可以执行如图1所示的步骤。
所述存储单元820可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)8201和/或高速缓存存储单元8202,还可以进一步包括只读存储单元(ROM)8203。
所述存储单元820还可以包括具有一组(至少一个)程序模块8205的程序/实用工具8204,这样的程序模块8205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线830可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备800也可以与一个或多个外部设备900(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得租户能与该电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口850进行。并且,电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器860可以通过总线830与电子设备800的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备800 使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明实施方式的上述基于大数据的医院选址方法。
相比现有技术,本发明的优势在于:
一方面,解析民营医院需求,提取医院选址要素特征,获取要素数据集,并定义选址要素对选址位置影响程度,从而为医院选址提供有力的证据;另一方面,利用向量机分类算法建立医院选址模型,相较于其它算法而言,样本需求量较小,且累积误差小,同时,向量机分类算法尤其适用样本数据线性不可分的医院选址场景中。再一方面,通过选址结果针对用户视觉,形成直观的可视化显示,优化展示选址结果的展示方式。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由所附的权利要求指出。
Claims (10)
1.一种基于大数据的医院选址方法,其特征在于,包括:
基于向量机分类算法建立医院选址模型;
生成样本数据,所述样本数据至少包括多个医院的特征向量集,所述特征向量集至少包括人口因素类特征向量、交通设施类特征向量、竞争强度类特征向量、用户意图反馈类特征向量以及综合类特征向量;
根据所述样本数据训练所述医院选址模型;
获取多个待选址的特征向量集;
将多个待选址的特征向量集输入经训练的医院选址模型;以及
根据所述医院选址模型的输出确定是否将各候选址作为选址地址。
2.如权利要求1所述的基于大数据的医院选址方法,其特征在于,所述多个待选址于总候选区域内选取,其中所述根据所述医院选址模型的输出确定是否将各候选址作为选址地址还包括:
展示所述总候选区域的地图,并以不同的颜色、形状、大小或他们的组合标记确定为选址地址的候选址以及确定为非选址地址的候选址。
3.如权利要求2所述的基于大数据的医院选址方法,其特征在于,所述总候选区域的地图具有多级缩放模式,
当所述总候选区域的地图以最高级放大模式显示时,确定为选址地址的候选址以及确定为非选址地址的候选址以不同的颜色标记;以及
当所述总候选区域的地图自最高级逐级缩小时,聚合相近区域内的标记,并以不同颜色的比例图标显示该区域内确定为选址地址的候选址以及确定为非选址地址的候选址的比例。
4.如权利要求2或3所述的基于大数据的医院选址方法,其特征在于,所述人口因素类特征向量至少包括人口数量特征向量及购买水平特征向量,
所述人口数量特征向量x11为:
其中,ai表示第i个人,n1为人口总数;当(ai)f∈P:dist((ai)f,o)<r时,ai=1,否则ai=0,其中(ai)f表示第i个人处于f位置,P表示在总候选区域范围内的所有位置点集合,o为待选址的位置,dist((ai)f,o)表示ai这个人处于f位置与o位置之间的距离,r为可行半径;
所述购买水平特征向量x12为:
否则,x12=0,
6.如权利要求4所述的基于大数据的医院选址方法,其特征在于,所述竞争强度类特征向量至少包括竞争数量特征向量及竞争实力特征向量,
所述竞争数量特征向量x31为:
其中,di表示第i个同类型医院点,n5为同类型医院点总数;当(di)j∈P:dist((di)j,o)<r时,di=1,否则di=0,其中(di)j表示第i个同类型医院点处于j位置,P表示在总候选区域范围内的所有位置点集合,o为待选址的位置;
所述竞争实力特征向量x32为:
其中,dm表示第m个同类型医院点;当(bi)g∈P:dist((bi)g,o)<r时,bi=1,否则bi=0;当(dm)j∈P:dist((dm)j,o)<r时,dm=1,否则dm=0。
8.一种基于大数据的医院选址装置,其特征在于,包括:
模型建立模块,用于基于向量机分类算法建立医院选址模型;
样本生成模块,用于生成样本数据,所述样本数据至少包括多个医院的特征向量集,所述特征向量集至少包括人口因素类特征向量、交通设施类特征向量、竞争强度类特征向量、用户意图反馈类特征向量以及综合类特征向量;
训练模块,用于根据所述样本数据训练所述医院选址模型;
获取模块,用于获取多个待选址的特征向量集;
输入模块,用于将多个待选址的特征向量集输入经训练的医院选址模型;以及
确定模块,用于根据所述医院选址模型的输出确定是否将各候选址作为选址地址。
9.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行如权利要求1至7任一项所述的基于大数据的医院选址方法。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一项所述的基于大数据的医院选址方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911146807.5A CN112907000A (zh) | 2019-11-19 | 2019-11-19 | 基于大数据的医院选址方法、装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911146807.5A CN112907000A (zh) | 2019-11-19 | 2019-11-19 | 基于大数据的医院选址方法、装置、电子设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112907000A true CN112907000A (zh) | 2021-06-04 |
Family
ID=76103661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911146807.5A Pending CN112907000A (zh) | 2019-11-19 | 2019-11-19 | 基于大数据的医院选址方法、装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112907000A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114819756A (zh) * | 2022-06-24 | 2022-07-29 | 深圳众城卓越科技有限公司 | 基于分类模型的风电机组智能选址方法、装置及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105205577A (zh) * | 2014-06-20 | 2015-12-30 | 国家电网公司 | 客服工单地域细化分析方法 |
CN106384250A (zh) * | 2016-09-13 | 2017-02-08 | 百度在线网络技术(北京)有限公司 | 一种选址方法及装置 |
CN106548367A (zh) * | 2016-10-12 | 2017-03-29 | 电子科技大学 | 多源数据的选址模型及其应用研究 |
-
2019
- 2019-11-19 CN CN201911146807.5A patent/CN112907000A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105205577A (zh) * | 2014-06-20 | 2015-12-30 | 国家电网公司 | 客服工单地域细化分析方法 |
CN106384250A (zh) * | 2016-09-13 | 2017-02-08 | 百度在线网络技术(北京)有限公司 | 一种选址方法及装置 |
CN106548367A (zh) * | 2016-10-12 | 2017-03-29 | 电子科技大学 | 多源数据的选址模型及其应用研究 |
Non-Patent Citations (2)
Title |
---|
刁永浩: "基于随机规划的医院选址⽅法研究", 《中国优秀硕⼠学位论文全文数据库 经济与管理科学辑》, 15 April 2010 (2010-04-15), pages 145 - 161 * |
张悦涵: "基于多源数据的选址模型及其应用研究", 《中国优秀硕⼠学位论文全文数据库经济与管理科学辑》, 15 February 2016 (2016-02-15), pages 157 - 106 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114819756A (zh) * | 2022-06-24 | 2022-07-29 | 深圳众城卓越科技有限公司 | 基于分类模型的风电机组智能选址方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bracken et al. | The generation of spatial population distributions from census centroid data | |
Fisher et al. | Modelling the errors in areal interpolation between zonal systems by Monte Carlo simulation | |
Wang | From 2SFCA to i2SFCA: Integration, derivation and validation | |
Balakrishna et al. | Calibration of microscopic traffic simulation models: Methods and application | |
Wilk et al. | From water poverty to water prosperity—A more participatory approach to studying local water resources management | |
Mu et al. | A scale-space clustering method: Mitigating the effect of scale in the analysis of zone-based data | |
US20170103090A1 (en) | Entity Display Priority in a Distributed Geographic Information System | |
Chang et al. | Identification of the technology life cycle of telematics: A patent-based analytical perspective | |
US20200034776A1 (en) | Managing skills as clusters using machine learning and domain knowledge expert | |
Wang et al. | Modeling spatial accessibility of immigrants to culturally diverse family physicians | |
Getis et al. | Spatial analysis and modeling in a GIS environment | |
Sen | Investment decisions under uncertainty | |
JP7318646B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
Wiesenfarth et al. | Bayesian geoadditive sample selection models | |
CN109191181B (zh) | 一种基于神经网络和Huff模型的数字标牌广告受众人群分类方法 | |
Johar et al. | Destination marketing: Optimizing resource allocation using modern portfolio theory | |
Sun et al. | Forecasting tourism demand with a new time-varying forecast averaging approach | |
Williams | Economic impacts from development of the coastal town in Queensland on tourism and regional economy | |
Sun et al. | Generative methods for Urban design and rapid solution space exploration | |
CN114757518A (zh) | 资产评估方法、装置、设备及介质 | |
Adeleye et al. | Examining the influence of ICT innovation in the finance-tourism nexus in Asia | |
CN112907000A (zh) | 基于大数据的医院选址方法、装置、电子设备、存储介质 | |
Huang | Simulating individual work trips for transit-facilitated accessibility study | |
Lu et al. | Coordinated price quotation and production scheduling for uncertain order inquiries | |
Peleckis | Application of the multicriteria method seeking to assess concentration, and its effects on competition in the manufacturing sector |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |