CN108804496A - 一种基于PageRank算法的医院重要性排名方法 - Google Patents
一种基于PageRank算法的医院重要性排名方法 Download PDFInfo
- Publication number
- CN108804496A CN108804496A CN201810283655.2A CN201810283655A CN108804496A CN 108804496 A CN108804496 A CN 108804496A CN 201810283655 A CN201810283655 A CN 201810283655A CN 108804496 A CN108804496 A CN 108804496A
- Authority
- CN
- China
- Prior art keywords
- hospital
- importance
- related network
- pagerank
- ranking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000003646 Spearman's rank correlation coefficient Methods 0.000 claims abstract description 14
- 239000011159 matrix material Substances 0.000 claims abstract description 13
- 238000010219 correlation analysis Methods 0.000 claims abstract description 11
- 238000012546 transfer Methods 0.000 claims abstract description 9
- 230000003542 behavioural effect Effects 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims description 6
- 230000006855 networking Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 101000911753 Homo sapiens Protein FAM107B Proteins 0.000 description 1
- 102100026983 Protein FAM107B Human genes 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
Landscapes
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
一种基于PageRank算法的医院重要性排名方法,包括以下步骤:步骤1:收集关于医生多点执业的行为数据,构建医院关联网络;步骤2:根据医院关联网络生成概率转移矩阵;步骤3:采用PageRank算法对医院重要性进行排名;步骤4:采用Spearman秩相关系数与医院的网上排名进行相关性分析。本发明通过构建医院关联网络,使用PageRank算法实现对一线和新一线城市的医院关联网络中的医院进行重要性排名,最后使用Spearman秩相关系数与医院的网上排名进行相关性分析;后续能够实现对一线和新一线城市的医院重要性排名情况与各城市实施的政策、交通状况等相结合进行分析。
Description
技术领域
本发明涉及数据挖掘、网络科学技术,特别是涉及一种基于PageRank算法的医院重要性排名方法。
背景技术
伴随着信息技术的迅猛发展,人类的社会活动日趋网络化。我们的生活被各种网络包围着,例如与他人交流的在线社交网络、通信网络、科研合作网络;与生活密切相关的因特网、交通网络、电力网络;与人自身相关的新陈代谢网络、神经网络、基因调控网络等等。随着网络科学的蓬勃发展,节点重要性的研究进一步受到人们的关注。如何正确评价节点的重要性已成为复杂网络研究中的一项具有重要意义的课题。
基于随机游走的节点重要性排序方法主要用于网页排序。由于网页之间的链接关系可以解释为网页之间的相互关联,该方法基于此区分网页的重要程度。这类典型的方法有PageRank算法,LeaderRank算法和HITS算法等。PageRank算法是用于搜索引擎中网页排序的经典算法。该算法基于“从优质网页链接而来的网页必定还是优质网页”的回归关系,其基本思想是:当网页A有一个连接指向网页B,就认为B获得了A对它贡献的分值,该值的多少取决于网络A本身的重要程度,即网页A的重要性越大,网页B获得的贡献值就越高。由于网络中网页连接的相互指向,该分值的计算为一个迭代过程,最终网页根据所得分值进行检索排序。PageRank的使用基于两个前提,一是指向一个网页的超链接数越多,表明这个网页越重要;二是指向网页的入链质量不同,质量高的页面会通过链接向其他页面传递更多的权重,所以越是质量高的页面指向的页面重要性也越高。
发明内容
为了克服现有技术中无法实现医院重要性排名方法的不足,研究一线城市与新一线城市的医生行为对医院重要性排名的影响。本发明提出一种基于PageRank算法的医院重要性排名方法,构建医院关联网络,通过PageRank算法根据一线城市与新一线城市的医院关联网络对各城市的医院进行排名,最后使用Spearman秩相关系数与医院的网上排名进行相关性分析。
本发明解决其技术问题所采用的技术方案如下:
一种基于PageRank算法的医院重要性排名方法,包括以下步骤:
步骤1:收集关于医生多点执业的行为数据,构建医院关联网络;
步骤2:根据医院关联网络生成概率转移矩阵;
步骤3:采用PageRank算法对医院重要性进行排名;
步骤4:采用Spearman秩相关系数与医院的网上排名进行相关性分析。
进一步,所述步骤1中,收集关于医生多点执业的行为数据,构建医院关联网络。所述医院关联网络为一个由集合V、E和W组成的图,记为G=(V,E,W),其中V={v1,v2,…,vN}是节点集合,每个节点表示一个医院;是无向连边集合,表示医院之间的关系;W=(wij)N×N是连边权重集合,表示两个医院共享医生的人数。
再进一步,所述步骤2中,根据医院关联网络生成概率转移矩阵,同时我们增加随机跳转,引入阻尼系数p。概率转移矩阵A′,计算如下:
其中,阻尼系数p=0.85,E为全是1的矩阵,N表示网络中节点的总数。
更进一步,所述步骤3中,采用PageRank算法对医院重要性进行排名,处理过程如下:考虑医院关联网络连边的权值大小,借鉴搜索引擎中PageRank排名算法思想,医院关联网络中节点vi的PageRank值,计算如下:
其中,kj表示节点vj的度。
所述步骤4中,采用Spearman秩相关系数与医院的网上排名进行相关性分析,处理过程如下:Spearman秩相关系数用来估计两个变量X、Y之间的相关性,其中变量间的相关性可以使用单调函数来描述;如果两个变量取值的两个集合中均不存在相同的两个元素,那么,当其中一个变量表示为另一个变量的很好的单调函数时,即两个变量的变化趋势相同,两个变量之间的ρ达到+1或-1,计算如下:
其中,N表示网络中节点的总数,di表示两个变量的等级的差值。
本发明的有益效果为:基于PageRank算法的医院重要性排名方法,通过构建医院关联网络,使用PageRank算法实现对一线和新一线城市的医院关联网络中的医院进行重要性排名,最后使用Spearman秩相关系数与医院的网上排名进行相关性分析。后续能够实现对一线和新一线城市的医院重要性排名情况与各城市实施的政策、交通状况等相结合进行分析。
附图说明
图1为本发明中程序设计流程图;
图2为本发明中医院关联网络图。
具体实施方式
下面结合说明书附图对本发明的具体实施方式作进一步详细的描述。
参照图1~图2,一种基于PageRank算法的医院重要性排名方法,本发明使用的数据记录了多点执业的医生姓名,医院名称,医院地址等信息。
本发明具体分为以下四个步骤:
步骤1:收集关于医生多点执业的行为数据,构建医院关联网络;
步骤2:根据医院关联网络生成概率转移矩阵;
步骤3:采用PageRank算法对医院重要性进行排名;
步骤4:采用Spearman秩相关系数与医院的网上排名进行相关性分析。
所述步骤1中,收集关于医生多点执业的行为数据,构建医院关联网络。所述医院关联网络为一个由集合V、E和W组成的图,记为G=(V,E,W),其中V={v1,v2,…,vN}是节点集合,每个节点表示一个医院;是无向连边集合,表示医院之间的关系;W=(wij)N×N是连边权重集合,表示两个医院共享医生的人数。
所述步骤2中,根据医院关联网络生成概率转移矩阵,考虑随机跳转,引入阻尼系数p。概率转移矩阵A′,计算如下:
其中,阻尼系数p=0.85,E为全是1的矩阵,N表示网络中节点的总数。
所述步骤3中,采用PageRank算法对医院重要性进行排名,处理过程如下:综合考虑医院关联网络连边的权值大小,借鉴搜索引擎中PageRank排名算法思想,旨在提出医院关联网络节点重要性评估的新指标及具体方法,从而能准确、有效地给出医院排名;医院关联网络中节点vi的PageRank值,计算如下:
其中,kj表示节点vj的度。
所述步骤4中,采用Spearman秩相关系数与医院的网上排名进行相关性分析,处理过程如下:Spearman秩相关系数用来估计两个变量X、Y之间的相关性,其中变量间的相关性可以使用单调函数来描述;如果两个变量取值的两个集合中均不存在相同的两个元素,那么,当其中一个变量表示为另一个变量的很好的单调函数时,即两个变量的变化趋势相同,两个变量之间的ρ达到+1或-1,计算如下:
其中,N表示网络中节点的总数,di表示两个变量的等级的差值。
本发明以重庆市为例,列举了PageRank值排名前十的医院,最后的医院重要性排名结果见表1。
表1
Spearman秩相关系数,表明PageRank排名与医院的网上排名具有显著的相关性。
如上所述为本发明使用收集的数据,通过构建医院关联网络,使用PageRank算法实现对一线和新一线城市的医院关联网络中的医院进行重要性排名,最后使用Spearman秩相关系数与医院的网上排名进行相关性分析。对发明而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在发明权利要求所限定的精神和范围内可对其进行许多改变,修改,甚至等效,但都将落入本发明的保护范围内。
Claims (5)
1.一种基于PageRank算法的医院重要性排名方法,其特征在于,所述方法包括以下步骤:
步骤1:收集关于医生多点执业的行为数据,构建医院关联网络;
步骤2:根据医院关联网络生成概率转移矩阵;
步骤3:采用PageRank算法对医院重要性进行排名;
步骤4:采用Spearman秩相关系数与医院的网上排名进行相关性分析。
2.如权利要求1所述的一种基于PageRank算法的医院重要性排名方法,其特征在于:所述步骤1中,收集关于医生多点执业的行为数据,构建医院关联网络。所述医院关联网络为一个由集合V、E和W组成的图,记为G=(V,E,W),其中V={v1,v2,…,vN}是节点集合,每个节点表示一个医院;是无向连边集合,表示医院之间的关系;W=(wij)N×N是连边权重集合,表示两个医院共享医生的人数。
3.如权利要求2所述的一种基于PageRank算法的医院重要性排名方法,其特征在于:所述步骤2中,根据医院关联网络生成概率转移矩阵,考虑随机跳转,引入阻尼系数p,概率转移矩阵A',计算如下:
其中,阻尼系数p=0.85,E为全是1的矩阵,N表示网络中节点的总数。
4.如权利要求1~3之一所述的一种基于PageRank算法的医院重要性排名方法,其特征在于:所述步骤3中,采用PageRank算法对医院重要性进行排名,处理过程如下:考虑医院关联网络连边的权值大小,借鉴搜索引擎中PageRank排名算法思想,医院关联网络中节点vi的PageRank值,计算如下:
其中,kj表示节点vj的度。
5.如权利要求4所述的一种基于PageRank算法的医院重要性排名方法,其特征在于:所述步骤4中,采用Spearman秩相关系数与医院的网上排名进行相关性分析,处理过程如下:Spearman秩相关系数用来估计两个变量X、Y之间的相关性,其中变量间的相关性使用单调函数来描述;如果两个变量取值的两个集合中均不存在相同的两个元素,那么,当其中一个变量表示为另一个变量的很好的单调函数时,即两个变量的变化趋势相同,两个变量之间的ρ达到+1或-1,计算如下:
其中,N表示网络中节点的总数,di表示两个变量的等级的差值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810283655.2A CN108804496A (zh) | 2018-04-02 | 2018-04-02 | 一种基于PageRank算法的医院重要性排名方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810283655.2A CN108804496A (zh) | 2018-04-02 | 2018-04-02 | 一种基于PageRank算法的医院重要性排名方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108804496A true CN108804496A (zh) | 2018-11-13 |
Family
ID=64095491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810283655.2A Pending CN108804496A (zh) | 2018-04-02 | 2018-04-02 | 一种基于PageRank算法的医院重要性排名方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108804496A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109726820A (zh) * | 2018-12-18 | 2019-05-07 | 新奥数能科技有限公司 | 能源节点重要度的计算方法及装置、存储介质、电子装置 |
CN110555587A (zh) * | 2019-07-23 | 2019-12-10 | 中国地质大学(武汉) | 基于多种流数据的城市分级方法 |
CN118094249A (zh) * | 2024-04-23 | 2024-05-28 | 西安羚控电子科技有限公司 | 一种提高多模态输入鲁棒性的方法及装置 |
-
2018
- 2018-04-02 CN CN201810283655.2A patent/CN108804496A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109726820A (zh) * | 2018-12-18 | 2019-05-07 | 新奥数能科技有限公司 | 能源节点重要度的计算方法及装置、存储介质、电子装置 |
CN110555587A (zh) * | 2019-07-23 | 2019-12-10 | 中国地质大学(武汉) | 基于多种流数据的城市分级方法 |
CN110555587B (zh) * | 2019-07-23 | 2023-04-21 | 中国地质大学(武汉) | 基于多种流数据的城市分级方法 |
CN118094249A (zh) * | 2024-04-23 | 2024-05-28 | 西安羚控电子科技有限公司 | 一种提高多模态输入鲁棒性的方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhou et al. | Userrec: A user recommendation framework in social tagging systems | |
Menczer | Complementing search engines with online web mining agents | |
Walter et al. | A citation and co-citation analysis of 10 years of KM theory and practices | |
CN110462604A (zh) | 基于设备使用关联互联网设备的数据处理系统和方法 | |
CN103646092B (zh) | 基于用户参与的搜索引擎排序方法 | |
Jain et al. | Page ranking algorithms in web mining, limitations of existing methods and a new method for indexing web pages | |
CN110321494A (zh) | 基于矩阵分解与网络嵌入联合模型的社会化推荐方法 | |
CN108804496A (zh) | 一种基于PageRank算法的医院重要性排名方法 | |
CN110222260A (zh) | 一种搜索方法、装置及存储介质 | |
CN102737050A (zh) | 应用在搜索引擎优化中的关键词动态调整方法和系统 | |
CN103745006B (zh) | 一种互联网信息搜索系统及方法 | |
Wang et al. | Exploring all-author tripartite citation networks: A case study of gene editing | |
Zhao et al. | [Retracted] Athleteʼs Physical Fitness Prediction Model Algorithm and Index Optimization Analysis under the Environment of AI | |
Yu et al. | CI-Rank: Collective importance ranking for keyword search in databases | |
Ayaka et al. | Mapping modern science using co-citation analysis | |
Jiang et al. | BBS opinion leader mining based on an improved PageRank algorithm using MapReduce | |
Shirgahi et al. | Trust estimation of the semantic web using semantic web clustering | |
Tang et al. | Corpus-level end-to-end exploration for interactive systems | |
Jia et al. | Multilayer social network overlapping community detection algorithm based on trust relationship | |
US8706721B1 (en) | Method to optimally link information and humans using human referral signals | |
Shafia et al. | A hybrid algorithm for data clustering using honey bee algorithm, genetic algorithm and k-means method | |
Derhami et al. | Web pages ranking algorithm based on reinforcement learning and user feedback | |
Valverde-Rebaza et al. | A naïve bayes model based on overlapping groups for link prediction in online social networks | |
Wei et al. | An improved pagerank algorithm based on text similarity approach for critical standards identification in complex standard citation networks | |
Mohanraj et al. | Ontology driven bee's foraging approach based self adaptive online recommendation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181113 |