CN108804496A - 一种基于PageRank算法的医院重要性排名方法 - Google Patents

一种基于PageRank算法的医院重要性排名方法 Download PDF

Info

Publication number
CN108804496A
CN108804496A CN201810283655.2A CN201810283655A CN108804496A CN 108804496 A CN108804496 A CN 108804496A CN 201810283655 A CN201810283655 A CN 201810283655A CN 108804496 A CN108804496 A CN 108804496A
Authority
CN
China
Prior art keywords
hospital
importance
related network
pagerank
ranking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810283655.2A
Other languages
English (en)
Inventor
宣琦
李永苗
虞烨炜
郑钧
俞山青
阮中远
徐东伟
许荣华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201810283655.2A priority Critical patent/CN108804496A/zh
Publication of CN108804496A publication Critical patent/CN108804496A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms

Landscapes

  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

一种基于PageRank算法的医院重要性排名方法,包括以下步骤:步骤1:收集关于医生多点执业的行为数据,构建医院关联网络;步骤2:根据医院关联网络生成概率转移矩阵;步骤3:采用PageRank算法对医院重要性进行排名;步骤4:采用Spearman秩相关系数与医院的网上排名进行相关性分析。本发明通过构建医院关联网络,使用PageRank算法实现对一线和新一线城市的医院关联网络中的医院进行重要性排名,最后使用Spearman秩相关系数与医院的网上排名进行相关性分析;后续能够实现对一线和新一线城市的医院重要性排名情况与各城市实施的政策、交通状况等相结合进行分析。

Description

一种基于PageRank算法的医院重要性排名方法
技术领域
本发明涉及数据挖掘、网络科学技术,特别是涉及一种基于PageRank算法的医院重要性排名方法。
背景技术
伴随着信息技术的迅猛发展,人类的社会活动日趋网络化。我们的生活被各种网络包围着,例如与他人交流的在线社交网络、通信网络、科研合作网络;与生活密切相关的因特网、交通网络、电力网络;与人自身相关的新陈代谢网络、神经网络、基因调控网络等等。随着网络科学的蓬勃发展,节点重要性的研究进一步受到人们的关注。如何正确评价节点的重要性已成为复杂网络研究中的一项具有重要意义的课题。
基于随机游走的节点重要性排序方法主要用于网页排序。由于网页之间的链接关系可以解释为网页之间的相互关联,该方法基于此区分网页的重要程度。这类典型的方法有PageRank算法,LeaderRank算法和HITS算法等。PageRank算法是用于搜索引擎中网页排序的经典算法。该算法基于“从优质网页链接而来的网页必定还是优质网页”的回归关系,其基本思想是:当网页A有一个连接指向网页B,就认为B获得了A对它贡献的分值,该值的多少取决于网络A本身的重要程度,即网页A的重要性越大,网页B获得的贡献值就越高。由于网络中网页连接的相互指向,该分值的计算为一个迭代过程,最终网页根据所得分值进行检索排序。PageRank的使用基于两个前提,一是指向一个网页的超链接数越多,表明这个网页越重要;二是指向网页的入链质量不同,质量高的页面会通过链接向其他页面传递更多的权重,所以越是质量高的页面指向的页面重要性也越高。
发明内容
为了克服现有技术中无法实现医院重要性排名方法的不足,研究一线城市与新一线城市的医生行为对医院重要性排名的影响。本发明提出一种基于PageRank算法的医院重要性排名方法,构建医院关联网络,通过PageRank算法根据一线城市与新一线城市的医院关联网络对各城市的医院进行排名,最后使用Spearman秩相关系数与医院的网上排名进行相关性分析。
本发明解决其技术问题所采用的技术方案如下:
一种基于PageRank算法的医院重要性排名方法,包括以下步骤:
步骤1:收集关于医生多点执业的行为数据,构建医院关联网络;
步骤2:根据医院关联网络生成概率转移矩阵;
步骤3:采用PageRank算法对医院重要性进行排名;
步骤4:采用Spearman秩相关系数与医院的网上排名进行相关性分析。
进一步,所述步骤1中,收集关于医生多点执业的行为数据,构建医院关联网络。所述医院关联网络为一个由集合V、E和W组成的图,记为G=(V,E,W),其中V={v1,v2,…,vN}是节点集合,每个节点表示一个医院;是无向连边集合,表示医院之间的关系;W=(wij)N×N是连边权重集合,表示两个医院共享医生的人数。
再进一步,所述步骤2中,根据医院关联网络生成概率转移矩阵,同时我们增加随机跳转,引入阻尼系数p。概率转移矩阵A′,计算如下:
其中,阻尼系数p=0.85,E为全是1的矩阵,N表示网络中节点的总数。
更进一步,所述步骤3中,采用PageRank算法对医院重要性进行排名,处理过程如下:考虑医院关联网络连边的权值大小,借鉴搜索引擎中PageRank排名算法思想,医院关联网络中节点vi的PageRank值,计算如下:
其中,kj表示节点vj的度。
所述步骤4中,采用Spearman秩相关系数与医院的网上排名进行相关性分析,处理过程如下:Spearman秩相关系数用来估计两个变量X、Y之间的相关性,其中变量间的相关性可以使用单调函数来描述;如果两个变量取值的两个集合中均不存在相同的两个元素,那么,当其中一个变量表示为另一个变量的很好的单调函数时,即两个变量的变化趋势相同,两个变量之间的ρ达到+1或-1,计算如下:
其中,N表示网络中节点的总数,di表示两个变量的等级的差值。
本发明的有益效果为:基于PageRank算法的医院重要性排名方法,通过构建医院关联网络,使用PageRank算法实现对一线和新一线城市的医院关联网络中的医院进行重要性排名,最后使用Spearman秩相关系数与医院的网上排名进行相关性分析。后续能够实现对一线和新一线城市的医院重要性排名情况与各城市实施的政策、交通状况等相结合进行分析。
附图说明
图1为本发明中程序设计流程图;
图2为本发明中医院关联网络图。
具体实施方式
下面结合说明书附图对本发明的具体实施方式作进一步详细的描述。
参照图1~图2,一种基于PageRank算法的医院重要性排名方法,本发明使用的数据记录了多点执业的医生姓名,医院名称,医院地址等信息。
本发明具体分为以下四个步骤:
步骤1:收集关于医生多点执业的行为数据,构建医院关联网络;
步骤2:根据医院关联网络生成概率转移矩阵;
步骤3:采用PageRank算法对医院重要性进行排名;
步骤4:采用Spearman秩相关系数与医院的网上排名进行相关性分析。
所述步骤1中,收集关于医生多点执业的行为数据,构建医院关联网络。所述医院关联网络为一个由集合V、E和W组成的图,记为G=(V,E,W),其中V={v1,v2,…,vN}是节点集合,每个节点表示一个医院;是无向连边集合,表示医院之间的关系;W=(wij)N×N是连边权重集合,表示两个医院共享医生的人数。
所述步骤2中,根据医院关联网络生成概率转移矩阵,考虑随机跳转,引入阻尼系数p。概率转移矩阵A′,计算如下:
其中,阻尼系数p=0.85,E为全是1的矩阵,N表示网络中节点的总数。
所述步骤3中,采用PageRank算法对医院重要性进行排名,处理过程如下:综合考虑医院关联网络连边的权值大小,借鉴搜索引擎中PageRank排名算法思想,旨在提出医院关联网络节点重要性评估的新指标及具体方法,从而能准确、有效地给出医院排名;医院关联网络中节点vi的PageRank值,计算如下:
其中,kj表示节点vj的度。
所述步骤4中,采用Spearman秩相关系数与医院的网上排名进行相关性分析,处理过程如下:Spearman秩相关系数用来估计两个变量X、Y之间的相关性,其中变量间的相关性可以使用单调函数来描述;如果两个变量取值的两个集合中均不存在相同的两个元素,那么,当其中一个变量表示为另一个变量的很好的单调函数时,即两个变量的变化趋势相同,两个变量之间的ρ达到+1或-1,计算如下:
其中,N表示网络中节点的总数,di表示两个变量的等级的差值。
本发明以重庆市为例,列举了PageRank值排名前十的医院,最后的医院重要性排名结果见表1。
表1
Spearman秩相关系数,表明PageRank排名与医院的网上排名具有显著的相关性。
如上所述为本发明使用收集的数据,通过构建医院关联网络,使用PageRank算法实现对一线和新一线城市的医院关联网络中的医院进行重要性排名,最后使用Spearman秩相关系数与医院的网上排名进行相关性分析。对发明而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在发明权利要求所限定的精神和范围内可对其进行许多改变,修改,甚至等效,但都将落入本发明的保护范围内。

Claims (5)

1.一种基于PageRank算法的医院重要性排名方法,其特征在于,所述方法包括以下步骤:
步骤1:收集关于医生多点执业的行为数据,构建医院关联网络;
步骤2:根据医院关联网络生成概率转移矩阵;
步骤3:采用PageRank算法对医院重要性进行排名;
步骤4:采用Spearman秩相关系数与医院的网上排名进行相关性分析。
2.如权利要求1所述的一种基于PageRank算法的医院重要性排名方法,其特征在于:所述步骤1中,收集关于医生多点执业的行为数据,构建医院关联网络。所述医院关联网络为一个由集合V、E和W组成的图,记为G=(V,E,W),其中V={v1,v2,…,vN}是节点集合,每个节点表示一个医院;是无向连边集合,表示医院之间的关系;W=(wij)N×N是连边权重集合,表示两个医院共享医生的人数。
3.如权利要求2所述的一种基于PageRank算法的医院重要性排名方法,其特征在于:所述步骤2中,根据医院关联网络生成概率转移矩阵,考虑随机跳转,引入阻尼系数p,概率转移矩阵A',计算如下:
其中,阻尼系数p=0.85,E为全是1的矩阵,N表示网络中节点的总数。
4.如权利要求1~3之一所述的一种基于PageRank算法的医院重要性排名方法,其特征在于:所述步骤3中,采用PageRank算法对医院重要性进行排名,处理过程如下:考虑医院关联网络连边的权值大小,借鉴搜索引擎中PageRank排名算法思想,医院关联网络中节点vi的PageRank值,计算如下:
其中,kj表示节点vj的度。
5.如权利要求4所述的一种基于PageRank算法的医院重要性排名方法,其特征在于:所述步骤4中,采用Spearman秩相关系数与医院的网上排名进行相关性分析,处理过程如下:Spearman秩相关系数用来估计两个变量X、Y之间的相关性,其中变量间的相关性使用单调函数来描述;如果两个变量取值的两个集合中均不存在相同的两个元素,那么,当其中一个变量表示为另一个变量的很好的单调函数时,即两个变量的变化趋势相同,两个变量之间的ρ达到+1或-1,计算如下:
其中,N表示网络中节点的总数,di表示两个变量的等级的差值。
CN201810283655.2A 2018-04-02 2018-04-02 一种基于PageRank算法的医院重要性排名方法 Pending CN108804496A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810283655.2A CN108804496A (zh) 2018-04-02 2018-04-02 一种基于PageRank算法的医院重要性排名方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810283655.2A CN108804496A (zh) 2018-04-02 2018-04-02 一种基于PageRank算法的医院重要性排名方法

Publications (1)

Publication Number Publication Date
CN108804496A true CN108804496A (zh) 2018-11-13

Family

ID=64095491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810283655.2A Pending CN108804496A (zh) 2018-04-02 2018-04-02 一种基于PageRank算法的医院重要性排名方法

Country Status (1)

Country Link
CN (1) CN108804496A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726820A (zh) * 2018-12-18 2019-05-07 新奥数能科技有限公司 能源节点重要度的计算方法及装置、存储介质、电子装置
CN110555587A (zh) * 2019-07-23 2019-12-10 中国地质大学(武汉) 基于多种流数据的城市分级方法
CN118094249A (zh) * 2024-04-23 2024-05-28 西安羚控电子科技有限公司 一种提高多模态输入鲁棒性的方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726820A (zh) * 2018-12-18 2019-05-07 新奥数能科技有限公司 能源节点重要度的计算方法及装置、存储介质、电子装置
CN110555587A (zh) * 2019-07-23 2019-12-10 中国地质大学(武汉) 基于多种流数据的城市分级方法
CN110555587B (zh) * 2019-07-23 2023-04-21 中国地质大学(武汉) 基于多种流数据的城市分级方法
CN118094249A (zh) * 2024-04-23 2024-05-28 西安羚控电子科技有限公司 一种提高多模态输入鲁棒性的方法及装置

Similar Documents

Publication Publication Date Title
Zhou et al. Userrec: A user recommendation framework in social tagging systems
Menczer Complementing search engines with online web mining agents
Walter et al. A citation and co-citation analysis of 10 years of KM theory and practices
CN110462604A (zh) 基于设备使用关联互联网设备的数据处理系统和方法
CN103646092B (zh) 基于用户参与的搜索引擎排序方法
Jain et al. Page ranking algorithms in web mining, limitations of existing methods and a new method for indexing web pages
CN110321494A (zh) 基于矩阵分解与网络嵌入联合模型的社会化推荐方法
CN108804496A (zh) 一种基于PageRank算法的医院重要性排名方法
CN110222260A (zh) 一种搜索方法、装置及存储介质
CN102737050A (zh) 应用在搜索引擎优化中的关键词动态调整方法和系统
CN103745006B (zh) 一种互联网信息搜索系统及方法
Wang et al. Exploring all-author tripartite citation networks: A case study of gene editing
Zhao et al. [Retracted] Athleteʼs Physical Fitness Prediction Model Algorithm and Index Optimization Analysis under the Environment of AI
Yu et al. CI-Rank: Collective importance ranking for keyword search in databases
Ayaka et al. Mapping modern science using co-citation analysis
Jiang et al. BBS opinion leader mining based on an improved PageRank algorithm using MapReduce
Shirgahi et al. Trust estimation of the semantic web using semantic web clustering
Tang et al. Corpus-level end-to-end exploration for interactive systems
Jia et al. Multilayer social network overlapping community detection algorithm based on trust relationship
US8706721B1 (en) Method to optimally link information and humans using human referral signals
Shafia et al. A hybrid algorithm for data clustering using honey bee algorithm, genetic algorithm and k-means method
Derhami et al. Web pages ranking algorithm based on reinforcement learning and user feedback
Valverde-Rebaza et al. A naïve bayes model based on overlapping groups for link prediction in online social networks
Wei et al. An improved pagerank algorithm based on text similarity approach for critical standards identification in complex standard citation networks
Mohanraj et al. Ontology driven bee's foraging approach based self adaptive online recommendation system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181113