CN106779181B - 一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法 - Google Patents

一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法 Download PDF

Info

Publication number
CN106779181B
CN106779181B CN201611073910.8A CN201611073910A CN106779181B CN 106779181 B CN106779181 B CN 106779181B CN 201611073910 A CN201611073910 A CN 201611073910A CN 106779181 B CN106779181 B CN 106779181B
Authority
CN
China
Prior art keywords
heel
vector
round
treatment
medical institution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611073910.8A
Other languages
English (en)
Other versions
CN106779181A (zh
Inventor
王静远
林雅婷
吴俊杰
熊璋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Beihang Emerging Industrial Technology Research Institute
Original Assignee
Shenzhen Beihang Emerging Industrial Technology Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Beihang Emerging Industrial Technology Research Institute filed Critical Shenzhen Beihang Emerging Industrial Technology Research Institute
Priority to CN201611073910.8A priority Critical patent/CN106779181B/zh
Publication of CN106779181A publication Critical patent/CN106779181A/zh
Application granted granted Critical
Publication of CN106779181B publication Critical patent/CN106779181B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Child & Adolescent Psychology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法,该方法依据线性回归张量因子对医疗机构—居住区就诊量矩阵进行处理,得到医疗机构推荐目标模型;进而采用隐性特征模型对多元异构的推荐用原始数据进行活化数据挖掘,得到隐性特征矩阵;最后通过迭代计算医疗机构—居住区就诊量矩阵是否达到收敛,若收敛,则采用推荐标准误差模型进行计算修正后的医疗机构—居住区就诊量矩阵,从而将推荐结果提供给用户。本发明应用在推荐系统中有效提高了对医疗机构的推荐准确度,从而提高医疗机构互联网数据对于智慧城市的建设的利用价值,解决残缺数据对大部分智慧城市的智能化建设的影响。

Description

一种基于线性回归因子非负矩阵分解模型的医疗机构推荐 方法
技术领域
本发明涉及医疗机构技术领域,更特别地说,是指一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法。
背景技术
数据活化之非负矩阵分解(Non-negative Matrix Factorization,NMF)由D.Lee等在1999年正式提出的(即Lee D D,Seung H S.Learning the parts of objects bynon-negativ matrix factorization[J].Nature,1999,401(6755):788-91.),经过了十余年的发展,现在已经成为了相对完善的数据分析方法。并且,NMF方法还在图像分析、文本聚类、数据挖掘、语音处理等方面得到了广泛的应用。由于NMF方法具有快速和有效等特性,在模式识别领域中被广泛用于特征提取与数据降维。在图像处理方向,NMF方法被用于研究机器人对外界感知这一课题。因为非负性约束的存在,分解结果中有大量的元素为零,故这种表示方法属于稀疏编码,具有节省存储空间的特点。
线性回归是一种回归分析方法,这种分析利用线性回归方程的最小平方函数,对一个或多个自变量与一个因变量之间的关系进行建模。线性回归方法基于数理统计中的回归分析,是广泛应用的一种用来确定两个或两个以上变量之间关系的统计方法之一。在实际应用中,只有一个自变量的线性回归为一元线性回归,而有多个自变量的线性回归为多元线性回归。
医疗机构,是指依法定程序设立的从事疾病诊断、治疗活动的卫生机构的总称。对于医疗机构在进行注册或审批时,在审批部门将留下名称、地址、网址、服务特长等相关信息的数据。或者经地理位置信息软件(如百度地图、谷歌地图)分析获得医疗机构的地理信息。
面对互联网上的海量信息,普通用户往往无所适从。为了满足用户的信息需求,计算机科学家发明了两项意义深远的技术:一是搜索技术,它帮助计算机系统被动地应答用户的查询,将与之最相关、最重要的信息返回给用户;二是推荐系统技术,它根据用户的兴趣、行为、情景等信息,把用户最可能感兴趣的内容主动推送给用户。近年来,推荐系统技术得到了长足的发展,不但成为学术研究的热点之一,而且在电子商务、在线广告、社交网络等重要的互联网应用中大显身手。推荐系统(Recommender System,RS)是为用户推荐所需物品的软件工具的技术。
发明内容
为了解决医疗机构在推荐系统的互联网应用中出现的推荐准确度差的问题,本发明提出了一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法。本发明方法是通过解决具有多源异构性和极高稀疏性的数据的预测技术难点,同时优化算法改善多系数调参难以达到全局最优的困难,使模型获得更优解,提高了数据预测的准确性。本发明应用在推荐系统中有效提高了对医疗机构的推荐准确度,从而提高医疗机构互联网数据对于智慧城市的建设的利用价值,解决残缺数据对大部分智慧城市的智能化建设的影响。
本发明提出的一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法,包括有下列步骤:
步骤A:初始化医疗机构推荐系统,并从GPS地理信息模块、医疗机构信息模块、病患就诊信息模块和手机基站信息模块中获取推荐用原始数据;
步骤B:应用步骤A获取的推荐用原始数据构建二维医疗机构—居住区就诊量矩阵;
在本发明中,医疗机构—居住区就诊量矩阵记为
Figure BDA0001165852360000021
步骤C:根据步骤B得到的医疗机构—居住区就诊量设计适用于时空多维度条件下,多尺度与多粒度的海量数据的线性回归张量因子;
在本发明中,线性回归张量因子记为FR=[Rr,Rs,Rt]b×a×3
步骤D:依据步骤C的线性回归张量因子重新对步骤B的医疗机构—居住区就诊量矩阵进行处理,得到医疗机构推荐目标模型;
在本发明中,医疗机构推荐目标模型记为
Figure BDA0001165852360000031
步骤E:在医疗机构推荐系统中应用步骤D的医疗机构推荐目标模型,并初始化;然后采用隐性特征模型对多元异构的推荐用原始数据进行活化数据挖掘,得到隐性特征矩阵;
在本发明中,隐性特征有2个,即医疗机构的隐性特征记为
Figure BDA0001165852360000032
即居住区域的隐性特征记为
Figure BDA0001165852360000033
步骤F:通过步骤E得到的隐性特征矩阵,迭代计算医疗机构—居住区就诊量矩阵;若未达到收敛,则返回步骤E,重新计算隐性特征矩阵偏导;若收敛,则修正医疗机构—居住区就诊量矩阵;
在本发明中,以
Figure BDA0001165852360000034
来修正步骤B构建的医疗机构-居住区域就诊量矩阵,记为Tm就诊量_重构
Figure BDA0001165852360000035
Figure BDA0001165852360000036
表示
Figure BDA0001165852360000037
Figure BDA0001165852360000038
修正后的就诊量。
Figure BDA0001165852360000041
表示
Figure BDA0001165852360000042
Figure BDA0001165852360000043
修正后的就诊量。
Figure BDA0001165852360000044
表示
Figure BDA0001165852360000045
Figure BDA0001165852360000046
修正后的就诊量。
Figure BDA0001165852360000047
表示
Figure BDA0001165852360000048
Figure BDA0001165852360000049
修正后的就诊量。
Figure BDA00011658523600000410
表示
Figure BDA00011658523600000411
Figure BDA00011658523600000412
修正后的就诊量。
Figure BDA00011658523600000413
表示
Figure BDA00011658523600000414
Figure BDA00011658523600000415
修正后的就诊量。
Figure BDA00011658523600000416
表示
Figure BDA00011658523600000417
Figure BDA00011658523600000418
修正后的就诊量。
Figure BDA00011658523600000419
表示
Figure BDA00011658523600000420
Figure BDA00011658523600000421
修正后的就诊量。
Figure BDA00011658523600000422
表示
Figure BDA00011658523600000423
Figure BDA00011658523600000424
修正后的就诊量。
步骤G:以推荐标准误差模型对经步骤F修正后的医疗机构—居住区就诊量矩阵进行推荐标准误差的计算,若标准误差小于0.3,则将获得推荐结果提供给用户。
在本发明中,推荐标准误差模型记为
Figure BDA00011658523600000425
计算推荐标准误差模型RMSE就诊量_误差作为算法准确度的评判标准,如果Weight缺失
Figure BDA00011658523600000426
为0,则通过所述RMSE就诊量_误差来对
Figure BDA00011658523600000427
Figure BDA00011658523600000428
进行相似度衡量。
本发明医疗机构推荐方法的优点在于:
①本发明方法中应用线性回归张量因子与非负矩阵分解(即二维医疗机构—居住区就诊量矩阵)两种方法的结合,充分考虑了医疗机构互联网数据的多源异构性。
②本发明方法中用了线性回归张量因子,可以自适应训练特征系数,改善了已有医疗机构研究中由于加入多种数据因子造成因子系数繁多、调参困难、难以达到全局最优的问题,这样可以在推荐时计算出更优解推荐给用户。
③本发明利用隐性特征来对医疗机构互联网数据进行学习预测,能够解决医疗机构互联网数据的极高稀疏性(尤其非零率极高的情况,即数据大部分缺失状态),从而提高推荐医疗机构的准确度。
④本发明利用推荐标准误差模型对二维医疗机构—居住区就诊量矩阵进行修正,并用推荐标准误差值来作衡量,从而可以提高推荐的优质性。
附图说明
图1是本发明基于线性回归因子非负矩阵分解模型的医疗机构推荐方法的流程图。
图2是不同区域的医疗机构经本发明方法的标准误差对比图。
图3是不同方法的标准误差对比图。
具体实施方式
下面将结合附图和实施例对本发明做进一步的详细说明。
参见图1所示,本发明提出了一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法,该推荐方法包括有下列处理步骤:
步骤A:初始化医疗机构推荐系统,并从GPS地理信息模块、医疗机构信息模块、病患就诊信息模块和手机基站信息模块中获取推荐用原始数据;
在本发明中,医疗机构推荐系统借助公共的互联网系统的大数据进行推荐技术处理。医疗机构推荐系统所需的推荐用原始数据是由互联网提供。为满足本发明所需的原始数据,则互联网中至少需要以下模块提供数据信息,即包括有:
GPS地理信息模块,用于提供目标的地理位置,地理位置以经度和纬度显示,即(x,y);
医疗机构信息模块,用于提供不同医疗机构的名称、医疗机构类型、患者关联信息(属于各医疗机构共享的部分患者信息,不涉及患者隐私)、治疗特色等信息;所述患者关联信息有就诊信息DI和患者就诊时间信息DT等;而就诊信息DI包括有患者的住址、患者的病历、患者的姓名、患者的年龄、患者的性别、患者的电话等相关信息,其中,患者的住址为不可缺少项;
病患就诊信息模块,用于提供患者自愿公开的患者基础信息,如患者的住址、患者的病历、患者的姓名、患者的年龄、患者的性别、患者的电话等相关信息;
手机基站信息模块,用于提供手机用户注册信息、用户的移动状态信息、用户登录互联网信息等。
在本发明中,为了表征医疗机构与居住区域之间的就诊量,应用了患者的就诊信息DI、患者就诊时间信息DT、以及医疗机构集DC={Doctor1,Doctor2,…,Doctorb}和居住区域集RE={re1,re2,…,ren-1,ren,ren+1,…,rea}的信息。所述患者的就诊信息DI包括有患者的家庭住址、患者的病历、患者的姓名、患者的年龄、患者的性别、患者的电话等相关信息,其中,患者的家庭住址为不可缺少项。
步骤B:应用步骤A获取的推荐用原始数据构建二维医疗机构—居住区就诊量矩阵;
在本发明中,医疗机构—居住区就诊量矩阵记为
Figure BDA0001165852360000061
步骤C:根据步骤B得到的医疗机构—居住区就诊量设计适用于时空多维度条件下,多尺度与多粒度的海量数据的线性回归张量因子;
在本发明中,线性回归张量因子记为FR=[Rr,Rs,Rt]b×a×3
步骤D:依据步骤C的线性回归张量因子重新对步骤B的医疗机构—居住区就诊量矩阵进行处理,得到医疗机构推荐目标模型;
在本发明中,医疗机构推荐目标模型记为
Figure BDA0001165852360000062
步骤E:在医疗机构推荐系统中应用步骤D的医疗机构推荐目标模型,并初始化;然后采用隐性特征模型对多元异构的推荐用原始数据进行活化数据挖掘,得到隐性特征矩阵;
在本发明中,隐性特征有2个,即医疗机构的隐性特征记为
Figure BDA0001165852360000063
即居住区域的隐性特征记为
Figure BDA0001165852360000071
步骤F:通过步骤E得到的隐性特征矩阵,迭代计算医疗机构—居住区就诊量矩阵;若未达到收敛,则返回步骤E,重新计算隐性特征矩阵偏导;若收敛,则修正医疗机构—居住区就诊量矩阵;
在本发明中,以
Figure BDA0001165852360000072
来修正步骤B构建的医疗机构-居住区域就诊量矩阵,记为Tm就诊量_重构
Figure BDA0001165852360000073
Figure BDA0001165852360000074
表示
Figure BDA0001165852360000075
Figure BDA0001165852360000076
修正后的就诊量。
Figure BDA0001165852360000077
表示
Figure BDA0001165852360000078
Figure BDA0001165852360000079
修正后的就诊量。
Figure BDA00011658523600000710
表示
Figure BDA00011658523600000711
Figure BDA00011658523600000712
修正后的就诊量。
Figure BDA00011658523600000713
表示
Figure BDA00011658523600000714
Figure BDA00011658523600000715
修正后的就诊量。
Figure BDA00011658523600000716
表示
Figure BDA00011658523600000717
Figure BDA00011658523600000718
修正后的就诊量。
Figure BDA00011658523600000719
表示
Figure BDA00011658523600000720
Figure BDA00011658523600000721
修正后的就诊量。
Figure BDA00011658523600000722
表示
Figure BDA00011658523600000723
Figure BDA00011658523600000724
修正后的就诊量。
Figure BDA00011658523600000725
表示
Figure BDA00011658523600000726
Figure BDA00011658523600000727
修正后的就诊量。
Figure BDA00011658523600000728
表示
Figure BDA00011658523600000729
Figure BDA00011658523600000730
修正后的就诊量。
步骤G:以推荐标准误差模型对经步骤F修正后的医疗机构—居住区就诊量矩阵进行推荐标准误差的计算,若标准误差小于0.3,则将获得推荐结果提供给用户。
在本发明中,推荐标准误差模型记为
Figure BDA00011658523600000731
计算推荐标准误差模型RMSE就诊量_误差作为算法准确度的评判标准,如果Weight缺失
Figure BDA00011658523600000732
为0,则通过所述RMSE就诊量_误差来对
Figure BDA00011658523600000733
Figure BDA0001165852360000081
进行相似度衡量。
在本发明的医疗机构推荐系统中,居住区域记为re,多个居住区域形成的居住区域集记为RE={re1,re2,…,ren-1,ren,ren+1,…,rea},角标a表示居住区域的总个数,n表示居住区域的标识号。居住区域re的地理位置re(x,y)中的x为经度,y为纬度。
re1表示第一个居住区域,所述第一个居住区域re1的地理位置记为
Figure BDA0001165852360000082
re2表示第二个居住区域,所述第二个居住区域re2的地理位置记为
Figure BDA0001165852360000083
ren表示任意一个居住区域,所述任意一个居住区域ren的地理位置记为
Figure BDA0001165852360000084
ren-1表示与ren距离最近的一个居住区域,简称为前一个居住区域,所述前一个居住区域ren-1的地理位置记为
Figure BDA0001165852360000085
ren+1表示与ren距离次近的一个居住区域,简称为后一个居住区域,所述后一个居住区域ren+1的地理位置记为
Figure BDA0001165852360000086
rea表示最后一个居住区域,所述最后一个居住区域rea的地理位置记为
Figure BDA0001165852360000087
在本发明的医疗机构推荐系统中,医疗机构记为Doctor,多个医疗机构形成的医疗机构集记为DC={Doctor1,Doctor2,…,Doctorb},角标b表示医疗机构的总个数,也是医疗机构的标识号。医疗机构Doctor的地理位置Doctor(x,y)中的x为经度,y为纬度。
Doctor1表示第一个医疗机构,所述第一个医疗机构Doctor1的地理位置记为
Figure BDA0001165852360000088
Doctor2表示第二个医疗机构,所述第二个医疗机构Doctor2的地理位置记为
Figure BDA0001165852360000089
Doctorb表示最后一个医疗机构,所述最后一个医疗机构Doctorb的地理位置记为
Figure BDA00011658523600000810
为了方便叙述,将Doctorb也称为任意一个医疗机构。
在本发明的医疗机构推荐系统中,手机用户记为Phone,多个手机用户形成的手机用户集记为PH={Phone1,Phone2,…,Phonec},角标c表示手机用户的总个数,也是手机用户的标识号。手机用户Phone所属的手机基站地理位置Phone(x,y)中的x为经度,y为纬度。
Phone1表示第一个手机用户,所述第一个手机用户Phone1所属的手机基站地理位置记为
Figure BDA0001165852360000091
Phone2表示第二个手机用户,所述第二个手机用户Phone2所属的手机基站地理位置记为
Figure BDA0001165852360000092
Phonec表示最后一个手机用户,所述最后一个手机用户Phonec所属的手机基站地理位置记为
Figure BDA0001165852360000093
为了方便叙述,将Phonec也称为任意一个手机用户。
在本发明中,医疗机构推荐系统应用手机用户信息来表征医疗机构与居住区域之间的人流量。
本发明是一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法,包括有下列步骤:
在步骤B中的医疗机构与居住区就诊量信息的获取处理过程如下;
以地图(如地理位置)为基础的空间结构是医疗机构互联网数据的一种基本组织方式,而城市快节奏的生活方式也使得医疗机构互联网数据对于时间维度的变化非常敏感。因此,时空多维特性成为医疗机构互联网数据的另一个重要特点。在空间上,根据城市地理规模的不同,医疗机构互联网数据具有不同尺度的空间跨度。在时间上,根据产生的时间不同,医疗机构互联网数据具有时间相关的变化和分布。因此在进行医疗机构互联网数据分析和应用时,一方面需要考虑时间和空间两个维度的数据演化特性,另一方面还需要充分利用时间和空间不同维度之间的数据关联关系。
在本发明的医疗机构推荐系统中,医疗机构与居住区就诊量信息以二维矩阵形式来进行关联数据信息的收集,采用矩阵形式构建,即得到医疗机构-居住区就诊量矩阵
Figure BDA0001165852360000094
b表示医疗机构的总个数,a表示居住区域的总个数,在本发明中,b的取值为321,a的取值为1343。
Figure BDA0001165852360000095
表示Doctor1跟re1之间映射的
Figure BDA0001165852360000096
的就诊量;所述
Figure BDA0001165852360000097
的计算关系为:判断患者在Doctor1的就诊信息
Figure BDA0001165852360000101
的住址
Figure BDA0001165852360000102
是否位于居住区域re1的地理位置
Figure BDA0001165852360000103
里,是,则在Tm就诊量中记录下
Figure BDA0001165852360000104
否,放弃在Tm就诊量中记录。
Figure BDA0001165852360000105
表示去Doctor1进行就诊的患者的家庭住址。
Figure BDA0001165852360000106
表示Doctor1跟re2之间映射的
Figure BDA0001165852360000107
的就诊量;所述
Figure BDA0001165852360000108
的计算关系为:判断患者在Doctor1的就诊信息
Figure BDA0001165852360000109
的住址
Figure BDA00011658523600001010
是否位于居住区域re2的地理位置
Figure BDA00011658523600001011
里,是,则在Tm就诊量中记录下
Figure BDA00011658523600001012
否,放弃在Tm就诊量中记录。
Figure BDA00011658523600001013
表示Doctor1跟rea之间映射的
Figure BDA00011658523600001014
的就诊量;所述
Figure BDA00011658523600001015
的计算关系为:判断患者在Doctor1的就诊信息
Figure BDA00011658523600001016
的住址
Figure BDA00011658523600001017
是否位于居住区域rea的地理位置
Figure BDA00011658523600001018
里,是,则在Tm就诊量中记录下
Figure BDA00011658523600001019
否,放弃在Tm就诊量中记录。
Figure BDA00011658523600001020
表示Doctor2跟re1之间映射的
Figure BDA00011658523600001021
的就诊量;所述
Figure BDA00011658523600001022
的计算关系为:判断患者在Doctor2的就诊信息
Figure BDA00011658523600001023
的住址
Figure BDA00011658523600001024
是否位于居住区域re1的地理位置
Figure BDA00011658523600001025
里,是,则在Tm就诊量中记录下
Figure BDA00011658523600001026
否,放弃在Tm就诊量中记录。
Figure BDA00011658523600001027
表示去Doctor2进行就诊的患者的家庭住址。
Figure BDA00011658523600001028
表示Doctor2跟re2之间映射的
Figure BDA00011658523600001029
的就诊量;所述
Figure BDA00011658523600001030
的计算关系为:判断患者在Doctor2的就诊信息
Figure BDA00011658523600001031
的住址
Figure BDA00011658523600001032
是否位于居住区域re2的地理位置
Figure BDA00011658523600001033
里,是,则在Tm就诊量中记录下
Figure BDA00011658523600001034
否,放弃在Tm就诊量中记录。
Figure BDA00011658523600001035
表示Doctor2跟rea之间映射的
Figure BDA00011658523600001036
的就诊量;所述
Figure BDA00011658523600001037
的计算关系为:判断患者在Doctor2的就诊信息
Figure BDA00011658523600001038
的住址
Figure BDA00011658523600001039
是否位于居住区域rea的地理位置
Figure BDA00011658523600001040
里,是,则在Tm就诊量中记录下
Figure BDA00011658523600001041
否,放弃在Tm就诊量中记录。
Figure BDA00011658523600001042
表示Doctorb跟re1之间映射的
Figure BDA00011658523600001043
的就诊量;所述
Figure BDA00011658523600001044
的计算关系为:判断患者在Doctorb的就诊信息
Figure BDA0001165852360000111
的住址
Figure BDA0001165852360000112
是否位于居住区域re1的地理位置
Figure BDA0001165852360000113
里,是,则在Tm就诊量中记录下
Figure BDA0001165852360000114
否,放弃在Tm就诊量中记录。
Figure BDA0001165852360000115
表示去Doctorb进行就诊的患者的家庭住址。
Figure BDA0001165852360000116
表示Doctorb跟re2之间映射的
Figure BDA0001165852360000117
的就诊量;所述
Figure BDA0001165852360000118
的计算关系为:判断患者在Doctorb的就诊信息
Figure BDA0001165852360000119
的住址
Figure BDA00011658523600001110
是否位于居住区域re2的地理位置
Figure BDA00011658523600001111
里,是,则在Tm就诊量中记录下
Figure BDA00011658523600001112
否,放弃在Tm就诊量中记录。
Figure BDA00011658523600001113
表示Doctorb跟rea之间映射的
Figure BDA00011658523600001114
的就诊量;所述
Figure BDA00011658523600001115
的计算关系为:判断患者在Doctorb的就诊信息
Figure BDA00011658523600001116
的住址
Figure BDA00011658523600001117
是否位于居住区域rea的地理位置
Figure BDA00011658523600001118
里,是,则在Tm就诊量中记录下
Figure BDA00011658523600001119
否,放弃在Tm就诊量中记录。
在步骤C中的线性回归张量因子的获取处理过程如下:
研究和利用医疗机构数据除了要考虑时间和空间等多个维度之外,还需要考虑数据尺度和数据粒度对于数据特性的影响。在规模的尺度上,医疗机构可以分为专科医院、中型医院、大型医院等;在地理尺度上,对于医疗机构数据的描述可以小到几个街区或大到数千平方公里;在时间尺度上,医疗机构数据的覆盖时间可以短到一些事件的监控,长到上百年的医疗机构变迁。在地理采样粒度上,可以像遥感测绘数据一样精确到数米,也可以向气象环境数据一样以区县、地区、甚至省市为单位;在时间粒度上,更是根据数据采样设备的时钟、存储与传输能力、计算速度等因素产生不同的时间粒度。在本发明的医疗机构推荐系统中,在时空多维度的条件下,高效处理多尺度与多粒度的海量数据,采用了“线性回归张量因子”来改善海量数据多特征因子公式冗余并且计算难以达到全局最优的问题。根据步骤B中提取出来的Tm就诊量设计线性回归张量因子。
在本发明中,线性回归张量因子为FR=[Rr,Rs,Rt]b×a×3,且
所述距离因子
Figure BDA0001165852360000121
所述就诊量因子
Figure BDA0001165852360000122
所述人流量因子
Figure BDA0001165852360000123
其中,b表示医疗机构的总个数,a表示居住区域的总个数,在本发明中,b的取值为321,a的取值为1343。r表示距离标识,s表示就诊量标识,r表示人流量标识。
Figure BDA0001165852360000124
表示Doctor1跟re1之间的距离,利用
Figure BDA0001165852360000125
Figure BDA0001165852360000126
进行距离的计算,计算公式为
Figure BDA0001165852360000127
Figure BDA0001165852360000128
表示Doctor1跟re2之间的距离,利用
Figure BDA0001165852360000129
Figure BDA00011658523600001210
进行距离的计算,计算公式为
Figure BDA00011658523600001211
Figure BDA00011658523600001212
表示Doctor1跟rea之间的距离,利用
Figure BDA00011658523600001213
Figure BDA00011658523600001214
进行距离的计算,计算公式为
Figure BDA00011658523600001215
Figure BDA00011658523600001216
表示Doctor2跟re1之间的距离,利用
Figure BDA00011658523600001217
Figure BDA00011658523600001218
进行距离的计算,计算公式为
Figure BDA00011658523600001219
Figure BDA00011658523600001220
表示Doctor2跟re2之间的距离,利用
Figure BDA00011658523600001221
Figure BDA00011658523600001222
进行距离的计算,计算公式为
Figure BDA00011658523600001223
Figure BDA00011658523600001224
表示Doctor2跟rea之间的距离,利用
Figure BDA00011658523600001225
Figure BDA00011658523600001226
进行距离的计算,计算公式为
Figure BDA00011658523600001227
Figure BDA00011658523600001228
表示Doctorb跟re1之间的距离,利用
Figure BDA00011658523600001229
Figure BDA00011658523600001230
进行距离的计算,计算公式为
Figure BDA0001165852360000131
Figure BDA0001165852360000132
表示Doctorb跟re2之间的距离,利用
Figure BDA0001165852360000133
Figure BDA0001165852360000134
进行距离的计算,计算公式为
Figure BDA0001165852360000135
Figure BDA0001165852360000136
表示Doctorb跟rea之间的距离,利用
Figure BDA0001165852360000137
Figure BDA0001165852360000138
进行距离的计算,计算公式为
Figure BDA0001165852360000139
Figure BDA00011658523600001310
表示Doctor1跟距离re1最近的5个居住区域之间的患者就诊量的平均值。令
Figure BDA00011658523600001311
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域。
Figure BDA00011658523600001312
的计算形式为
Figure BDA00011658523600001313
为了方便说明,距离最近的五个居住区域表现形式为
Figure BDA00011658523600001314
Figure BDA00011658523600001315
Figure BDA00011658523600001316
表示Doctor1跟距离re2最近的5个居住区域之间的患者就诊量的平均值。令
Figure BDA00011658523600001317
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域。
Figure BDA00011658523600001318
的计算形式为
Figure BDA00011658523600001319
为了方便说明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,ren-1,ren,ren+1,rea为距离最近的五个居住区域。
Figure BDA00011658523600001320
的计算形式为
Figure BDA00011658523600001321
Figure BDA00011658523600001322
表示Doctor1跟距离rea最近的5个居住区域之间的患者就诊量的平均值。令
Figure BDA00011658523600001323
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域。
Figure BDA00011658523600001324
的计算形式为
Figure BDA00011658523600001325
为了方便说明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,re2,ren-1,ren,ren+1为距离最近的五个居住区域。
Figure BDA00011658523600001326
的计算公式为
Figure BDA00011658523600001327
Figure BDA00011658523600001328
表示Doctor2跟距离re1最近的5个居住区域之间的患者就诊量的平均值。令
Figure BDA00011658523600001329
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域。
Figure BDA0001165852360000141
的计算形式为
Figure BDA0001165852360000142
为了方便说明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re2,ren-1,ren,ren+1,rea为距离最近的五个居住区域。
Figure BDA0001165852360000143
的计算公式为
Figure BDA0001165852360000144
Figure BDA0001165852360000145
表示Doctor2跟距离re2最近的5个居住区域之间的患者就诊量的平均值。令
Figure BDA0001165852360000146
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域。
Figure BDA0001165852360000147
的计算形式为
Figure BDA0001165852360000148
为了方便说明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,ren-1,ren,ren+1,rea为距离最近的五个居住区域。
Figure BDA0001165852360000149
的计算公式为
Figure BDA00011658523600001410
Figure BDA00011658523600001411
表示Doctor2跟距离rea最近的5个居住区域之间的患者就诊量的平均值。令
Figure BDA00011658523600001412
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域。
Figure BDA00011658523600001413
的计算形式为
Figure BDA00011658523600001414
为了方便说明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,re2,ren-1,ren,ren+1为距离最近的五个居住区域。
Figure BDA00011658523600001415
的计算形式为
Figure BDA00011658523600001416
Figure BDA00011658523600001417
表示Doctorb跟距离re1最近的5个居住区域之间的患者就诊量的平均值。令
Figure BDA00011658523600001418
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域。
Figure BDA00011658523600001419
的计算形式为
Figure BDA00011658523600001420
为了方便说明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re2,ren-1,ren,ren+1,rea为距离最近的五个居住区域。
Figure BDA00011658523600001421
的计算公式为
Figure BDA00011658523600001422
Figure BDA00011658523600001423
表示Doctorb跟距离re2最近的5个居住区域之间的患者就诊量的平均值。令
Figure BDA00011658523600001424
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域。
Figure BDA0001165852360000151
的计算形式为
Figure BDA0001165852360000152
为了方便说明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,ren-1,ren,ren+1,rea为距离最近的五个居住区域。
Figure BDA0001165852360000153
的计算公式为
Figure BDA0001165852360000154
Figure BDA0001165852360000155
表示Doctorb跟距离rea最近的5个居住区域之间的患者就诊量的平均值。令
Figure BDA0001165852360000156
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域。
Figure BDA0001165852360000157
的计算形式为
Figure BDA0001165852360000158
为了方便说明,令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,re2,ren-1,ren,ren+1为距离最近的五个居住区域。
Figure BDA0001165852360000159
的计算公式为
Figure BDA00011658523600001510
Figure BDA00011658523600001511
表示Doctor1跟re1之间映射的人流量;所述
Figure BDA00011658523600001512
的计算关系为:判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA00011658523600001513
是否位于
Figure BDA00011658523600001514
如果是,则记录在医院基站列表HL中,不是则放弃记录;同理,判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA00011658523600001515
是否位于
Figure BDA00011658523600001516
如果是,则记录在居住区基站列表REL中,不是则放弃记录。如果Phonec同时存在于医院基站列表HL和居住区基站列表REL中则在人流量因子Rt中记录
Figure BDA00011658523600001517
否则,放弃记录。
在本发明中,医院基站列表HL的列表形式为:
Figure BDA00011658523600001518
在本发明中,居住区基站列表REL的列表形式为:
Figure BDA0001165852360000161
Figure BDA0001165852360000162
表示Doctor1跟re2之间映射的人流量;所述
Figure BDA0001165852360000163
的计算关系为:判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA0001165852360000164
是否位于
Figure BDA0001165852360000165
如果是,则记录在医院基站列表HL中,不是则放弃记录;同理,判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA0001165852360000166
是否位于
Figure BDA0001165852360000167
如果是,则记录在居住区基站列表REL中,不是则放弃记录。如果Phonec同时存在于医院基站列表HL和居住区基站列表REL中则在Rt中记录
Figure BDA0001165852360000168
否则,放弃记录。
Figure BDA0001165852360000169
表示Doctor1跟rea之间映射的人流量;所述
Figure BDA00011658523600001610
的计算关系为:判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA00011658523600001611
是否位于
Figure BDA00011658523600001612
如果是,则记录在医院基站列表HL中,不是则放弃记录;同理,判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA00011658523600001613
是否位于
Figure BDA00011658523600001614
如果是,则记录在居住区基站列表REL中,不是则放弃记录。如果Phonec同时存在于医院基站列表HL和居住区基站列表REL中则在Rt中记录
Figure BDA00011658523600001615
否则,放弃记录。
Figure BDA00011658523600001616
表示Doctor2跟re1之间映射的人流量;所述
Figure BDA00011658523600001617
的计算关系为:判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA00011658523600001618
是否位于
Figure BDA00011658523600001619
如果是,则记录在医院基站列表HL中,不是则放弃记录;同理,判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA00011658523600001620
是否位于
Figure BDA00011658523600001621
如果是,则记录在居住区基站列表REL中,不是则放弃记录。如果Phonec同时存在于医院基站列表HL和居住区基站列表REL中则在Rt中记录
Figure BDA00011658523600001622
否则,放弃记录。
在本发明中,医院基站列表HL的列表形式为:
Figure BDA0001165852360000171
在本发明中,居住区基站列表REL的列表形式为:
Figure BDA0001165852360000172
Figure BDA0001165852360000173
表示Doctor2跟re2之间映射的人流量;所述
Figure BDA0001165852360000174
的计算关系为:判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA0001165852360000175
是否位于
Figure BDA0001165852360000176
如果是,则记录在医院基站列表HL中,不是则放弃记录;同理,判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA0001165852360000177
是否位于
Figure BDA0001165852360000178
如果是,则记录在居住区基站列表REL中,不是则放弃记录。如果Phonec同时存在于医院基站列表HL和居住区基站列表REL中则在Rt中记录
Figure BDA0001165852360000179
否则,放弃记录。
在本发明中,医院基站列表HL的列表形式为:
Figure BDA00011658523600001710
在本发明中,居住区基站列表REL的列表形式为:
Figure BDA0001165852360000181
Figure BDA0001165852360000182
表示Doctor2跟rea之间映射的人流量;所述
Figure BDA0001165852360000183
的计算关系为:判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA0001165852360000184
是否位于
Figure BDA0001165852360000185
如果是,则记录在医院基站列表HL中,不是则放弃记录;同理,判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA0001165852360000186
是否位于
Figure BDA0001165852360000187
如果是,则记录在居住区基站列表REL中,不是则放弃记录。如果Phonec同时存在于医院基站列表HL和居住区基站列表REL中则在Rt中记录
Figure BDA0001165852360000188
否则,放弃记录。
在本发明中,医院基站列表HL的列表形式为:
Figure BDA0001165852360000189
在本发明中,居住区基站列表REL的列表形式为:
Figure BDA00011658523600001810
Figure BDA0001165852360000191
表示Doctorb跟re1之间映射的人流量;所述
Figure BDA0001165852360000192
的计算关系为:判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA0001165852360000193
是否位于
Figure BDA0001165852360000194
如果是,则记录在医院基站列表HL中,不是则放弃记录;同理,判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA0001165852360000195
是否位于
Figure BDA0001165852360000196
如果是,则记录在居住区基站列表REL中,不是则放弃记录。如果Phonec同时存在于医院基站列表HL和居住区基站列表REL中则在Rt中记录
Figure BDA0001165852360000197
否则,放弃记录。
在本发明中,医院基站列表HL的列表形式为:
Figure BDA0001165852360000198
在本发明中,居住区基站列表REL的列表形式为:
Figure BDA0001165852360000199
Figure BDA00011658523600001910
表示Doctorb跟re2之间映射的人流量;所述
Figure BDA00011658523600001911
的计算关系为:判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA00011658523600001912
是否位于
Figure BDA00011658523600001913
如果是,则记录在医院基站列表HL中,不是则放弃记录;同理,判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA00011658523600001914
是否位于
Figure BDA00011658523600001915
如果是,则记录在居住区基站列表REL中,不是则放弃记录。如果Phonec同时存在于医院基站列表HL和居住区基站列表REL中则在Rt中记录
Figure BDA00011658523600001916
否则,放弃记录。
在本发明中,医院基站列表HL的列表形式为:
Figure BDA0001165852360000201
在本发明中,居住区基站列表REL的列表形式为:
Figure BDA0001165852360000202
Figure BDA0001165852360000203
表示Doctorb跟rea之间映射的人流量;所述
Figure BDA0001165852360000204
的计算关系为:判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA0001165852360000205
是否位于
Figure BDA0001165852360000206
如果是,则记录在医院基站列表HL中,不是则放弃记录;同理,判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure BDA0001165852360000207
是否位于
Figure BDA0001165852360000208
如果是,则记录在居住区基站列表REL中,不是则放弃记录。如果Phonec同时存在于医院基站列表HL和居住区基站列表REL中则在Rt中记录
Figure BDA0001165852360000209
否则,放弃记录。
在本发明中,医院基站列表HL的列表形式为:
Figure BDA00011658523600002010
在本发明中,居住区基站列表REL的列表形式为:
Figure BDA0001165852360000211
在步骤D和步骤E中,对推荐目标模型和隐性特征矩阵的获取处理过程如下:
由于医疗机构互联网数据具有非常多的类型与来源,即数据的多元性.这些不同来源的医疗机构数据无论是从结构上、组织方式上、维度尺度与粒度上都会存在巨大差异,即数据的异构性、智慧城市的应用需求要求推荐系统必须将这些多元异构数据进行有机的融合,通过挖掘活化数据之间的相关性与相互作用方式来获取隐性特征。
在本发明中,根据Tm就诊量和FR来设计医疗机构推荐目标模型记为
Figure BDA0001165852360000212
在本发明中,当前轮次的J值(方便说明,记为J当前)与前一次的J值(方便说明,记为J)进行差值比较ΔJ=|J当前-J前一次|,若ΔJ趋近于0,则隐性特征模型J达到收敛,并用医疗机构推荐目标模型来修改医疗机构—居住区就诊量矩阵;若ΔJ不趋近于0,则说明隐性特征模型J未达到收敛,返回步骤E重新进行隐性特征矩阵获取。
F表示范数,即Frobenius范数。
γ表示医院隐性特征矩阵的系数。
θ表示对FR张量因子的学习系数。
δ表示居住区隐性特征矩阵的系数。
Weight缺失表示缺失值权重。
其中,所述缺失值权重
Figure BDA0001165852360000221
Figure BDA0001165852360000222
取值范围是0或者1,0代表Doctor1跟re1之间的数据缺失,是需要预测的对象,1代表Doctor1跟re1之间的数据存在,不需要预测。
Figure BDA0001165852360000223
取值范围是0或者1,0代表Doctor1跟re2之间的数据缺失,是需要预测的对象,1代表Doctor1跟re2之间的数据存在,不需要预测。
Figure BDA0001165852360000224
取值范围是0或者1,0代表Doctor1跟rea之间的数据缺失,是需要预测的对象,1代表Doctor1跟rea之间的数据存在,不需要预测。
Figure BDA0001165852360000225
取值范围是0或者1,0代表Doctor2跟re1之间的数据缺失,是需要预测的对象,1代表Doctor2跟re1之间的数据存在,不需要预测。
Figure BDA0001165852360000226
取值范围是0或者1,0代表Doctor2跟re2之间的数据缺失,是需要预测的对象,1代表Doctor2跟re2之间的数据存在,不需要预测。
Figure BDA0001165852360000227
取值范围是0或者1,0代表Doctor2跟rea之间的数据缺失,是需要预测的对象,1代表Doctor2跟rea之间的数据存在,不需要预测。
Figure BDA0001165852360000228
取值范围是0或者1,0代表Doctorb跟re1之间的数据缺失,是需要预测的对象,1代表Doctorb跟re1之间的数据存在,不需要预测。
Figure BDA0001165852360000229
取值范围是0或者1,0代表Doctorb跟re2之间的数据缺失,是需要预测的对象,1代表Doctorb跟re2之间的数据存在,不需要预测。
Figure BDA00011658523600002210
取值范围是0或者1,0代表Doctorb跟rea之间的数据缺失,是需要预测的对象,1代表Doctorb跟rea之间的数据存在,不需要预测。
其中,对应于医疗机构的隐性特征记为
Figure BDA00011658523600002211
Figure BDA00011658523600002212
表示Doctor1跟re1之间就诊量预测的隐性特征值,最大迭代次数记为m,且m=500;每一轮的
Figure BDA00011658523600002213
都由前一轮的隐性特征值
Figure BDA00011658523600002214
通过以下公式更新,第一轮的
Figure BDA0001165852360000231
Figure BDA0001165852360000232
表示随机产生的一个初始数值,
Figure BDA0001165852360000233
表示Q特征矩阵的转置。计算公式:
Figure BDA0001165852360000234
α表示梯度下降系数。
Figure BDA0001165852360000235
表示Doctor1跟re2之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA0001165852360000236
都由前一轮的隐性特征值
Figure BDA0001165852360000237
通过以下公式更新,第一轮的
Figure BDA0001165852360000238
Figure BDA0001165852360000239
表示随机产生的一个初始数值,
Figure BDA00011658523600002310
表示Q特征矩阵的转置。计算公式:
Figure BDA00011658523600002311
Figure BDA00011658523600002312
表示Doctor1跟rea之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002313
都由前一轮的隐性特征值
Figure BDA00011658523600002314
通过以下公式更新,第一轮的
Figure BDA00011658523600002315
Figure BDA00011658523600002316
表示随机产生的一个初始数值,
Figure BDA00011658523600002317
表示Q特征矩阵的转置。计算公式:
Figure BDA00011658523600002318
Figure BDA00011658523600002319
表示Doctor2跟re1之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002320
都由前一轮的隐性特征值
Figure BDA00011658523600002321
通过以下公式更新,第一轮的
Figure BDA00011658523600002322
Figure BDA00011658523600002323
表示随机产生的一个初始数值,
Figure BDA00011658523600002324
表示Q特征矩阵的转置。计算公式:
Figure BDA00011658523600002325
Figure BDA00011658523600002326
表示Doctor2跟re2之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002327
都由前一轮的隐性特征值
Figure BDA00011658523600002328
通过以下公式更新,第一轮的
Figure BDA00011658523600002329
Figure BDA00011658523600002330
表示随机产生的一个初始数值,
Figure BDA00011658523600002331
表示Q特征矩阵的转置。计算公式:
Figure BDA00011658523600002332
Figure BDA00011658523600002333
表示Doctor2跟rea之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002334
都由前一轮的隐性特征值
Figure BDA00011658523600002335
通过以下公式更新,第一轮的
Figure BDA00011658523600002336
Figure BDA00011658523600002337
表示随机产生的一个初始数值,
Figure BDA00011658523600002338
表示Q特征矩阵的转置。计算公式:
Figure BDA00011658523600002339
Figure BDA0001165852360000241
表示Doctorb跟re1之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA0001165852360000242
都由前一轮的隐性特征值
Figure BDA0001165852360000243
通过以下公式更新,第一轮的
Figure BDA0001165852360000244
Figure BDA0001165852360000245
表示随机产生的一个初始数值,
Figure BDA0001165852360000246
表示Q特征矩阵的转置。计算公式:
Figure BDA0001165852360000247
Figure BDA0001165852360000248
表示Doctorb跟re2之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA0001165852360000249
都由前一轮的隐性特征值
Figure BDA00011658523600002410
通过以下公式更新,第一轮的
Figure BDA00011658523600002411
Figure BDA00011658523600002412
表示随机产生的一个初始数值,
Figure BDA00011658523600002413
表示Q特征矩阵的转置。计算公式:
Figure BDA00011658523600002414
Figure BDA00011658523600002415
表示Doctorb跟rea之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002416
都由前一轮的隐性特征值
Figure BDA00011658523600002417
通过以下公式更新,第一轮的
Figure BDA00011658523600002418
Figure BDA00011658523600002419
表示随机产生的一个初始数值,
Figure BDA00011658523600002420
表示Q特征矩阵的转置。计算公式:
Figure BDA00011658523600002421
对应于居住区域的隐性特征记为
Figure BDA00011658523600002422
Figure BDA00011658523600002423
表示Doctor1跟re1之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002424
都由前一轮的隐性特征值
Figure BDA00011658523600002425
通过以下公式更新,第一轮的
Figure BDA00011658523600002426
Figure BDA00011658523600002427
表示随机产生的一个初始数值,
Figure BDA00011658523600002428
表示P特征矩阵的转置。计算公式:
Figure BDA00011658523600002429
Figure BDA00011658523600002430
表示Doctor1跟re2之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002431
都由前一轮的隐性特征值
Figure BDA00011658523600002432
通过以下公式更新,第一轮的
Figure BDA00011658523600002433
Figure BDA00011658523600002434
表示随机产生的一个初始数值,
Figure BDA00011658523600002435
表示P特征矩阵的转置。计算公式:
Figure BDA0001165852360000251
Figure BDA0001165852360000252
表示Doctor1跟rea之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA0001165852360000253
都由前一轮的隐性特征值
Figure BDA0001165852360000254
通过以下公式更新,第一轮的
Figure BDA0001165852360000255
Figure BDA0001165852360000256
表示随机产生的一个初始数值,
Figure BDA0001165852360000257
表示P特征矩阵的转置。计算公式:
Figure BDA0001165852360000258
Figure BDA0001165852360000259
表示Doctor2跟re1之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002510
都由前一轮的隐性特征值
Figure BDA00011658523600002511
通过以下公式更新,第一轮的
Figure BDA00011658523600002512
Figure BDA00011658523600002513
表示随机产生的一个初始数值,
Figure BDA00011658523600002514
表示P特征矩阵的转置。计算公式:
Figure BDA00011658523600002515
Figure BDA00011658523600002516
表示Doctor2跟re2之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002517
都由前一轮的隐性特征值
Figure BDA00011658523600002518
通过以下公式更新,第一轮的
Figure BDA00011658523600002519
Figure BDA00011658523600002520
表示随机产生的一个初始数值,
Figure BDA00011658523600002521
表示P特征矩阵的转置。计算公式:
Figure BDA00011658523600002522
Figure BDA00011658523600002523
表示Doctor2跟rea之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002524
都由前一轮的隐性特征值
Figure BDA00011658523600002525
通过以下公式更新,第一轮的
Figure BDA00011658523600002526
Figure BDA00011658523600002527
表示随机产生的一个初始数值,
Figure BDA00011658523600002528
表示P特征矩阵的转置。计算公式:
Figure BDA00011658523600002529
Figure BDA00011658523600002530
表示Doctorb跟re1之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002531
都由前一轮的隐性特征值
Figure BDA00011658523600002532
通过以下公式更新,第一轮的
Figure BDA00011658523600002533
Figure BDA00011658523600002534
表示随机产生的一个初始数值,
Figure BDA00011658523600002535
表示P特征矩阵的转置。计算公式:
Figure BDA00011658523600002536
Figure BDA00011658523600002537
表示Doctorb跟re2之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002538
都由前一轮的隐性特征值
Figure BDA00011658523600002539
通过以下公式更新,第一轮的
Figure BDA00011658523600002540
Figure BDA00011658523600002541
表示随机产生的一个初始数值,
Figure BDA00011658523600002542
表示P特征矩阵的转置。计算公式:
Figure BDA0001165852360000261
Figure BDA0001165852360000262
表示Doctorb跟rea之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA0001165852360000263
都由前一轮的隐性特征值
Figure BDA0001165852360000264
通过以下公式更新,第一轮的
Figure BDA0001165852360000265
Figure BDA0001165852360000266
表示随机产生的一个初始数值,
Figure BDA0001165852360000267
表示P特征矩阵的转置。计算公式:
Figure BDA0001165852360000268
由于本发明的线性回归张量因子FR选用了多个就诊量协同,因此线性回归张量因子FR的系数记为
Figure BDA0001165852360000269
Figure BDA00011658523600002610
表示Doctor1跟re1之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002611
都由前一轮的隐性特征值
Figure BDA00011658523600002612
通过以下公式更新,第一轮的
Figure BDA00011658523600002613
Figure BDA00011658523600002614
表示随机产生的一个初始数值。计算公式:
Figure BDA00011658523600002615
α表示梯度下降系数。sum为加和函数符号。
Figure BDA00011658523600002616
表示Doctor1跟re2之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002617
都由前一轮的隐性特征值
Figure BDA00011658523600002618
通过以下公式更新,第一轮的
Figure BDA00011658523600002619
Figure BDA00011658523600002620
表示随机产生的一个初始数值。计算公式:
Figure BDA00011658523600002621
Figure BDA00011658523600002622
表示Doctor1跟rea之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure BDA00011658523600002623
都由前一轮的隐性特征值
Figure BDA00011658523600002624
通过以下公式更新,第一轮的
Figure BDA00011658523600002625
Figure BDA00011658523600002626
表示随机产生的一个初始数值。计算公式:
Figure BDA00011658523600002627
实施例1
若一个行政地区的医疗机构总数为321个,划分在市区区域里的医疗机构有157个,划分在郊区区域里的医疗机构有164个。
若一个行政地区的医疗机构测试集为160个,训练集为161个,划分在市区区域里的医疗机构测试集有78个,训练集有79个,划分在郊区区域里的医疗机构测试集有82个,训练集有82个。
如图2所示,图中A号线表示行政区域所有医疗机构参与本发明方法的标准误差,其中测试集有160个医疗机构,训练集有161个医疗机构。
如图2所示,图中B号线表示行政区域划分在市区区域里的医疗机构参与本发明方法的标准误差,其中测试集有78个医疗机构,训练集有79个医疗机构。
如图2所示,图中C号线表示行政区域划分在郊区区域里的医疗机构参与本发明方法的标准误差,其中测试集有82个医疗机构,训练集有82个医疗机构。
从图2可以看出,经过本发明方法计算得到的标准误差很小,说明针对医疗机构的推荐准确度高。
实施例2
若一个行政地区的医疗机构总数为321个,则测试集有160个医疗机构,训练集有161个医疗机构。
如图3所示,经“SVD”、“LR”和“本发明”三种方法的标准误差对比可见,本发明的标准误差最小,说明本发明的方法比“SVD”、“LR”两种方法的推荐准确度高。
“SVD”方法请参考《推荐系统技术、评估及高效算法》李艳民译,2015年7月第1版,第104-105页。
“LR(Linear Models for Regression)”方法请参考《Pattern Recognition andMachine Learning》Christopher M.Bishop,2006年,第136-147中。

Claims (1)

1.一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法,其特征在于包括有下列步骤:
步骤A:初始化医疗机构推荐系统,并从GPS地理信息模块、医疗机构信息模块、病患就诊信息模块和手机基站信息模块中获取推荐用原始数据;
GPS地理信息模块,用于提供目标的地理位置,地理位置以经度和纬度显示,即(x,y);
医疗机构信息模块,用于提供不同医疗机构的名称、医疗机构类型、患者关联信息、治疗特色信息;所述患者关联信息有就诊信息DI和患者就诊时间信息DT;而就诊信息DI包括有患者的住址、患者的病历、患者的姓名、患者的年龄、患者的性别、患者的电话相关信息,其中,患者的住址为不可缺少项;
病患就诊信息模块,用于提供患者自愿公开的患者基础信息,包括有患者的住址、患者的病历、患者的姓名、患者的年龄、患者的性别、患者的电话相关信息;
手机基站信息模块,用于提供手机用户注册信息、用户的移动状态信息、用户登录互联网信息;
医疗机构推荐系统中,居住区域记为re,多个居住区域形成的居住区域集记为RE={re1,re2,…,ren-1,ren,ren+1,…,rea},角标a表示居住区域的总个数,n表示居住区域的标识号; 居住区域re的地理位置re(x,y)中的x为经度,y为纬度;
re1表示第一个居住区域,所述第一个居住区域re1的地理位置记为
Figure FDA0002707634960000011
re2表示第二个居住区域,所述第二个居住区域re2的地理位置记为
Figure FDA0002707634960000012
ren表示任意一个居住区域,所述任意一个居住区域ren的地理位置记为
Figure FDA0002707634960000013
ren-1表示与ren距离最近的一个居住区域,简称为前一个居住区域,所述前一个居住区域ren-1的地理位置记为
Figure FDA0002707634960000014
ren+1表示与ren距离次近的一个居住区域,简称为后一个居住区域,所述后一个居住区域ren+1的地理位置记为
Figure FDA0002707634960000015
rea表示最后一个居住区域,所述最后一个居住区域rea的地理位置记为
Figure FDA0002707634960000016
医疗机构推荐系统中,医疗机构记为Doctor,多个医疗机构形成的医疗机构集记为DC={Doctor1,Doctor2,…,Doctorb},角标b表示医疗机构的总个数,也是医疗机构的标识号;医疗机构Doctor的地理位置Doctor(x,y)中的x为经度,y为纬度;
Doctor1表示第一个医疗机构,所述第一个医疗机构Doctor1的地理位置记为
Figure FDA0002707634960000021
Doctor2表示第二个医疗机构,所述第二个医疗机构Doctor2的地理位置记为
Figure FDA0002707634960000022
Doctorb表示最后一个医疗机构,所述最后一个医疗机构Doctorb的地理位置记为
Figure FDA0002707634960000023
为了方便叙述,将Doctorb也称为任意一个医疗机构;
医疗机构推荐系统中,手机用户记为Phone,多个手机用户形成的手机用户集记为PH={Phone1,Phone2,…,Phonec},角标c表示手机用户的总个数,也是手机用户的标识号;手机用户Phone所属的手机基站地理位置Phone(x,y)中的x为经度,y为纬度;
Phone1表示第一个手机用户,所述第一个手机用户Phone1所属的手机基站地理位置记为
Figure FDA0002707634960000024
Phone2表示第二个手机用户,所述第二个手机用户Phone2所属的手机基站地理位置记为
Figure FDA0002707634960000025
Phonec表示最后一个手机用户,所述最后一个手机用户Phonec所属的手机基站地理位置记为
Figure FDA0002707634960000026
为了方便叙述,将Phonec也称为任意一个手机用户;
医疗机构推荐系统应用手机用户信息来表征医疗机构与居住区域之间的人流量;
步骤B:应用步骤A获取的推荐用原始数据构建二维医疗机构—居住区就诊量矩阵;
医疗机构—居住区就诊量矩阵记为
Figure FDA0002707634960000027
b表示医疗机构的总个数,a表示居住区域的总个数;
Figure FDA0002707634960000028
表示Doctor1跟re1之间映射的
Figure FDA0002707634960000029
的就诊量;所述
Figure FDA00027076349600000210
的计算关系为:判断患者在Doctor1的就诊信息
Figure FDA00027076349600000211
的住址
Figure FDA00027076349600000212
是否位于居住区域re1的地理位置
Figure FDA0002707634960000031
里,是,则在Tm就诊量中记录下
Figure FDA0002707634960000032
否,放弃在Tm就诊量中记录;
Figure FDA0002707634960000033
表示去Doctor1进行就诊的患者的家庭住址;
Figure FDA0002707634960000034
表示Doctor1跟re2之间映射的
Figure FDA0002707634960000035
的就诊量;所述
Figure FDA0002707634960000036
的计算关系为:判断患者在Doctor1的就诊信息
Figure FDA0002707634960000037
的住址
Figure FDA0002707634960000038
是否位于居住区域re2的地理位置
Figure FDA0002707634960000039
里,是,则在Tm就诊量中记录下
Figure FDA00027076349600000310
否,放弃在Tm就诊量中记录;
Figure FDA00027076349600000311
表示Doctor1跟rea之间映射的
Figure FDA00027076349600000312
的就诊量;所述
Figure FDA00027076349600000313
的计算关系为:判断患者在Doctor1的就诊信息
Figure FDA00027076349600000314
的住址
Figure FDA00027076349600000315
是否位于居住区域rea的地理位置
Figure FDA00027076349600000316
里,是,则在Tm就诊量中记录下
Figure FDA00027076349600000317
否,放弃在Tm就诊量中记录;
Figure FDA00027076349600000318
表示Doctor2跟re1之间映射的
Figure FDA00027076349600000319
的就诊量;所述
Figure FDA00027076349600000320
的计算关系为:判断患者在Doctor2的就诊信息
Figure FDA00027076349600000321
的住址
Figure FDA00027076349600000322
是否位于居住区域re1的地理位置
Figure FDA00027076349600000323
里,是,则在Tm就诊量中记录下
Figure FDA00027076349600000324
否,放弃在Tm就诊量中记录;
Figure FDA00027076349600000325
表示去Doctor2进行就诊的患者的家庭住址;
Figure FDA00027076349600000326
表示Doctor2跟re2之间映射的
Figure FDA00027076349600000327
的就诊量;所述
Figure FDA00027076349600000328
的计算关系为:判断患者在Doctor2的就诊信息
Figure FDA00027076349600000329
的住址
Figure FDA00027076349600000330
是否位于居住区域re2的地理位置
Figure FDA00027076349600000331
里,是,则在Tm就诊量中记录下
Figure FDA00027076349600000332
否,放弃在Tm就诊量中记录;
Figure FDA00027076349600000333
表示Doctor2跟rea之间映射的
Figure FDA00027076349600000334
的就诊量;所述
Figure FDA00027076349600000335
的计算关系为:判断患者在Doctor2的就诊信息
Figure FDA00027076349600000336
的住址
Figure FDA00027076349600000337
是否位于居住区域rea的地理位置
Figure FDA00027076349600000338
里,是,则在Tm就诊量中记录下
Figure FDA00027076349600000339
否,放弃在Tm就诊量中记录;
Figure FDA00027076349600000340
表示Doctorb跟re1之间映射的
Figure FDA00027076349600000341
的就诊量;所述
Figure FDA00027076349600000342
的计算关系为:判断患者在Doctorb的就诊信息
Figure FDA00027076349600000343
的住址
Figure FDA00027076349600000344
是否位于居住区域re1的地理位置
Figure FDA00027076349600000345
里,是,则在Tm就诊量中记录下
Figure FDA00027076349600000346
否,放弃在Tm就诊量中记录;
Figure FDA0002707634960000041
表示去Doctorb进行就诊的患者的家庭住址;
Figure FDA0002707634960000042
表示Doctorb跟re2之间映射的
Figure FDA0002707634960000043
的就诊量;所述
Figure FDA0002707634960000044
的计算关系为:判断患者在Doctorb的就诊信息
Figure FDA0002707634960000045
的住址
Figure FDA0002707634960000046
是否位于居住区域re2的地理位置
Figure FDA0002707634960000047
里,是,则在Tm就诊量中记录下
Figure FDA0002707634960000048
否,放弃在Tm就诊量中记录;
Figure FDA0002707634960000049
表示Doctorb跟rea之间映射的
Figure FDA00027076349600000410
的就诊量;所述
Figure FDA00027076349600000411
的计算关系为:判断患者在Doctorb的就诊信息
Figure FDA00027076349600000412
的住址
Figure FDA00027076349600000413
是否位于居住区域rea的地理位置
Figure FDA00027076349600000414
里,是,则在Tm就诊量中记录下
Figure FDA00027076349600000415
否,放弃在Tm就诊量中记录;
步骤C:根据步骤B得到的医疗机构—居住区就诊量设计适用于时空多维度条件下,多尺度与多粒度的海量数据的线性回归张量因子;
线性回归张量因子记为FR=[Rr,Rs,Rt]b×a×3
距离因子
Figure FDA00027076349600000416
就诊量因子
Figure FDA00027076349600000417
人流量因子
Figure FDA00027076349600000418
r表示距离标识,s表示就诊量标识,t表示人流量标识;b的取值为321,a的取值为1343;
Figure FDA00027076349600000419
表示Doctor1跟re1之间的距离,利用
Figure FDA00027076349600000420
Figure FDA00027076349600000421
进行距离的计算,计算公式为
Figure FDA00027076349600000422
Figure FDA0002707634960000051
表示Doctor1跟re2之间的距离,利用
Figure FDA0002707634960000052
Figure FDA0002707634960000053
进行距离的计算,计算公式为
Figure FDA0002707634960000054
Figure FDA0002707634960000055
表示Doctor1跟rea之间的距离,利用
Figure FDA0002707634960000056
Figure FDA0002707634960000057
进行距离的计算,计算公式为
Figure FDA0002707634960000058
Figure FDA0002707634960000059
表示Doctor2跟re1之间的距离,利用
Figure FDA00027076349600000510
Figure FDA00027076349600000511
进行距离的计算,计算公式为
Figure FDA00027076349600000512
Figure FDA00027076349600000513
表示Doctor2跟re2之间的距离,利用
Figure FDA00027076349600000514
Figure FDA00027076349600000515
进行距离的计算,计算公式为
Figure FDA00027076349600000516
Figure FDA00027076349600000517
表示Doctor2跟rea之间的距离,利用
Figure FDA00027076349600000518
Figure FDA00027076349600000519
进行距离的计算,计算公式为
Figure FDA00027076349600000520
Figure FDA00027076349600000521
表示Doctorb跟re1之间的距离,利用
Figure FDA00027076349600000522
Figure FDA00027076349600000523
进行距离的计算,计算公式为
Figure FDA00027076349600000524
Figure FDA00027076349600000525
表示Doctorb跟re2之间的距离,利用
Figure FDA00027076349600000526
Figure FDA00027076349600000527
进行距离的计算,计算公式为
Figure FDA00027076349600000528
Figure FDA00027076349600000529
表示Doctorb跟rea之间的距离,利用
Figure FDA00027076349600000530
Figure FDA00027076349600000531
进行距离的计算,计算公式为
Figure FDA00027076349600000532
Figure FDA00027076349600000533
表示Doctor1跟距离re1最近的5个居住区域之间的患者就诊量的平均值;令
Figure FDA00027076349600000534
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域;
Figure FDA00027076349600000535
的计算形式为
Figure FDA00027076349600000536
距离最近的五个居住区域表现形式为
Figure FDA00027076349600000537
Figure FDA00027076349600000538
Figure FDA00027076349600000539
表示Doctor1跟距离re2最近的5个居住区域之间的患者就诊量的平均值;令
Figure FDA00027076349600000540
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域;
Figure FDA00027076349600000541
的计算形式为
Figure FDA00027076349600000542
令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,ren-1,ren,ren+1,rea为距离最近的五个居住区域;
Figure FDA0002707634960000061
的计算形式为
Figure FDA0002707634960000062
Figure FDA0002707634960000063
表示Doctor1跟距离rea最近的5个居住区域之间的患者就诊量的平均值;
Figure FDA0002707634960000064
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域;
Figure FDA0002707634960000065
的计算形式为
Figure FDA0002707634960000066
令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,re2,ren-1,ren,ren+1为距离最近的五个居住区域;
Figure FDA0002707634960000067
的计算公式为
Figure FDA0002707634960000068
Figure FDA0002707634960000069
表示Doctor2跟距离re1最近的5个居住区域之间的患者就诊量的平均值;令
Figure FDA00027076349600000610
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域;
Figure FDA00027076349600000611
的计算形式为
Figure FDA00027076349600000612
令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re2,ren-1,ren,ren+1,rea为距离最近的五个居住区域;
Figure FDA00027076349600000613
的计算公式为
Figure FDA00027076349600000614
Figure FDA00027076349600000615
表示Doctor2跟距离re2最近的5个居住区域之间的患者就诊量的平均值;令
Figure FDA00027076349600000616
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域;
Figure FDA00027076349600000617
的计算形式为
Figure FDA00027076349600000618
令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,ren-1,ren,ren+1,rea为距离最近的五个居住区域;
Figure FDA00027076349600000619
的计算公式为
Figure FDA00027076349600000620
Figure FDA00027076349600000621
表示Doctor2跟距离rea最近的5个居住区域之间的患者就诊量的平均值;
Figure FDA00027076349600000622
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域;
Figure FDA00027076349600000623
的计算形式为
Figure FDA00027076349600000624
令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,re2,ren-1,ren,ren+1为距离最近的五个居住区域;
Figure FDA0002707634960000071
的计算形式为
Figure FDA0002707634960000072
Figure FDA0002707634960000073
表示Doctorb跟距离re1最近的5个居住区域之间的患者就诊量的平均值;令
Figure FDA0002707634960000074
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域;
Figure FDA0002707634960000075
的计算形式为
Figure FDA0002707634960000076
令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re2,ren-1,ren,ren+1,rea为距离最近的五个居住区域;
Figure FDA0002707634960000077
的计算公式为
Figure FDA0002707634960000078
Figure FDA0002707634960000079
表示Doctorb跟距离re2最近的5个居住区域之间的患者就诊量的平均值;令
Figure FDA00027076349600000710
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域;
Figure FDA00027076349600000711
的计算形式为
Figure FDA00027076349600000712
令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,ren-1,ren,ren+1,rea为距离最近的五个居住区域;
Figure FDA00027076349600000713
的计算公式为
Figure FDA00027076349600000714
Figure FDA00027076349600000715
表示Doctorb跟距离rea最近的5个居住区域之间的患者就诊量的平均值;令
Figure FDA00027076349600000716
为从RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中选出的距离最近的五个居住区域;
Figure FDA00027076349600000717
的计算形式为
Figure FDA00027076349600000718
令RE={re1,re2,…,ren-1,ren,ren+1,…,rea}中的re1,re2,ren-1,ren,ren+1为距离最近的五个居住区域;
Figure FDA00027076349600000719
的计算公式为
Figure FDA00027076349600000720
Figure FDA00027076349600000721
表示Doctor1跟re1之间映射的人流量;所述
Figure FDA00027076349600000722
的计算关系为:判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure FDA00027076349600000723
是否位于
Figure FDA00027076349600000724
如果是,则记录在医院基站列表HL中,不是则放弃记录;同理,判断PH={Phone1,Phone2,…,Phonec}中的任意
Figure FDA0002707634960000081
是否位于
Figure FDA0002707634960000082
如果是,则记录在居住区基站列表REL中,不是则放弃记录;如果Phonec同时存在于医院基站列表HL和居住区基站列表REL中则在人流量因子Rt中记录
Figure FDA0002707634960000083
否则,放弃记录;
步骤D:依据步骤C的线性回归张量因子重新对步骤B的医疗机构—居住区就诊量矩阵进行处理,得到医疗机构推荐目标模型;
步骤E:在医疗机构推荐系统中应用步骤D的医疗机构推荐目标模型,并初始化;然后采用隐性特征模型对多元异构的推荐用原始数据进行活化数据挖掘,得到隐性特征矩阵;
医疗机构推荐目标模型记为
Figure FDA0002707634960000084
F表示范数,即Frobenius范数;
γ表示医院隐性特征矩阵的系数;
θ表示对FR张量因子的学习系数;
δ表示居住区隐性特征矩阵的系数;
Weight缺失表示缺失值权重;
当前轮次的J值,记为J当前与前一次的J值,记为J前一次进行差值比较ΔJ=|J当前-J前一次|,若ΔJ趋近于0,则隐性特征模型J达到收敛,并用医疗机构推荐目标模型来修改医疗机构—居住区就诊量矩阵;若ΔJ不趋近于0,则说明隐性特征模型J未达到收敛,返回步骤E重新进行隐性特征矩阵获取;
缺失值权重
Figure FDA0002707634960000085
Figure FDA0002707634960000086
取值范围是0或者1,0代表Doctor1跟re1之间的数据缺失,是需要预测的对象,1代表Doctor1跟re1之间的数据存在,不需要预测;
Figure FDA0002707634960000087
取值范围是0或者1,0代表Doctor1跟re2之间的数据缺失,是需要预测的对象,1代表Doctor1跟re2之间的数据存在,不需要预测;
Figure FDA0002707634960000088
取值范围是0或者1,0代表Doctor1跟rea之间的数据缺失,是需要预测的对象,1代表Doctor1跟rea之间的数据存在,不需要预测;
Figure FDA0002707634960000091
取值范围是0或者1,0代表Doctor2跟re1之间的数据缺失,是需要预测的对象,1代表Doctor2跟re1之间的数据存在,不需要预测;
Figure FDA0002707634960000092
取值范围是0或者1,0代表Doctor2跟re2之间的数据缺失,是需要预测的对象,1代表Doctor2跟re2之间的数据存在,不需要预测;
Figure FDA0002707634960000093
取值范围是0或者1,0代表Doctor2跟rea之间的数据缺失,是需要预测的对象,1代表Doctor2跟rea之间的数据存在,不需要预测;
Figure FDA0002707634960000094
取值范围是0或者1,0代表Doctorb跟re1之间的数据缺失,是需要预测的对象,1代表Doctorb跟re1之间的数据存在,不需要预测;
Figure FDA0002707634960000095
取值范围是0或者1,0代表Doctorb跟re2之间的数据缺失,是需要预测的对象,1代表Doctorb跟re2之间的数据存在,不需要预测;
Figure FDA0002707634960000096
取值范围是0或者1,0代表Doctorb跟rea之间的数据缺失,是需要预测的对象,1代表Doctorb跟rea之间的数据存在,不需要预测;
线性回归张量因子FR选用了多个就诊量协同,因此线性回归张量因子FR的系数记为
Figure FDA0002707634960000097
Figure FDA0002707634960000098
表示Doctor1跟re1之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA0002707634960000099
都由前一轮的隐性特征值
Figure FDA00027076349600000910
通过以下公式更新,第一轮的
Figure FDA00027076349600000911
Figure FDA00027076349600000912
表示随机产生的一个初始数值;
Figure FDA00027076349600000913
α表示梯度下降系数;sum为加和函数符号;
Figure FDA00027076349600000914
表示Doctor1跟re2之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600000915
都由前一轮的隐性特征值
Figure FDA00027076349600000916
通过以下公式更新,第一轮的
Figure FDA00027076349600000917
Figure FDA00027076349600000918
表示随机产生的一个初始数值;
Figure FDA00027076349600000919
Figure FDA00027076349600000920
表示Doctor1跟rea之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600000921
都由前一轮的隐性特征值
Figure FDA00027076349600000922
通过以下公式更新,第一轮的
Figure FDA00027076349600000923
Figure FDA00027076349600000924
表示随机产生的一个初始数值;
Figure FDA00027076349600000925
隐性特征有2个,即医疗机构的隐性特征记为
Figure FDA0002707634960000101
Figure FDA0002707634960000102
表示Doctor1跟re1之间就诊量预测的隐性特征值,最大迭代次数记为m,且m=500;每一轮的
Figure FDA0002707634960000103
都由前一轮的隐性特征值
Figure FDA0002707634960000104
通过以下公式更新,第一轮的
Figure FDA0002707634960000105
Figure FDA0002707634960000106
表示随机产生的一个初始数值,
Figure FDA0002707634960000107
表示Q特征矩阵的转置;计算公式:
Figure FDA0002707634960000108
α表示梯度下降系数;
Figure FDA0002707634960000109
表示Doctor1跟re2之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600001010
都由前一轮的隐性特征值
Figure FDA00027076349600001011
通过以下公式更新,第一轮的
Figure FDA00027076349600001012
Figure FDA00027076349600001041
表示随机产生的一个初始数值,
Figure FDA00027076349600001013
表示Q特征矩阵的转置;计算公式:
Figure FDA00027076349600001014
Figure FDA00027076349600001015
表示Doctor1跟rea之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600001016
都由前一轮的隐性特征值
Figure FDA00027076349600001017
通过以下公式更新,第一轮的
Figure FDA00027076349600001018
Figure FDA00027076349600001019
表示随机产生的一个初始数值,
Figure FDA00027076349600001020
表示Q特征矩阵的转置;计算公式:
Figure FDA00027076349600001021
Figure FDA00027076349600001022
表示Doctor2跟re1之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600001023
都由前一轮的隐性特征值
Figure FDA00027076349600001024
通过以下公式更新,第一轮的
Figure FDA00027076349600001025
表示随机产生的一个初始数值,
Figure FDA00027076349600001026
表示Q特征矩阵的转置;计算公式:
Figure FDA00027076349600001027
Figure FDA00027076349600001028
表示Doctor2跟re2之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600001029
都由前一轮的隐性特征值
Figure FDA00027076349600001030
通过以下公式更新,第一轮的
Figure FDA00027076349600001031
Figure FDA00027076349600001032
表示随机产生的一个初始数值,
Figure FDA00027076349600001033
表示Q特征矩阵的转置;计算公式:
Figure FDA00027076349600001034
Figure FDA00027076349600001035
表示Doctor2跟rea之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600001036
都由前一轮的隐性特征值
Figure FDA00027076349600001037
通过以下公式更新,第一轮的
Figure FDA00027076349600001038
Figure FDA00027076349600001039
表示随机产生的一个初始数值,
Figure FDA00027076349600001040
表示Q特征矩阵的转置;计算公式:
Figure FDA0002707634960000111
Figure FDA0002707634960000112
表示Doctorb跟re1之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA0002707634960000113
都由前一轮的隐性特征值
Figure FDA0002707634960000114
通过以下公式更新,第一轮的
Figure FDA0002707634960000115
Figure FDA0002707634960000116
表示随机产生的一个初始数值,
Figure FDA0002707634960000117
表示Q特征矩阵的转置;计算公式:
Figure FDA0002707634960000118
Figure FDA00027076349600001138
表示Doctorb跟re2之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA0002707634960000119
都由前一轮的隐性特征值
Figure FDA00027076349600001110
通过以下公式更新,第一轮的
Figure FDA00027076349600001111
Figure FDA00027076349600001112
表示随机产生的一个初始数值,
Figure FDA00027076349600001113
表示Q特征矩阵的转置;计算公式:
Figure FDA00027076349600001114
Figure FDA00027076349600001115
表示Doctorb跟rea之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600001116
都由前一轮的隐性特征值
Figure FDA00027076349600001117
通过以下公式更新,第一轮的
Figure FDA00027076349600001118
Figure FDA00027076349600001137
表示随机产生的一个初始数值,
Figure FDA00027076349600001119
表示Q特征矩阵的转置;计算公式:
Figure FDA00027076349600001120
即居住区域的隐性特征记为
Figure FDA00027076349600001121
Figure FDA00027076349600001122
表示Doctor1跟re1之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600001123
都由前一轮的隐性特征值
Figure FDA00027076349600001124
通过以下公式更新,第一轮的
Figure FDA00027076349600001125
Figure FDA00027076349600001126
表示随机产生的一个初始数值,
Figure FDA00027076349600001127
表示P特征矩阵的转置;计算公式:
Figure FDA00027076349600001128
Figure FDA00027076349600001129
表示Doctor1跟re2之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600001130
都由前一轮的隐性特征值
Figure FDA00027076349600001131
通过以下公式更新,第一轮的
Figure FDA00027076349600001132
Figure FDA00027076349600001133
表示随机产生的一个初始数值,
Figure FDA00027076349600001134
表示P特征矩阵的转置;计算公式:
Figure FDA00027076349600001135
Figure FDA00027076349600001136
表示Doctor1跟rea之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA0002707634960000121
都由前一轮的隐性特征值
Figure FDA0002707634960000122
通过以下公式更新,第一轮的
Figure FDA0002707634960000123
Figure FDA0002707634960000124
表示随机产生的一个初始数值,
Figure FDA0002707634960000125
表示P特征矩阵的转置;计算公式:
Figure FDA0002707634960000126
Figure FDA0002707634960000127
表示Doctor2跟re1之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA0002707634960000128
都由前一轮的隐性特征值
Figure FDA0002707634960000129
通过以下公式更新,第一轮的
Figure FDA00027076349600001210
Figure FDA00027076349600001211
表示随机产生的一个初始数值,
Figure FDA00027076349600001212
表示P特征矩阵的转置;计算公式:
Figure FDA00027076349600001213
Figure FDA00027076349600001214
表示Doctor2跟re2之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600001215
都由前一轮的隐性特征值
Figure FDA00027076349600001216
通过以下公式更新,第一轮的
Figure FDA00027076349600001217
Figure FDA00027076349600001218
表示随机产生的一个初始数值,
Figure FDA00027076349600001219
表示P特征矩阵的转置;计算公式:
Figure FDA00027076349600001220
Figure FDA00027076349600001221
表示Doctor2跟rea之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600001222
都由前一轮的隐性特征值
Figure FDA00027076349600001223
通过以下公式更新,第一轮的
Figure FDA00027076349600001224
Figure FDA00027076349600001225
表示随机产生的一个初始数值,
Figure FDA00027076349600001226
表示P特征矩阵的转置;计算公式:
Figure FDA00027076349600001227
Figure FDA00027076349600001228
表示Doctorb跟re1之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600001229
都由前一轮的隐性特征值
Figure FDA00027076349600001230
通过以下公式更新,第一轮的
Figure FDA00027076349600001231
Figure FDA00027076349600001232
表示随机产生的一个初始数值,
Figure FDA00027076349600001233
表示P特征矩阵的转置;计算公式:
Figure FDA00027076349600001234
Figure FDA00027076349600001235
表示Doctorb跟re2之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600001236
都由前一轮的隐性特征值
Figure FDA00027076349600001237
通过以下公式更新,第一轮的
Figure FDA00027076349600001238
Figure FDA00027076349600001239
表示随机产生的一个初始数值,
Figure FDA00027076349600001240
表示P特征矩阵的转置;计算公式:
Figure FDA00027076349600001241
Figure FDA00027076349600001242
表示Doctorb跟rea之间就诊量预测的隐性特征值,迭代m次循环计算,每一轮的
Figure FDA00027076349600001243
都由前一轮的隐性特征值
Figure FDA00027076349600001244
通过以下公式更新,第一轮的
Figure FDA00027076349600001245
Figure FDA00027076349600001246
表示随机产生的一个初始数值,
Figure FDA00027076349600001247
表示P特征矩阵的转置;计算公式:
Figure FDA0002707634960000131
步骤F:通过步骤E得到的隐性特征矩阵,迭代计算医疗机构—居住区就诊量矩阵;若未达到收敛,则返回步骤E,重新计算隐性特征矩阵偏导;若收敛,则修正医疗机构—居住区就诊量矩阵;
Figure FDA0002707634960000132
来修正步骤B构建的医疗机构-居住区域就诊量矩阵,记为Tm就诊量_重构
Figure FDA0002707634960000133
Figure FDA0002707634960000134
表示
Figure FDA0002707634960000135
Figure FDA0002707634960000136
修正后的就诊量;
Figure FDA0002707634960000137
表示
Figure FDA0002707634960000138
Figure FDA0002707634960000139
修正后的就诊量;
Figure FDA00027076349600001310
表示
Figure FDA00027076349600001311
Figure FDA00027076349600001312
修正后的就诊量;
Figure FDA00027076349600001313
表示
Figure FDA00027076349600001314
Figure FDA00027076349600001315
修正后的就诊量;
Figure FDA00027076349600001316
表示
Figure FDA00027076349600001317
Figure FDA00027076349600001318
修正后的就诊量;
Figure FDA00027076349600001319
表示
Figure FDA00027076349600001320
Figure FDA00027076349600001321
修正后的就诊量;
Figure FDA00027076349600001322
表示
Figure FDA00027076349600001323
Figure FDA00027076349600001324
修正后的就诊量;
Figure FDA00027076349600001325
表示
Figure FDA00027076349600001326
Figure FDA00027076349600001327
修正后的就诊量;
Figure FDA00027076349600001328
表示
Figure FDA00027076349600001329
Figure FDA00027076349600001330
修正后的就诊量;
步骤G:以推荐标准误差模型对经步骤F修正后的医疗机构—居住区就诊量矩阵进行推荐标准误差的计算,若标准误差小于0.3,则将获得推荐结果提供给用户;
推荐标准误差模型记为
Figure FDA00027076349600001331
计算推荐标准误差模型RMSE就诊量_误差作为算法准确度的评判标准,如果Weight缺失
Figure FDA00027076349600001332
为0,则通过所述RMSE就诊量_误差来对
Figure FDA00027076349600001333
Figure FDA00027076349600001334
进行相似度衡量。
CN201611073910.8A 2016-11-29 2016-11-29 一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法 Active CN106779181B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611073910.8A CN106779181B (zh) 2016-11-29 2016-11-29 一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611073910.8A CN106779181B (zh) 2016-11-29 2016-11-29 一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法

Publications (2)

Publication Number Publication Date
CN106779181A CN106779181A (zh) 2017-05-31
CN106779181B true CN106779181B (zh) 2021-04-06

Family

ID=58898492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611073910.8A Active CN106779181B (zh) 2016-11-29 2016-11-29 一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法

Country Status (1)

Country Link
CN (1) CN106779181B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110223786B (zh) * 2019-06-13 2021-08-13 重庆亿创西北工业技术研究院有限公司 基于非负张量分解的药物-药物相互作用预测方法及系统
CN113392176B (zh) * 2020-09-28 2023-08-22 腾讯科技(深圳)有限公司 文本相似性的确定方法、装置、设备及介质
CN112331283A (zh) * 2020-10-27 2021-02-05 贵州精准医疗电子有限公司 健康监测方法、装置及计算机可读介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942298A (zh) * 2014-04-14 2014-07-23 清华大学 基于线性回归的推荐方法及系统
WO2016118156A1 (en) * 2015-01-23 2016-07-28 Hewlett-Packard Development Company, L.P. Visually interactive identification of a cohort of data objects similar to a query object based on domain knowledge
CN105871707A (zh) * 2016-06-17 2016-08-17 中国联合网络通信集团有限公司 基于云计算的资源推荐方法及系统
CN106127644A (zh) * 2016-06-22 2016-11-16 朗森特科技有限公司 一种用于远程医疗的专家推荐系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942298A (zh) * 2014-04-14 2014-07-23 清华大学 基于线性回归的推荐方法及系统
WO2016118156A1 (en) * 2015-01-23 2016-07-28 Hewlett-Packard Development Company, L.P. Visually interactive identification of a cohort of data objects similar to a query object based on domain knowledge
CN105871707A (zh) * 2016-06-17 2016-08-17 中国联合网络通信集团有限公司 基于云计算的资源推荐方法及系统
CN106127644A (zh) * 2016-06-22 2016-11-16 朗森特科技有限公司 一种用于远程医疗的专家推荐系统

Also Published As

Publication number Publication date
CN106779181A (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
Kang et al. Understanding house price appreciation using multi-source big geo-data and machine learning
Rosenheim et al. Integration of detailed household and housing unit characteristic data with critical infrastructure for post-hazard resilience modeling
Goodchild et al. A framework for the areal interpolation of socioeconomic data
Nagle et al. Dasymetric modeling and uncertainty
Zhang et al. The Traj2Vec model to quantify residents’ spatial trajectories and estimate the proportions of urban land-use types
Xu et al. Quality assessment of building footprint data using a deep autoencoder network
Dong et al. Spatial random slope multilevel modeling using multivariate conditional autoregressive models: A case study of subjective travel satisfaction in Beijing
CN110119475B (zh) 一种poi推荐方法及推荐系统
Hadayeghi et al. Development of planning-level transportation safety models using full Bayesian semiparametric additive techniques
Tomal Modelling housing rents using spatial autoregressive geographically weighted regression: A case study in Cracow, Poland
Aydinoglu et al. Implementing a mass valuation application on interoperable land valuation data model designed as an extension of the national GDI
CN108897750B (zh) 融合多元上下文信息的个性化地点推荐方法及设备
CN106779181B (zh) 一种基于线性回归因子非负矩阵分解模型的医疗机构推荐方法
Stewart et al. A Bayesian machine learning model for estimating building occupancy from open source data
Shi et al. RegNet: a neural network model for predicting regional desirability with VGI data
Zoraghein et al. Data-enriched interpolation for temporally consistent population compositions
Bhatia et al. Wayfinding: a method for the empirical evaluation of structural saliency using 3d isovists
Zheng et al. Research on urban public green space planning based on taxi data: A case study on three districts of Shenzhen, China
Dudzik Towards characterization of indoor environment in smart buildings: Modelling PMV index using neural network with one hidden layer
Zhang et al. Spatial autoregressive analysis and modeling of housing prices in city of Toronto
Hou et al. Online spatial evaluation of residential livability based on POI data mining and LMBP algorithm
Holmes et al. Developing physician migration estimates for workforce models
Malhotra et al. Open-source tool for transforming CityGML levels of detail
Pezzulo et al. Understanding factors associated with attending secondary school in Tanzania using household survey data
CN114757518A (zh) 资产评估方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant