CN116170448B - 一种跨组织的数据共享的方法和存储介质 - Google Patents

一种跨组织的数据共享的方法和存储介质 Download PDF

Info

Publication number
CN116170448B
CN116170448B CN202310426571.0A CN202310426571A CN116170448B CN 116170448 B CN116170448 B CN 116170448B CN 202310426571 A CN202310426571 A CN 202310426571A CN 116170448 B CN116170448 B CN 116170448B
Authority
CN
China
Prior art keywords
response
access request
data
time
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310426571.0A
Other languages
English (en)
Other versions
CN116170448A (zh
Inventor
于萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei Foresight Software Technology Co ltd
Original Assignee
Hebei Foresight Software Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei Foresight Software Technology Co ltd filed Critical Hebei Foresight Software Technology Co ltd
Priority to CN202310426571.0A priority Critical patent/CN116170448B/zh
Publication of CN116170448A publication Critical patent/CN116170448A/zh
Application granted granted Critical
Publication of CN116170448B publication Critical patent/CN116170448B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1021Server selection for load balancing based on client or server locations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种跨组织的数据共享的方法和存储介质,涉及数据同步领域。本发明包括,获取全部数据服务器的位置分布;获取用户的身份信息、发出访问请求的位置以及发出访问请求的时刻;按照用户的发出访问请求的位置以及数据服务器的位置分布,匹配距离最近的数据服务器作为响应数据服务器并进行数据请求响应;将用户的身份信息、发出访问请求的时刻以及响应数据服务器的位置进行关联,获取每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录;根据每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录得到用户的活跃数据服务器。本发明有效避免跨组织全局更新拖慢更新效率降低数据使用效率的问题。

Description

一种跨组织的数据共享的方法和存储介质
技术领域
本发明属于数据同步技术领域,特别是涉及一种跨组织的数据共享的方法和存储介质。
背景技术
由于使用场景的限制,用户数据的产生和存储往往不是位于同一位置,有时候甚至跨越不同的组织,但是由于应用需要必须保障组织之间的数据实时同步。尤其是对在医疗、养老以及健康等生命攸关的重要行业,身体健康数据尤其需要实现远程跨组织快速同步,以此实现远程医疗会诊等重要应用。现有远程数据同步方案会将更新的数据在所有数据库进行更新操作,或者在设定范围的数据库中执行更新操作,这就可能会消耗不必要网络和数据库操作开销,尤其是跨组织的数据同步过程中会严重拖慢数据同步的效率。
在公开号为CN106156094A的专利中公开了一种数据库的远程数据同步方法和装置,其中方法包括:获取数据更新事件更新的业务数据,生成与所述数据更新事件对应的事件版本,并将所述业务数据和事件版本封装成事件对象;将事件对象传输至对端的业务应用,以使得对端的业务应用在根据所述事件版本确定数据更新事件有效时,根据所述业务数据更新对端数据库。该方案依旧是将更新的数据在全局范围内进行同步。
发明内容
本发明的目的在于提供一种跨组织的数据共享的方法和存储介质,通过结合更新数据的特性划定数据服务器的更新范围,有效避免跨组织全局更新拖慢更新效率降低数据使用效率的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明提供一种跨组织的数据共享的方法,包括,
获取全部数据服务器的位置分布;
获取用户的身份信息、发出访问请求的位置以及发出访问请求的时刻;
按照用户的发出访问请求的位置以及所述数据服务器的位置分布,匹配距离最近的所述数据服务器作为响应数据服务器并进行数据请求响应,此处的距离指代网络距离,网络距离是指计算机网络中两个网络节点之间的距离或路径长度。它可以用不同的度量标准来衡量,包括带宽、延迟、吞吐量、可靠性等。网络距离可以影响网络的性能和效率,因为它直接影响了数据在网络中传输的速度和可靠性。一些常用的计算网络距离的方法包括路由距离算法(如RIP、OSPF、BGP等)、链路状态算法(如Dijkstra算法)以及向量距离算法(如Bellman-Ford算法);
获取响应数据服务器的位置;
将用户的身份信息、发出访问请求的时刻以及响应数据服务器的位置进行关联,获取每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录;
根据每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录得到用户的活跃数据服务器;
将用户在数据服务器中的用户数据备份至对应的活跃数据服务器。
在本发明的一个实施例中,所述根据每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录得到用户的活跃数据服务器的步骤,包括,
对于每个用户,
在用户多次发出访问请求的过程中获取多个对应的响应数据服务器的位置;
根据多个对应的响应数据服务器的位置获取多个对应的响应数据服务器的平均距离作为筛选距离;
以筛选距离为半径画圆,获取每个响应数据服务器的半径画圆范围内响应数据服务器的数量及位置分布;
获取每个初始半径圆的圆心最接近的响应数据服务器作为预选数据服务器;
持续扩大更新所述筛选距离,以预选数据服务器的位置为圆心画圆,持续更新预选数据服务器并获取画圆范围内的响应数据服务器的数量及位置分布;
根据持续更新的预选数据服务器以及画圆范围内的响应数据服务器的数量获取用户的活跃数据服务器。
在本发明的一个实施例中,所述根据持续更新的预选数据服务器以及画圆范围内的响应数据服务器的数量获取用户的活跃数据服务器的步骤,还包括,
在每次增加所述筛选距离的长度后采集画圆范围内的响应数据服务器的数量;
建立每个画圆范围内的响应数据服务器的数量关于所述筛选距离的长度的相关关系;
剔除每次增加筛选距离的长度后画圆范围内的响应数据服务器的数量的增长速度达不到筛选距离的长度增长速度的画圆范围,被剔除的画圆范围不再更新;
持续增加所述筛选距离的长度并更新预选数据服务器,直至更新后的预选数据服务器不再发生改变,得到活跃核心数据服务器;
将此时以活跃核心数据服务器为圆心,以筛选距离为半径画圆内的响应数据服务器作为活跃数据服务器。
在本发明的一个实施例中,所述筛选距离的长度的增加速度按照线性或指数性增长。
在本发明的一个实施例中,所述根据每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录得到用户的活跃数据服务器的步骤,还包括,
对于每个用户,
将每个活跃核心数据服务器和对应筛选距离内的响应服务器划入同一个响应服务器单元;
获取响应服务器全部对应的发出访问请求的时刻;
根据响应服务器全部对应的发出访问请求的时刻获取响应服务器的响应访问请求的迄今时间的分布;
根据响应服务器的响应访问请求的迄今时间的分布获取响应服务器的响应访问请求的迄今时间的均值作为响应服务器的响应历史时间;
获取每个响应服务器单元内每个响应服务器的响应历史时间之和作为响应服务器单元的响应累加历史时间;
按照响应服务器单元的响应累加历史时间大小进行排序得到响应服务器单元序列;
在响应服务器单元序列中获取响应累加历史时间的聚集区段;
将响应服务器单元序列中响应累加历史时间的聚集区段对应的响应数据服务器作为活跃数据服务器。
在本发明的一个实施例中,所述在响应服务器单元序列中获取响应累加历史时间的聚集区段的步骤,包括,
对于每个用户,
获取响应服务器单元的响应累加历史时间在响应服务器单元序列上的分布范围作为响应累加历史时间的分布范围;
将响应累加历史时间的分布范围的一半作为测试窗口范围;
以响应服务器单元序列中的每个响应累加历史时间为中心获取测试窗口范围其它响应累加历史时间的数量;
将测试窗口范围其它响应累加历史时间的数量最多对应的响应累加历史时间作为响应服务器单元序列中的响应累加历史时间聚集点;
将以响应服务器单元序列中的响应累加历史时间聚集点为中心,测试窗口范围内的响应累加历史时间作为响应累加历史时间的聚集区段。
在本发明的一个实施例中,所述将用户在数据服务器中的用户数据备份至对应的活跃数据服务器的步骤,包括,
对于每个用户,
根据每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录,获取用户调用活跃数据服务器内数据资源的访问请求时刻;
根据用户调用活跃数据服务器内数据资源的访问请求时刻获取每个数据资源的访问请求时刻;
根据数据资源的访问请求时刻判断数据资源是否属于常用数据资源;
若是,则将数据资源备份至同一用户对应的全部活跃数据服务器;
若否,则不将该数据资源进行备份。
在本发明的一个实施例中,所述根据数据资源的访问请求时刻判断数据资源是否属于常用数据资源的步骤,包括,
根据数据资源的访问请求时刻获取每个数据资源的若干次访问请求时刻的分布;
对于每个数据资源,
将每次访问请求时刻的分布在时间轴上进行标注,获取每个数据资源的每次访问请求时刻在时间轴上的分布;
获取时间轴上每次访问请求时刻的分布区段;
剔除每次访问请求时刻的分布区段中的异常值得到时间轴上每次访问请求时刻的核心分布区段;
根据时间轴上每次访问请求时刻的核心分布区段获取迄今最近的访问请求时刻以及迄今最远的访问请求时刻;
根据迄今最远的访问请求时刻得到访问请求时刻中值;
若时间轴上迄今最近的访问请求时刻小于或等于访问请求时刻中值则判定时间轴上每次访问请求时刻的分布区段对应的数据资源属于常用数据资源;
若时间轴上迄今最近的访问请求时刻大于访问请求时刻中值则判定时间轴上每次访问请求时刻的分布区段对应的数据资源不属于常用数据资源。
在本发明的一个实施例中,所述剔除每次访问请求时刻的分布区段中的异常值得到时间轴上每次访问请求时刻的核心分布区段的步骤,包括,
获取每次访问请求时刻的分布区段中每个访问请求时刻与时间上相邻的两个访问请求时刻之和;
获取每次访问请求时刻的分布区段中每个访问请求时刻与时间上相邻的两个访问请求时刻之和的均值作为间隔参考值;
将与时间上相邻的两个访问请求时刻之和大于间隔参考值的访问请求时刻作为异常访问请求时刻;
剔除异常访问请求时刻得到正常的访问请求时刻组成的时间轴上每次访问请求时刻的核心分布区段。
本发明还公开了一种存储介质,所述存储介质中存储有至少一条命令、至少一段程序、代码集或指令集,所述至少一条命令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现所述的跨组织的数据共享的方法。
本发明通过结合访问请求的响应数据服务器以及发出访问请求的时间,将每个用户经常访问数据服务器标记为该用户的活跃数据服务器,并且将该用户的数据备份到对应的活跃数据服务器,从而实现降低数据整个数据共享网络和服务器数据吞吐负载的技术效果。在不影响数据服务的前提下,提高了整体的数据同步速度。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所述一种跨组织的数据共享的方法的步骤流程示意图;
图2为本发明所述步骤S6的步骤流程示意图一;
图3为本发明所述步骤S616的步骤流程示意图;
图4为本发明所述步骤S6的步骤流程示意图二;
图5为本发明所述步骤S627的步骤流程示意图;
图6为本发明所述步骤S7的步骤流程示意图;
图7为本发明所述步骤S73的步骤流程示意图;
图8为本发明所述步骤S733的步骤流程示意图;
图9为本发明所述一种跨组织的数据共享系统的功能模块连接示意图;
图10为本发明所述一种存储介质在主控服务器内的模块连接示意图;
附图中,各标号所代表的部件列表如下:
100-主控服务器,101-处理器,102-存储介质,110-主控数据仓;
200-通讯线路;
300-数据服务器;
400-用户端。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
医疗养老等与人身健康息息相关的数据需要保持实时同步,但是由于就医养老的特性,用户的数据访问地点具有聚集的特性。例如患者刷医保卡就医倾向于在参保地医疗机构就医,如果通过数据分析发现患者几乎不在外地就医,就可以只将患者的数据在参保地归属于不同医疗健康组织的数据服务器间进行同步,即可以满足使用需求。同时由于局部数据备份能够节省跨组织的网络资源和数据服务器硬件开销,因此能够在不降低数据使用体验的状态下实现更有效率的数据备份。
请参阅图1和9所示,本发明提供了一种跨组织的数据共享的系统,从功能模块上划分可以包括主控服务器,通讯线路、数据服务器以及用户端。主控服务器包括处理器和存储介质。主控服务器通过通讯线路执行步骤S1获取全部数据服务器的位置分布,由于本方案针对与用户个人身份息息相关的组织机构,例如医院、养老院、卫生管理机构等等,因此并不需要获取数据服务器非常精确的位置也可以在较大尺度范围内实现有效的定位。接下来可以执行步骤S2获取用户的身份信息、发出访问请求的位置以及发出访问请求的时刻,同样是通过通讯线路获取此类信息。接下来可以执行步骤S3按照用户的发出访问请求的位置以及数据服务器的位置分布,匹配距离最近的数据服务器作为响应数据服务器并进行数据请求响应,此处可以是由主控服务器接收访问请求后进行路由中转,也可以是用户端直接访问请求距离最近的数据服务器。接下来可以执行步骤S4获取响应数据服务器的位置,同样是不需要获取数据服务器非常精确的位置。
接下来可以执行步骤S5将用户的身份信息、发出访问请求的时刻以及响应数据服务器的位置进行关联,获取每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录,依此分析出用户的数据访问特性。接下来可以执行步骤S6根据每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录得到用户的活跃数据服务器,通过对用户的数据访问特性进行分析,从而得到经常访问的数据服务器,也就是活跃数据服务器。最后可以执行步骤S7将用户在数据服务器中的用户数据备份至对应的活跃数据服务器。也就是将用户的数据在常用的数据服务器内进行同步,避免全局数据同步过度消耗网络资源和数据服务器的吞吐资源,在不影响用户数据使用的前提下实现数据的有效同步。由于本方案中对网络资源消耗较低,尤其适用于跨组织的远程数据同步系统。
需要说明的是,本方案中未被同步的数据并不意味着无法被异地调用,依旧是可以通过通讯线路进行跨网络跨组织的调用。在本方案实施过程中可以将全网的数据资源均同步在主控数据仓内,不仅起到异地备份容灾的作用,还能便于调用。
请参阅图2所示,由于用户的活动范围是有规律的,例如退休老人受限于身体机能退化,其出行范围往往局限于本地,则其养老医疗相关数据只需要存储在曾经经常使用的数据服务器即可,具体而言,对于每个用户,首先可以执行步骤S611在用户多次发出访问请求的过程中获取多个对应的响应数据服务器的位置。
由于用户可能偶尔到外地去,但是以后大概率是再也不会去,为了更加准确评估,可以认为,如果用户以前只去过一次的地方,以后大概率也不会再去。具体到本方案中的内容,对于用户以往只访问过一次的数据服务器,以后大概率也不会再访问,因此不需要将其划入数据同步的范围。这就需要首先划定那些数据服务器是经常访问的,首先可以执行步骤S612根据多个对应的响应数据服务器的位置获取多个对应的响应数据服务器的平均距离作为筛选距离。接下来可以执行步骤S613以筛选距离为半径画圆,获取每个响应数据服务器的半径画圆范围内响应数据服务器的数量及位置分布。接下来可以执行步骤S614获取每个初始半径圆的圆心最接近的响应数据服务器作为预选数据服务器,这些预选数据服务器中最经常使用的数据服务器,为了避免数据同步的数据服务器太少导致问题,需要扩大数据同步的范围,具体而言就是执行步骤S615持续扩大更新筛选距离,以预选数据服务器的位置为圆心画圆,持续更新预选数据服务器并获取画圆范围内的响应数据服务器的数量及位置分布。最后可以执行步骤S616根据持续更新的预选数据服务器以及画圆范围内的响应数据服务器的数量获取用户的活跃数据服务器,从而得到用户常用的数据服务器。
请参阅图3所示,为了避免将用户不经常访问的数据服务器剔除出活跃数据服务器需要对全部的响应服务器进行进一步的分析。首先需要达成一个共识,对于正常的用户而言,距离用户经常居住地越远的数据服务器越不经常访问,那些只去一次的地方大概率是严重偏离以上的规律。有鉴于此,在实施步骤S616的时候首先可以执行步骤S6161在每次增加筛选距离的长度后采集画圆范围内的响应数据服务器的数量。接下来可以执行步骤S6162建立每个画圆范围内的响应数据服务器的数量关于筛选距离的长度的相关关系。接下来可以执行步骤S6163剔除每次增加筛选距离的长度后画圆范围内的响应数据服务器的数量的增长速度达不到筛选距离的长度增长速度的画圆范围,被剔除的画圆范围不再更新。接下来可以执行步骤S6164持续增加筛选距离的长度并更新预选数据服务器,直至更新后的预选数据服务器不再发生改变,得到活跃核心数据服务器。最后可以执行步骤S6165将此时以活跃核心数据服务器为圆心,以筛选距离为半径画圆内的响应数据服务器作为活跃数据服务器。
参照日常的经验,距离用户经常居住地越远的数据服务器越不经常访问这一规律可以细化为距离经常居住地的距离和达到次数呈反比例关系,为了快速有效筛选出预选数据服务器,上述步骤S6161和步骤S6164中筛选距离的长度的增加速度按照线性或指数性增长。
请参阅图4所示,同样还可以从另一个角度思考本方案,有些数据服务器以前经常访问,但是最近不再经常访问,这可能是因为用户迁居导致更换经常居住地,如果把这些老旧的数据也进行同步同样是没有必要的,为了避免此类问题,对于每个用户,上述的步骤S6在执行的过程中首先可以执行步骤S621将每个活跃核心数据服务器和对应筛选距离内的响应服务器划入同一个响应服务器单元。接下来可以执行步骤S622获取响应服务器全部对应的发出访问请求的时刻,接下来可以执行步骤S623根据响应服务器全部对应的发出访问请求的时刻获取响应服务器的响应访问请求的迄今时间的分布。接下来可以执行步骤S624根据响应服务器的响应访问请求的迄今时间的分布获取响应服务器的响应访问请求的迄今时间的均值作为响应服务器的响应历史时间。接下来可以执行步骤S625获取每个响应服务器单元内每个响应服务器的响应历史时间之和作为响应服务器单元的响应累加历史时间。接下来可以执行步骤S626按照响应服务器单元的响应累加历史时间大小进行排序得到响应服务器单元序列。接下来可以执行步骤S627在响应服务器单元序列中获取响应累加历史时间的聚集区段。最后可以执行步骤S628将响应服务器单元序列中响应累加历史时间的聚集区段对应的响应数据服务器作为活跃数据服务器。这样就可以避免不再访问使用老旧数据也进行同步。
请参阅图5所示,为了避免老旧数据被同步,需要准确找到用户不在访问的老旧数据,在本方案中也就是找到那些曾经经常访问但是现在不再经常访问的数据服务器,对于每个用户,首先可以执行步骤S6271获取响应服务器单元的响应累加历史时间在响应服务器单元序列上的分布范围作为响应累加历史时间的分布范围。接下来可以执行步骤S6272将响应累加历史时间的分布范围的一半作为测试窗口范围,接下来可以执行步骤S6273以响应服务器单元序列中的每个响应累加历史时间为中心获取测试窗口范围其它响应累加历史时间的数量。接下来可以执行步骤S6274将测试窗口范围其它响应累加历史时间的数量最多对应的响应累加历史时间作为响应服务器单元序列中的响应累加历史时间聚集点。最后可以执行步骤S6275将以响应服务器单元序列中的响应累加历史时间聚集点为中心,测试窗口范围内的响应累加历史时间作为响应累加历史时间的聚集区段。
请参阅图6所示,从时间维度进行考虑,活跃数据服务器中的数据也不是全部都需要同步,对于哪些长时间不使用的数据,并不需要在活跃数据服务器之间进行同步,具体而言也就是首先执行步骤S71根据每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录,获取用户调用活跃数据服务器内数据资源的访问请求时刻。接下来可以执行步骤S72根据用户调用活跃数据服务器内数据资源的访问请求时刻获取每个数据资源的访问请求时刻,接下来可以执行步骤S73根据数据资源的访问请求时刻判断数据资源是否属于常用数据资源。若是,则接下来可以执行步骤S74将数据资源备份至同一用户对应的全部活跃数据服务器;若否,则接下来可以执行步骤S75不将该数据资源进行备份。避免活跃数据服务器中的不常用数据同步对系统运行造成的不良影响。
请参阅图7所示,为了实现上述目的,需要结合用户的数据使用情况判断活跃数据库中的哪些数据资源属于常用资源,首先可以执行步骤S731根据数据资源的访问请求时刻获取每个数据资源的若干次访问请求时刻的分布。
对于每个数据资源,可以执行步骤S732将每次访问请求时刻的分布在时间轴上进行标注,获取每个数据资源的每次访问请求时刻在时间轴上的分布。接下来可以执行步骤S733获取时间轴上每次访问请求时刻的分布区段,接下来可以执行步骤S734剔除每次访问请求时刻的分布区段中的异常值得到时间轴上每次访问请求时刻的核心分布区段。接下来可以执行步骤S735根据时间轴上每次访问请求时刻的核心分布区段获取迄今最近的访问请求时刻以及迄今最远的访问请求时刻。接下来可以执行步骤S736根据迄今最远的访问请求时刻得到访问请求时刻中值。
接下来可以执行步骤S737判断时间轴上迄今最近的访问请求时刻是否小于或等于访问请求时刻中值,借此判断是否属于不常用的老旧数据资源,若是则接下来可以执行步骤S738判定时间轴上每次访问请求时刻的分布区段对应的数据资源属于常用数据资源。若时间轴上迄今最近的访问请求时刻大于访问请求时刻中值则接下来可以执行步骤S739判定时间轴上每次访问请求时刻的分布区段对应的数据资源不属于常用数据资源。通过对数据资源的调用时间进行分析,筛选出常用数据资源进行同步。
请参阅图8所示,为了判断哪些数据资源属于数据常用数据资源,需要排除一些干扰项,例如可能会存在用户在长久不使用某一数据资源之后突然调用一次,但之后由于使用习惯大概率还是不再使用,为了实现干扰项排除,上述步骤S733在执行的过程中首先可以执行步骤S7331获取每次访问请求时刻的分布区段中每个访问请求时刻与时间上相邻的两个访问请求时刻之和。接下来可以执行步骤S7332获取每次访问请求时刻的分布区段中每个访问请求时刻与时间上相邻的两个访问请求时刻之和的均值作为间隔参考值。接下来可以执行步骤S7333将与时间上相邻的两个访问请求时刻之和大于间隔参考值的访问请求时刻作为异常访问请求时刻。最后可以执行步骤S7334剔除异常访问请求时刻得到正常的访问请求时刻组成的时间轴上每次访问请求时刻的核心分布区段。从而将真正常用的数据资源挑选出来进行同步,在保障数据同步效果的前提下进一步降低了对网络资源的占用消耗,提高了跨组织网络的数据同步效率。
本发明还提供一种存储介质,存储介质中存储有至少一条命令、至少一段程序、代码集或指令集,至少一条命令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述的跨组织的数据共享的方法。
综上所述,本发明在实施的过程中结合访问请求的响应数据服务器以及发出访问请求的时间,将每个用户经常访问数据服务器标记为该用户的活跃数据服务器,并且将该用户的数据备份到对应的活跃数据服务器,从而实现降低数据整个数据共享网络和服务器数据吞吐负载的技术效果。在保障数据安全同步的基础上提高了数据同步的效率。
本发明所示实施例的上述描述(包括在说明书摘要中的内容)并非意在详尽列举或将本发明限制到本文所公开的精确形式。尽管在本文仅为说明的目的而描述了本发明的具体实施例和本发明的实例,但是正如本领域技术人员将认识和理解的,各种等效修改是可以在本发明的精神和范围内的。如所指出的,可以按照本发明实施例的上述描述来对本发明进行这些修改,并且这些修改将在本发明的精神和范围内。
本文已经在总体上将系统和方法描述为有助于理解本发明的细节。此外,已经给出了各种具体细节以提供本发明实施例的总体理解。然而,相关领域的技术人员将会认识到,本发明的实施例可以在没有一个或多个具体细节的情况下进行实践,或者利用其它装置、系统、配件、方法、组件、材料、部分等进行实践。在其它情况下,并未特别示出或详细描述公知结构、材料和/或操作以避免对本发明实施例的各方面造成混淆。
因而,尽管本发明在本文已参照其具体实施例进行描述,但是修改自由、各种改变和替换意在上述公开内,并且应当理解,在某些情况下,在未背离所提出发明的范围和精神的前提下,在没有对应使用其他特征的情况下将采用本发明的一些特征。因此,可以进行许多修改,以使特定环境或材料适应本发明的实质范围和精神。本发明并非意在限制到在下面权利要求书中使用的特定术语和/或作为设想用以执行本发明的最佳方式公开的具体实施例,但是本发明将包括落入所附权利要求书范围内的任何和所有实施例及等同物。因而,本发明的范围将只由所附的权利要求书进行确定。

Claims (8)

1.一种跨组织的数据共享的方法,其特征在于,包括,
获取全部数据服务器的位置分布;
获取用户的身份信息、发出访问请求的位置以及发出访问请求的时刻;
按照用户的发出访问请求的位置以及所述数据服务器的位置分布,匹配距离最近的所述数据服务器作为响应数据服务器并进行数据请求响应;
获取响应数据服务器的位置;
将用户的身份信息、发出访问请求的时刻以及响应数据服务器的位置进行关联,获取每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录;
根据每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录得到用户的活跃数据服务器;
将用户在数据服务器中的用户数据备份至对应的活跃数据服务器;
其中,
所述根据每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录得到用户的活跃数据服务器的步骤,包括,
对于每个用户,
在用户多次发出访问请求的过程中获取多个对应的响应数据服务器的位置;
根据多个对应的响应数据服务器的位置获取多个对应的响应数据服务器的平均距离作为筛选距离;
以筛选距离为半径画圆,获取每个响应数据服务器的半径画圆范围内响应数据服务器的数量及位置分布;
获取每个初始半径圆的圆心最接近的响应数据服务器作为预选数据服务器;
持续扩大更新所述筛选距离,以预选数据服务器的位置为圆心画圆,持续更新预选数据服务器并获取画圆范围内的响应数据服务器的数量及位置分布;
根据持续更新的预选数据服务器以及画圆范围内的响应数据服务器的数量获取用户的活跃数据服务器;
所述根据持续更新的预选数据服务器以及画圆范围内的响应数据服务器的数量获取用户的活跃数据服务器的步骤,还包括,
在每次增加所述筛选距离的长度后采集画圆范围内的响应数据服务器的数量;
建立每个画圆范围内的响应数据服务器的数量关于所述筛选距离的长度的相关关系;
剔除每次增加筛选距离的长度后画圆范围内的响应数据服务器的数量的增长速度达不到筛选距离的长度增长速度的画圆范围,被剔除的画圆范围不再更新;
持续增加所述筛选距离的长度并更新预选数据服务器,直至更新后的预选数据服务器不再发生改变,得到活跃核心数据服务器;
将此时以活跃核心数据服务器为圆心,以筛选距离为半径画圆内的响应数据服务器作为活跃数据服务器。
2.根据权利要求1所述的方法,其特征在于,所述筛选距离的长度的增加速度按照线性或指数性增长。
3.根据权利要求1所述的方法,其特征在于,所述根据每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录得到用户的活跃数据服务器的步骤,还包括,
对于每个用户,
将每个活跃核心数据服务器和对应筛选距离内的响应服务器划入同一个响应服务器单元;
获取响应服务器全部对应的发出访问请求的时刻;
根据响应服务器全部对应的发出访问请求的时刻获取响应服务器的响应访问请求的迄今时间的分布;
根据响应服务器的响应访问请求的迄今时间的分布获取响应服务器的响应访问请求的迄今时间的均值作为响应服务器的响应历史时间;
获取每个响应服务器单元内每个响应服务器的响应历史时间之和作为响应服务器单元的响应累加历史时间;
按照响应服务器单元的响应累加历史时间大小进行排序得到响应服务器单元序列;
在响应服务器单元序列中获取响应累加历史时间的聚集区段;
将响应服务器单元序列中响应累加历史时间的聚集区段对应的响应数据服务器作为活跃数据服务器。
4.根据权利要求3所述的方法,其特征在于,所述在响应服务器单元序列中获取响应累加历史时间的聚集区段的步骤,包括,
对于每个用户,
获取响应服务器单元的响应累加历史时间在响应服务器单元序列上的分布范围作为响应累加历史时间的分布范围;
将响应累加历史时间的分布范围的一半作为测试窗口范围;
以响应服务器单元序列中的每个响应累加历史时间为中心获取测试窗口范围其它响应累加历史时间的数量;
将测试窗口范围其它响应累加历史时间的数量最多对应的响应累加历史时间作为响应服务器单元序列中的响应累加历史时间聚集点;
将以响应服务器单元序列中的响应累加历史时间聚集点为中心,测试窗口范围内的响应累加历史时间作为响应累加历史时间的聚集区段。
5.根据权利要求1所述的方法,其特征在于,所述将用户在数据服务器中的用户数据备份至对应的活跃数据服务器的步骤,包括,
对于每个用户,
根据每个用户的响应数据服务器的位置关于发出访问请求的时刻的历史记录,获取用户调用活跃数据服务器内数据资源的访问请求时刻;
根据用户调用活跃数据服务器内数据资源的访问请求时刻获取每个数据资源的访问请求时刻;
根据数据资源的访问请求时刻判断数据资源是否属于常用数据资源;
若是,则将数据资源备份至同一用户对应的全部活跃数据服务器;
若否,则不将该数据资源进行备份。
6.根据权利要求5所述的方法,其特征在于,所述根据数据资源的访问请求时刻判断数据资源是否属于常用数据资源的步骤,包括,
根据数据资源的访问请求时刻获取每个数据资源的若干次访问请求时刻的分布;
对于每个数据资源,
将每次访问请求时刻的分布在时间轴上进行标注,获取每个数据资源的每次访问请求时刻在时间轴上的分布;
获取时间轴上每次访问请求时刻的分布区段;
剔除每次访问请求时刻的分布区段中的异常值得到时间轴上每次访问请求时刻的核心分布区段;
根据时间轴上每次访问请求时刻的核心分布区段获取迄今最近的访问请求时刻以及迄今最远的访问请求时刻;
根据迄今最远的访问请求时刻得到访问请求时刻中值;
若时间轴上迄今最近的访问请求时刻小于或等于访问请求时刻中值则判定时间轴上每次访问请求时刻的分布区段对应的数据资源属于常用数据资源;
若时间轴上迄今最近的访问请求时刻大于访问请求时刻中值则判定时间轴上每次访问请求时刻的分布区段对应的数据资源不属于常用数据资源。
7.根据权利要求6所述的方法,其特征在于,所述剔除每次访问请求时刻的分布区段中的异常值得到时间轴上每次访问请求时刻的核心分布区段的步骤,包括,
获取每次访问请求时刻的分布区段中每个访问请求时刻与时间上相邻的两个访问请求时刻之和;
获取每次访问请求时刻的分布区段中每个访问请求时刻与时间上相邻的两个访问请求时刻之和的均值作为间隔参考值;
将与时间上相邻的两个访问请求时刻之和大于间隔参考值的访问请求时刻作为异常访问请求时刻;
剔除异常访问请求时刻得到正常的访问请求时刻组成的时间轴上每次访问请求时刻的核心分布区段。
8.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条命令、至少一段程序、代码集或指令集,所述至少一条命令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至7任一项所述的跨组织的数据共享的方法。
CN202310426571.0A 2023-04-20 2023-04-20 一种跨组织的数据共享的方法和存储介质 Active CN116170448B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310426571.0A CN116170448B (zh) 2023-04-20 2023-04-20 一种跨组织的数据共享的方法和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310426571.0A CN116170448B (zh) 2023-04-20 2023-04-20 一种跨组织的数据共享的方法和存储介质

Publications (2)

Publication Number Publication Date
CN116170448A CN116170448A (zh) 2023-05-26
CN116170448B true CN116170448B (zh) 2023-07-18

Family

ID=86414903

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310426571.0A Active CN116170448B (zh) 2023-04-20 2023-04-20 一种跨组织的数据共享的方法和存储介质

Country Status (1)

Country Link
CN (1) CN116170448B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112468601A (zh) * 2021-02-03 2021-03-09 柏科数据技术(深圳)股份有限公司 一种分布式存储系统的数据同步方法、访问方法及系统
CN112883119A (zh) * 2021-04-30 2021-06-01 腾讯科技(深圳)有限公司 数据同步方法、装置、计算机设备及计算机可读存储介质
CN113742426A (zh) * 2021-09-08 2021-12-03 深圳市云鼠科技开发有限公司 一种数据同步方法、装置、设备、服务器及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9185078B2 (en) * 2012-12-18 2015-11-10 Salesforce.Com, Inc. Systems, methods, and apparatuses for implementing cross organizational data sharing
CN103905234A (zh) * 2012-12-28 2014-07-02 北京友友天宇系统技术有限公司 提高分布式系统中资源可用性的方法及系统
CN106127064B (zh) * 2016-06-14 2019-02-15 深圳市珍爱捷云信息技术有限公司 用于企业供应链的数据存储方法
CN110198331B (zh) * 2018-03-28 2022-11-25 腾讯科技(上海)有限公司 一种同步数据的方法及系统
CN109033444A (zh) * 2018-08-17 2018-12-18 广东技术师范学院 基于对象存储技术实现跨组织边界数据共享的方法及装置
CN109656571A (zh) * 2018-09-27 2019-04-19 深圳壹账通智能科技有限公司 加载方法、装置、终端及计算机可读存储介质
CN113987443A (zh) * 2021-11-02 2022-01-28 西安邮电大学 一种多云多链协同的电子医疗数据安全共享方法
CN115274034A (zh) * 2022-07-13 2022-11-01 温州大学 一种共享医疗健康档案管理系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112468601A (zh) * 2021-02-03 2021-03-09 柏科数据技术(深圳)股份有限公司 一种分布式存储系统的数据同步方法、访问方法及系统
CN112883119A (zh) * 2021-04-30 2021-06-01 腾讯科技(深圳)有限公司 数据同步方法、装置、计算机设备及计算机可读存储介质
CN113742426A (zh) * 2021-09-08 2021-12-03 深圳市云鼠科技开发有限公司 一种数据同步方法、装置、设备、服务器及存储介质

Also Published As

Publication number Publication date
CN116170448A (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
Shukla et al. An analytical model to minimize the latency in healthcare internet-of-things in fog computing environment
CN108833184A (zh) 服务故障定位方法、装置、计算机设备及存储介质
US20150341238A1 (en) Identifying slow draining devices in a storage area network
US7523454B2 (en) Apparatus and method for routing a transaction to a partitioned server
US10002144B2 (en) Identification of distinguishing compound features extracted from real time data streams
US9882841B2 (en) Validating workload distribution in a storage area network
US7698417B2 (en) Optimized performance counter monitoring
CN102123052A (zh) 业务系统可用性评估方法及系统
CN112148484A (zh) 一种基于耦合度的微服务在线分配方法与系统
Kolomvatsos et al. Proactive & time-optimized data synopsis management at the edge
CN110474799A (zh) 故障定位方法及装置
CN111752706B (zh) 资源配置方法、装置及存储介质
US6968381B2 (en) Method for availability monitoring via a shared database
Glance et al. How well do hospital mortality rates reported in the New York State CABG report card predict subsequent hospital performance?
CN116170448B (zh) 一种跨组织的数据共享的方法和存储介质
CN113518367B (zh) 5g网络切片下基于服务特征的故障诊断方法及系统
US20220051133A1 (en) Decentralized multi-task learning
US8677003B1 (en) Distributed processing of streaming data on an event protocol
Fountas et al. A deep learning model for data synopses management in pervasive computing applications
US20220222752A1 (en) Methods for analyzing insurance data and devices thereof
CN113542027B (zh) 一种基于分布式服务架构的流量隔离方法、装置和系统
CN116107741A (zh) 一种负载均衡调度方法、系统、电子设备及可读存储介质
CN113392280B (zh) 一种面向跨区域的多主模型分布式图计算方法
CN111935289B (zh) 基于区块链的动态监控方法和装置
CN113515524A (zh) 一种分布式缓存接入层节点的自动动态分配方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant