CN103974140A - 一种基于tr069协议的大规模交互电视终端管理方法及系统 - Google Patents

一种基于tr069协议的大规模交互电视终端管理方法及系统 Download PDF

Info

Publication number
CN103974140A
CN103974140A CN201310048732.3A CN201310048732A CN103974140A CN 103974140 A CN103974140 A CN 103974140A CN 201310048732 A CN201310048732 A CN 201310048732A CN 103974140 A CN103974140 A CN 103974140A
Authority
CN
China
Prior art keywords
server
terminal
management
cluster
interactive television
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310048732.3A
Other languages
English (en)
Other versions
CN103974140B (zh
Inventor
李松斌
赵嫚嫚
戴琼兴
邓浩江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN201310048732.3A priority Critical patent/CN103974140B/zh
Publication of CN103974140A publication Critical patent/CN103974140A/zh
Application granted granted Critical
Publication of CN103974140B publication Critical patent/CN103974140B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Computer And Data Communications (AREA)

Abstract

本发明涉及一种基于TR069协议的大规模交互电视终端管理系统,包括管理服务器、ACS服务器集群;其中,所述管理服务器为所述大规模交互电视终端管理系统的入口,所述ACS服务器集群经由该管理服务器与外部的交互电视终端连接;所述管理服务器用于对所述ACS服务器集群中的ACS服务器的规模进行协调管理,为所述交互电视终端分配ACS服务器;所述ACS服务器群用于对所述交互电视终端进行包括配置、诊断、升级在内的管理。本发明使得ACS服务器可以大规模的部署,具有高可靠性、高容错性且可按需扩展等特点。

Description

一种基于TR069协议的大规模交互电视终端管理方法及系统
技术领域
本发明涉及数字电视领域,特别涉及一种基于TR069协议的大规模交互电视终端管理方法及系统。
背景技术
我国广播电视网络经过多年的建设和发展,已经拥有全球最大的用户群和较为完整的各级网络,被引入网络中的交互电视终端设备的数量在不断增加。在目前的网络终端管理中,通常采用SNMP(Simple Network Management Protocol,简单网络管理协议),但随着交互电视终端设备数量的增加,SNMP中所采用的Polling(轮循)机制会导致整个系统的效率降低,且无法保证数据的实时采集,而Trap(陷阱)机制则会浪费大量的带宽资源。因此SNMP协议已经不适合大型的网络终端管理。此外,在终端设备安装后需要进行业务配置或进行故障维护时,现有的做法是维护人员上门调试及维护,这种一对一的方式耗费了大量的人力物力。
TR069协议的全称为“CPE广域网管理协议”。它提供了对下一代网络中家庭网络设备进行管理配置的通用框架和协议,用于从网络侧对家庭网络中的网关、路由器、机顶盒等设备进行远程集中管理。TR069的出现能够解决上文中所提到的效率低、浪费带宽资源、无法保证数据的实时采集以及耗费大量人力物力实现终端设备的调试与维护等问题。在TR069协议所定义的框架中,主要包括两类逻辑设备:受管理的用户终端设备(Customer Premise Equipment,CPE)和自动配置服务器(Auto-Configuration Server,ACS)。受管理的用户终端设备是指在家庭网络环境下,需要从网络侧进行配置和管理的设备,一般都是与运营商业务直接相关的设备,比如家庭网关、机顶盒、IP电话终端等。而所有与用户设备相关的配置、诊断、升级等工作均由统一的自动配置服务器ACS来完成。在TR069协议中,ACS可以对CPE进行安全的自动化配置管理,协议允许ACS和CPE任意一个发起连接请求,不需要维护长期的连接,没有会话请求时就可以断开连接,使得系统所需带宽减少。
我国广播电视网络中的用户数量非常庞大,管理这些交互电视终端需要大量ACS服务器协同运作。此时高效、灵活的组织这些服务器来对大规模的交互电视终端进行管理成为必须要考虑的问题,这就需要使用集群技术对整个系统进行管理。集群管理系统可以将多台ACS服务器组织起来,在网络中表现为单一的系统,该系统可以在服务器出现故障时整个系统仍可以继续工作,为用户提供高可靠性的服务;在集群中进行扩展时,不再需要购买更高性能的服务器,只需根据实际需求,在集群中加入新的服务器即可。在现有技术中尚缺乏具有上述功能的集群管理系统。
发明内容
本发明的目的在于克服现有技术中的缺乏对大规模交互电视终端进行集群管理的系统,从而提供一种大规模交互电视终端管理系统。
为了实现上述目的,本发明提供了一种基于TR069协议的大规模交互电视终端管理系统,包括管理服务器、ACS服务器集群;其中,所述管理服务器为所述大规模交互电视终端管理系统的入口,所述ACS服务器集群经由该管理服务器与外部的交互电视终端连接;所述管理服务器用于对所述ACS服务器集群中的ACS服务器的规模进行协调管理,为所述交互电视终端分配ACS服务器;所述ACS服务器群用于对所述交互电视终端进行包括配置、诊断、升级在内的管理。
上述技术方案中,所述管理服务器用于对所述ACS服务器集群中的ACS服务器的规模进行协调管理包括:了解所述ACS服务器集群中各个ACS服务器之间的关系,对每个ACS服务器采集到的负载参数进行信息汇总并完成负载均衡基本数据的计算;所述管理服务器为所述交互电视终端分配ACS服务器包括:在收到所述交互电视终端发送的请求之后,根据当前计算的负载均衡基本数据实现负载均衡计算,根据计算结果选取合适的ACS服务器,由所选取的ACS服务器对该终端此次存活时的请求进行响应。
上述技术方案中,所述管理服务器采用双机热备的主-备方式。
上述技术方案中,所述ACS服务器集群包括多个ACS服务器,各个ACS服务器之间成环状拓扑结构,该环形拓扑结构将所有的ACS服务器连成首尾相接的环;每台ACS服务器都有一个监测和被监测的对象,分别定义为该服务器Si的前趋节点Si+1和后继节点Si-1,每台ACS服务器节点维护一个双向循环链表,每个节点中包含一个指向其前趋节点的prior指针和一个指向其后继节点的next指针,由所述前趋节点Si+1监测服务器Si的存活状况。
上述技术方案中,在所述ACS服务器集群中,每台ACS服务器都有一台备份服务器,所述备用服务器为一ACS服务器的后继结点或前趋结点。
本发明还提供了一种基于所述的大规模交互电视终端管理系统实现的ACS服务器动态添加方法,包括:
步骤11)、发现新接入的交互电视终端,通过负载均衡计算对当前ACS服务器集群中的各个ACS服务器进行分组,得到忙组、空闲组和中等组,若所述忙组中的成员数量已经达到总成员数量的一阈值,则所述ACS服务器集群需要增加新的成员,执行下一步;其中,所述ACS服务器集群当前具有n台ACS服务器;
步骤12)、管理服务器从候选设备中选出一台Ai,将其插入空闲组中,此时Ai在集群中变为Sn+1,并把它作为服务器S1的备份服务器,Sn+1的next指针指向S1,同时S1的prior指针指向Sn+1;然后将S1的数据拷贝到Sn+1中,由Sn+1来监测Sn的状态,S1监测Sn+1的状态;
步骤13)、将S1原来的备份服务器Sn内的备份数据清除,Sn开始备份向Sn+1发起连接的终端的数据,其他服务器不做改变;
步骤14)、所述管理服务器对拓扑更新的信息进行保存,并将Sn+1的地址分配给新开机的终端;
步骤15)、一个周期后,所述管理服务器再重新进行判断,如果新加入的服务器依然不能满足终端需求,重复步骤12)—步骤14),重新加入新的成员,否则,结束ACS服务器加入的操作。
上述技术方案中,在所述的步骤11)中,所述的负载均衡计算包括:
步骤a)、设定ACS服务器综合值的阈值Lmax、CPU使用率的阈值Cmax、内存占用率的阈值Mmax的大小;
步骤b)、每台ACS服务器每隔一个周期T采集一次服务器当前的CPU使用率、内存占用率、服务器负载量,并上报给所述管理服务器;
步骤c)、所述管理服务器收到各ACS服务器的负载参数后,根据公式计算出各服务器的综合值Li
Li=Wi×(k1×Ci+k2×Mi+k3×Ri),(1≤i≤n)
其中,Wi=I/Ji,I为参考服务器的性能值,Ji为服务器Si的性能值;Ci为服务器Si的CPU使用率,Mi为服务器Si的内存占用率,Ri为服务器Si的服务器负载;k1为CPU使用率的加权值,k2为内存占用率的加权值,k3为服务器负载的加权值;
步骤d)、所述管理服务器将各ACS服务器的综合值与所述阈值Lmax进行比较,小于该阈值就执行步骤e),否则执行步骤f);
步骤e)、所述管理服务器判断各ACS服务器的CPU使用率与内存占用率是否大于设定的阈值Cmax,如果其中一个ACS服务器的参数大于或等于该阈值,就执行步骤f),否则执行步骤g);
步骤f)、设定该ACS服务器的综合负载率Ki=1,执行步骤h);
步骤g)、计算各ACS服务器的综合负载率Ki,并按照分组的规则将各ACS服务器添加到相应的组内,其中Ki=1的服务器在此周期内不能再为其分配其他的终端;其中,
综合负载率Ki的计算公式如下:
Ki=Li/L(1≤i≤n);
L为集群中所有服务器的综合值的总和:
L=∑Li,(1≤i≤n);
所述分组的规则包括:设定Ki值大于等于Kmax的这组为忙组,Ki值小于等于Kmin的这组为空闲组,Ki值介于Kmax和Kmin之间的这组为中等组;所述Kmax和Kmin的取值通过下列方法确定:结合实际系统中ACS服务器的硬件配置,通过多次设定Kmax和Kmin这两个值进行测试,最终保证整个系统能在最短时间内对开机终端进行响应;
步骤h)、选出综合负载率Ki小于或等于Kmin的空闲组服务器,使用轮循法从该组内选取要为当前开机终端进行响应的服务器Si
本发明又提供了一种基于所述的大规模交互电视终端管理系统实现的ACS服务器动态删除方法,包括:
步骤21)、当某一ACS服务器Si发生故障或过于空闲时,所述管理服务器通知服务器Si的前趋节点Si+1和后继节点Si-1:Si即将退出该集群;
步骤22)、Si+1和Si-1收到消息后,由Si-1来做Si+1的备份服务器,Si+1的next指针指向Si-1,Si-1的prior指针指向Si+1,原来Si-1中保存的Si所管理的终端数据仍然保存,同时由Si+1来监测Si-1的状态;
步骤23)、所述管理服务器对拓扑更新的信息进行保存,并将Si-1的地址分配给原来由Si所管理的终端,此时这些终端进行重启,重新连接Si-1的地址来接受管理。
本发明的优点在于:
1、本发明可以解决无法对交互电视进行自动管理且需要上门服务的问题,节约了运营商的成本,保证了工作效率;
2、本发明使得ACS服务器可以大规模的部署,具有高可靠性、高容错性且可按需扩展等特点。
附图说明
图1是本发明的大规模交互电视终端管理系统的整体结构图;
图2是终端注册认证的流程图;
图3是ACS服务器主动获取终端参数的流程图;
图4是在参数发生变化后终端主动向ACS服务器上报的流程图;
图5是ACS服务器对终端的参数配置的流程图;
图6是终端进行软件升级的流程图;
图7是ACS服务器对终端进行故障诊断的流程图。
具体实施方式
现结合附图对本发明作进一步的描述。
图1为本发明的大规模交互电视终端管理系统的整体结构图,如图1所示,该系统包括管理服务器、ACS服务器集群;其中,所述管理服务器为本发明的大规模交互电视终端管理系统的入口,所述ACS服务器集群经由该管理服务器与外部的用户终端设备CPE连接;所述管理服务器用于对系统中的ACS服务器的规模进行协调管理,为交互电视终端分配最适合的ACS服务器;所述ACS服务器群用于对交互电视终端进行包括配置、诊断、升级在内的管理。
下面对该系统中的各个部分做进一步的描述。
管理服务器用于对整个系统内的ACS服务器进行管理,包括:了解所述ACS服务器集群中各个ACS服务器之间的关系,如每个ACS服务器的前趋节点和后继节点分别是哪台服务器;对每个ACS服务器采集到的负载参数进行信息汇总,并完成负载均衡基本数据的计算;在收到交互电视终端发送的请求之后,根据当前计算的负载均衡基本数据实现负载均衡计算,根据计算结果选取合适的ACS服务器,由所选取的ACS服务器对该终端此次存活时的请求进行响应。
作为一种优选实现方式,本实施例中,所述管理服务器采用双机热备的主-备方式,即采用一台已经配置好的主管理服务器对ACS服务器集群进行管理,另一台服务器处于备份状态,两台服务器通过私用网络传递心跳信息,每台服务器都可以监控另一台服务器的状态。当主管理服务器发生故障时,心跳信息会发生变化,该变化通过私用网络被发现后进行双机切换,此时由备份管理服务器接管主管理服务器的工作并进行报警,提醒管理人员对故障进行维护。维护后,可以根据需求自动或手动切换,重新由原来的主管理服务器进行管理;也可以不切换,将维修好的主管理服务器作为备份机。所述管理服务器与用户终端设备CPE之间采用虚拟IP地址映射技术实现相互之间的关联。所述虚拟IP地址映射技术的使用,使得前述的主-备双机切换在终端看来没有变化,无论怎样切换,终端始终通过虚拟地址与管理服务器进行通信。这种方式可以及时有效地了解服务器的真实状态,并保障数据和服务的连续性。在其他实施例中,所述管理服务器也可以只有一台,显而易见,此类方式较本实施例中的管理服务器在稳定性、鲁棒性上有明显降低。
所述ACS服务器集群包括多个ACS服务器,每一ACS服务器采集各自的CPU使用率、内存占用率、服务器负载量等参数并保存。所述ACS服务器集群中的各个ACS服务器之间成环状拓扑结构,该环形拓扑结构将所有的ACS服务器连成首尾相接的环。每台ACS服务器都有一个监测和被监测的对象,分别定义为该服务器Si的前趋节点Si+1和后继节点Si-1,每台ACS服务器节点维护一个双向循环链表,每个节点中包含一个指向其前趋节点的prior指针和一个指向其后继节点的next指针。由前趋节点Si+1发出消息来监测该服务器Si的存活状况,若在一定时间间隔内未收到响应,则认为被监测者Si已经出现故障;同理,由该服务器Si来监测其后继节点Si-1的存活状况。据此,每台ACS服务器还保存有以下信息:本服务器Si的前趋节点Si+1、后继节点Si-1以及Si+1的前趋节点Si+2、Si-1的后继节点Si-2
在该ACS服务器集群中,每台ACS服务器都有一台备份服务器,在本实施例中,一台ACS服务器Si的备份服务器是其后继结点Si-1。备份的数据包括Si的前趋节点Si+1、后继节点Si-1,以及Si+1的前趋节点Si+2、Si-1的后继节点Si-2的信息,及当前与服务器Si进行通信的各交互电视终端上报的信息。当ACS服务器Si出现故障退出集群时,Si-1通过备份的这些信息,可以快速地接管Si的工作,不会出现终端持续等待的现象。在其他实施例中,也可以将一台ACS服务器的前趋结点作为它的备份服务器。
以上是对本发明的大规模交互电视终端管理系统的描述。下面对该系统的工作流程做进一步的说明。
1、ACS服务器的加入
本发明的系统在应用中存在以下情况:某个新开发的小区用户注册并开通了一批新的交互电视终端,在短时间内会出现终端开机数量较多的情况,按照负载均衡算法对当前ACS服务器集群中的各个ACS服务器进行分组(参见下文中负载均衡算法部分),当“忙组”(负载均衡算法将ACS服务器集群中的ACS服务器分为忙组、空闲组和中等组)中的成员数量已经达到总成员数量的n/m时(该阈值根据当前系统中的ACS服务器的数量来设定),系统中的ACS服务器无法及时对终端的请求进行响应,会导致终端等待时间过长,此时需要在ACS服务器集群中增加新成员。
ACS服务器加入过程如下:(假设集群管理系统中有n台服务器,服务器集合为S={Si,i=1,2,3,…)
步骤11)、管理服务器判断是否有需要增加新成员的情况发生,如果有就执行下一步;
步骤12)、管理服务器从候选设备中选出一台Ai,将其插入空闲组中,此时Ai在集群中变为Sn+1,并把它作为服务器S1的备份服务器,Sn+1的next指针指向S1,同时S1的prior指针指向Sn+1;然后将S1的数据拷贝到Sn+1中,由Sn+1来监测Sn的状态,S1监测Sn+1的状态;
步骤13)、将S1原来的备份服务器Sn内的备份数据清除,Sn开始备份向Sn+1发起连接的终端的数据,其他服务器不做改变;
步骤14)、管理服务器对拓扑更新的信息进行保存,并将Sn+1的地址分配给新开机的终端;
步骤15)、一个周期后,管理服务器再重新进行判断,如果新加入的服务器依然不能满足终端需求,重复步骤12)—步骤14),重新加入新的成员,否则,结束ACS服务器加入的操作。
为了便于理解,下面结合实例对上述过程进行说明。
假定系统初始状态仅有两台ACS服务器S1和S2,此时这两台服务器互为备份且互相监测对方的状态。当终端数量增加,这两台ACS服务器的负载都处于饱和状态,根据负载均衡算法,此时这两台服务器的Ki=1(见负载均衡算法部分),管理服务器无法再为开机的终端分配这两台ACS的地址,两台ACS服务器已经不能满足管理需求了。管理服务器会从候选设备中轮循选出一台ACS服务器加入系统,该ACS服务器在系统中的编号为S3。然后指定S3的prior指针指向S1,S3的next指针指向S2,S2的prior指针指向S3,S1的next指针指向S3,并在这三个节点及管理服务器中更新这些信息。同时由S3成为S1的备份服务器,而S2中对S1的备份此时被清除,并开始备份S3中的数据,仍然由S1备份S2的数据。接着,管理服务器将S3的地址分配给没有接收到响应的终端,由S3给这些终端提供管理服务。一个周期之后,管理服务器重新进行判断,如果还有大量终端没分配到地址,就再添加一个新成员到集群中,该服务器在集群中的编号为S4。接着指定S4的prior指针指向S1,S4的next指针指向S3,S3的prior指针指向S4,S1的next指针指向S4,并在这三个节点及管理服务器中更新这些信息。同时由S4成为S1的备份服务器,S3中对S1的备份此时被清除,并开始备份S4中的数据,仍然由S1备份S2的数据、S2备份S3的数据。管理服务器将S4的地址分配给没有分配地址的终端,由S4给这些终端提供管理服务。一个周期之后,管理服务器重新进行判断,如果还有终端没分配到地址,就再添加一个新成员到集群中,依此类推;如果所有终端都分配到了地址,就不再加入新成员,当下一个开机终端进行请求时,管理服务器就运行负载均衡算法,从这些服务器中选取空闲的服务器,将地址分配给终端,由该服务器来响应终端的请求。
2、ACS服务器的退出
ACS服务器集群中成员的退出有以下两种情况,第一种情况是由于设备故障、操作系统故障、软件故障等导致服务器出现宕机的情况。如果不对故障进行处理,该服务器管理的交互电视终端的请求就无法得到响应,对这些终端的管理也就失去了意义。假设服务器Si发生故障,Si+1向其发出的查询其存活状况的消息,在若干个(如三个)连续周期内无法收到其响应,此时Si+1就可以判断出Si已经发生了故障,并向管理服务器上报该情况,由维护人员对其进行维修,维修后作为候选设备在集群负载量大的时候加入集群。
另一种情况是某台服务器Si在连续若干个(如三个)周期内,其服务器综合值Li一直都小于某一阈值(如8%),说明集群中服务器数量足够让所有终端处于管理状态,此时由管理服务器要求该服务器退出集群,作为候选设备在集群负载量大的时候加入集群。
ACS服务器退出过程如下:
步骤21)、管理服务器通知服务器Si的前趋节点Si+1和后继节点Si-1:Si即将退出该集群;
步骤22)、Si+1和Si-1收到消息后,由Si-1来做Si+1的备份服务器,Si+1的next指针指向Si-1,Si-1的prior指针指向Si+1,原来Si-1中保存的Si所管理的终端数据仍然保存,同时由Si+1来监测Si-1的状态;
步骤23)、管理服务器对拓扑更新的信息进行保存,并将Si-1的地址分配给原来由Si所管理的终端,此时这些终端进行重启,重新连接Si-1的地址来接受管理。
3、负载均衡算法
本发明中的负载均衡算法是基于综合负载率的,采用动态与静态负载均衡相结合的方法,即轮循算法与加权最小连接数算法相结合的方法。
假设集群管理系统中有n台服务器,服务器集合为S={Si,i=1,2,3,…,n台服务器具有不同的配置,导致处理能力的不同。在进行负载均衡计算时,首先根据集群中每台服务器的硬件配置估计其性能,选择集群中的一台合适的服务器节点作为参考节点,假设它的性能为I,其权值设为1,则计算其余服务器节点的性能J与权值W。例如,某台服务器Si的性能为Ji,则该服务器的权值就为Wi=I/Ji。可知服务器Si的CPU使用率Ci,内存占用率Mi,服务器负载Ri;设定k1为CPU使用率的加权值,k2为内存占用率的加权值,k3为服务器负载的加权值,则服务器Si的综合值的计算公式为:
Li=Wi×(k1×Ci+k2×Mi+k3×Ri)(1≤i≤n)
集群中所有服务器的综合值的总和为:
L=∑Li,(1≤i≤n)
服务器Si的综合负载率为:
Ki=Li/L(1≤i≤n)
根据各个服务器节点的Ki值将服务器划分成三组,设定Ki值大于等于Kmax的这组为忙组,Ki值小于等于Kmin的这组为空闲组,Ki值介于Kmax和Kmin之间的这组为中等组;其中Kmax和Kmin的取值可通过下列方法确定:结合实际系统中ACS服务器的硬件配置,通过多次设定Kmax和Kmin这两个值进行测试,最终保证整个系统能在最短时间内对开机终端进行响应。
完成对服务器的分组后,在一定时间内开机的交互电视终端,优先分配给空闲的这组,组内的各个成员通过轮循法选出合适的服务器来响应。该方法可以避免频繁采集服务器负载参数,也可以避免一定时间内开机的终端过多时导致的负载不均衡的情况。
负载均衡算法的具体实现步骤如下:
步骤31)、设定ACS服务器综合值的阈值为Lmax,CPU使用率的阈值为Cmax,内存占用率的阈值为Mmax
步骤32)、每台ACS服务器每隔一个周期T采集一次服务器当前的CPU使用率、内存占用率、服务器负载量,上报给管理服务器;
步骤33)、管理服务器收到各ACS服务器的负载参数后,根据公式计算出各服务器的综合值Li
步骤34)、管理服务器将各服务器的综合值与其阈值Lmax进行比较,小于该阈值就执行步骤35),否则执行步骤36);
步骤35)、管理服务器判断各ACS服务器的CPU使用率与内存占用率是否大于设定的阈值Cmax,如果其中一个ACS服务器的参数大于或等于该阈值,就执行步骤36),否则执行步骤37);
步骤36)、设定该ACS服务器的综合负载率Ki=1,执行步骤38);
步骤37)、计算各ACS服务器的综合负载率Ki,并按照分组的规则将各ACS服务器添加到相应的组内,其中Ki=1的服务器在此周期内不能再为其分配其他的终端;
步骤38)、选出综合负载率Ki小于等于Kmin的空闲组服务器,使用轮循法从该组内选取要为当前开机终端进行响应的服务器Si
管理服务器会通过DHCP方式将所选取的为当前开机终端进行响应的服务器Si的地址下发给此次开机的交互电视终端,交互电视终端拿到该地址后,会向该地址的ACS服务器发起连接,在该终端此次开机到关机的整个过程中,都由该服务器对其进行管理。一个周期T之后,ACS服务器集群中的各ACS服务器重新采集负载参数,管理服务器通过计算后对各ACS服务器重新进行分组。
本发明的大规模交互电视终端管理系统能够对大规模的终端进行有序、高效的管理。下面对终端与该管理系统之间的交互过程进行说明。
1、CPE终端的接入流程
终端与ACS服务器进行通信,必须从系统的入口节点即管理服务器处获得ACS服务器的地址,将终端接入本发明的系统的流程如下:
步骤a)、在终端上设置DHCP的方式来请求管理它的ACS服务器的地址;
步骤b)、管理服务器作为DHCP服务器在终端开机时,通过各ACS服务器采集的信息,给各个ACS服务器进行分组,并使用轮循法从空闲组内选择一台ACS服务器Si
步骤c)、管理服务器将Si的地址作为DHCP option配置给终端;
步骤d)、终端接收到Si的地址后,在本次开机到关机的过程中,都与Si进行通信,由Si对该终端进行管理;
步骤e)、该终端下次开机要重新执行上述步骤,获得一个新的ACS地址。
2、ACS服务器对CPE终端的管理流程
CPE终端在得到ACS服务器的地址后与ACS服务器建立通信,ACS服务器对其进自动化管理。所述自动化管理包括以下流程:注册认证、参数监视、参数配置、软件升级及故障诊断,下面对这些管理流程分别加以说明。
(1)注册认证
ACS服务器要对首次接入系统的CPE终端进行注册认证,CPE终端才能接受ACS的管理。CPE终端可以通过发送Inform报文自动连接ACS;ACS也可以在任何时候自动向终端发起连接请求,通过终端的认证之后,可以与终端建立连接。图2是终端注册认证的流程图,参考该图,其注册认证的过程如下:
步骤1)、CPE终端向ACS发起连接,发送带BOOTSTRAP事件的Inform报文;
步骤2)、ACS对终端进行认证,根据终端提供的OUI-SerialNumber查找匹配的帐号和密码及终端用户相应的配置文件,返回InformResponse报文;
步骤3)、终端向ACS发送一个空报文;
步骤4)、ACS向终端发送一个GetParameterValues报文,要求检查终端的帐号/密码;
步骤5)、终端返回一个携带有帐号的GetParameterValuesResponse报文;
步骤6)、ACS根据帐号及OUI-SerialNumber匹配,并根据一定算法自动生成双向的DIGEST认证帐号,并发送SetParameterValues报文,将新的帐号设置到终端上;
步骤7)、终端返回SetParameterValuesResponse报文;
步骤8)、根据帐号及OUI-SerialNumber的判断,ACS发送SetParameterValues的报文,根据查找的结果设置终端新的帐号、密码以及相应的业务配置;
步骤9)、终端回应SetParameterValuesResponse;
步骤10)、ACS发送一个Download的报文,要求终端下载初始化的配置文件;
步骤11)、终端回应DownloadResponse;
步骤12)、终端根据Download报文中提供的URL参数进行配置文件下载;
步骤13)、结束会话,终端重新发起携带TRANSFERCOMPLETE事件的Inform报文;
步骤14)、ACS回应InformResponse;
步骤15)、终端发送TransferComplete的报文,报告下载的起始和结束时间,及成功或失败消息;
步骤16)、ACS回应TransferCompleteResponse结束会话。
(2)参数监视
TR069协议为CPE终端生成有效的监控信息提供支持,ACS可以通过这些信息来监控终端的状态和性能统计。终端也可以将自身状态的更新情况动态通知给ACS。ACS服务器对终端状态的监视主要是通过对状态参数的获取,可以在必要时由ACS主动去获取终端的参数,根据获取到的参数来判断终端目前的情况;或者由终端在参数发生变化的时候,主动向ACS进行上报。
附图3是ACS服务器主动获取终端参数的流程图。此时由ACS向终端发送Connect Request的GET请求让终端发起一个到ACS的连接,获取参数的过程如下:
步骤1)、CPE终端发起连接,发送携带有CONNECTIONREQUEST的Inform报文;
步骤2)、ACS返回InformResponse报文;
步骤3)、终端向ACS发送一个空报文;
步骤4)、ACS向终端发送GetParameterValues的报文,要求获得终端的特定参数;
步骤5)、终端回应GetParameterValuesResponse携带该参数的值,结束会话。
附图4是在参数发生变化后终端主动向ACS服务器上报的流程图。此时由终端向ACS发起连接,参数变化上报的过程如下:
步骤1)、终端发起连接,发送携带有CONNECTIONREQUET的Inform报文;
步骤2)、ACS返回InfrmResponse报文;
步骤3)、终端向ACS发送一个空报文;
步骤4)、ACS向终端发送SetParameterAttributes的报文,设定参数值改变需要上报的参数属性;
步骤5)、终端回应SetParameterAttributesResponse;
步骤6)、ACS回复空报文或结束Session;
步骤7)、当参数值发生改变时,终端自动向ACS发送携带有VALUE CHANGE的Inform报文;
步骤8)、ACS回应InformResponse结束会话。
(3)参数配置
当CPE终端刚刚接入本发明的系统,或是在以后的任何时间,ACS服务器都可以自动下发一些配置参数给CPE终端,完成对终端的自动配置或重新配置。涉及到的配置参数包括规定的参数和用户自定义的参数。在进行参数配置时,ACS为终端新增一实例并配置相关参数,此时由ACS向终端发送Connect Request的GET请求让终端发起一个到ACS的连接。附图5是ACS服务器对终端的参数配置的流程图。参数配置的过程如下:
步骤1)、终端发起连接,发送携带有CONNECTIONREQUST的Inform报文;
步骤2)、ACS返回InformResponse报文;
步骤3)、终端向ACS发送一个空报文;
步骤4)、ACS向终端发送AddObject的报文,为终端生成实例;
步骤5)、终端回应AddObjectResponse;
步骤6)、ACS向终端发送SetParameterValues报文,配置实例或其他参数;
步骤7)、终端回应SetParameterValuesResponse结束会话。
(4)软件升级
管理员将配置文件等重要文件保存在ACS或其他文件服务器上,当ACS发现某个软件或固件的版本有更新时,将会通知CPE终端进行下载,终端会到指定的文件服务器去下载,下载后将结果反馈给ACS。在软件升级的过程中,由ACS向终端发送Connect Request的GET请求让终端发起一个到ACS的连接,附图6是终端进行软件升级的流程图。软件升级的过程如下:
步骤1)、终端发起连接,发送携带有CONNECTIONREQUEST的Inform报文;
步骤2)、ACS返回InformResponse报文;
步骤3)、终端向ACS发送一个空报文;
步骤4)、ACS向终端发送Download报文;
步骤5)、终端响应DownloadResponse,若返回参数中的Status=0,则直接跳至步骤9);
步骤6)、终端到文件服务器下载软件;
步骤7)、若Status=1,且终端在下载并使新软件生效时无需重启,则进入以下流程:
步骤7-1)、终端发送TransferComplete报文,上报下载并应用成功、及升级的详细信息;
步骤7-2)、ACS回应TransferComplete确认,跳至步骤9);
步骤8)、若Status=1,且终端在下载并使新软件生效时需重启,则进入以下流程:
步骤8-1)、终端重启,并发送携带有BOOT和TRANSFERCOMPLET的Inform报文,上报下载并应用成功;
步骤8-2)、ACS响应InformResponse;
步骤8-3)、终端发送TransferComplete报文,上报下载并应用成功及升级的详细信息;
步骤8-4)、ACS回应TransferCompleteResponse确认,跳至步骤9);
步骤9)、结束会话。
(5)故障诊断
TR069协议为终端生成有效的诊断信息提供支持,由ACS先对告警参数进行设置,当超过设定的阈值时由终端进行上报。此时由ACS向终端发送Connect Request的GET请求让终端发起一个到ACS的连接,附图7是ACS服务器对终端进行故障诊断的流程图,其故障诊断的过程如下:
步骤1)、终端发送携带有CONNECTIONREQUST的Inform报文;
步骤2)、ACS返回InformResponse报文;
步骤3)、终端向ACS发送一个空报文;
步骤4)、ACS向终端发送SetParameterValues报文,设置告警参数;
步骤5)、终端回应SetParameterValuesResponse;
步骤6)、结束会话;
步骤7)、当终端监控的参数在相应阈值范围之外时,发送携带有X CT-COMALARM的Inform报文;
步骤8)、ACS回应InformResponse,结束会话。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (8)

1.一种基于TR069协议的大规模交互电视终端管理系统,其特征在于,包括管理服务器、ACS服务器集群;其中,所述管理服务器为所述大规模交互电视终端管理系统的入口,所述ACS服务器集群经由该管理服务器与外部的交互电视终端连接;所述管理服务器用于对所述ACS服务器集群中的ACS服务器的规模进行协调管理,为所述交互电视终端分配ACS服务器;所述ACS服务器群用于对所述交互电视终端进行包括配置、诊断、升级在内的管理。
2.根据权利要求1所述的基于TR069协议的大规模交互电视终端管理系统,其特征在于,所述管理服务器用于对所述ACS服务器集群中的ACS服务器的规模进行协调管理包括:了解所述ACS服务器集群中各个ACS服务器之间的关系,对每个ACS服务器采集到的负载参数进行信息汇总并完成负载均衡基本数据的计算;所述管理服务器为所述交互电视终端分配ACS服务器包括:在收到所述交互电视终端发送的请求之后,根据当前计算的负载均衡基本数据实现负载均衡计算,根据计算结果选取合适的ACS服务器,由所选取的ACS服务器对该终端此次存活时的请求进行响应。
3.根据权利要求2所述的基于TR069协议的大规模交互电视终端管理系统,其特征在于,所述管理服务器采用双机热备的主-备方式。
4.根据权利要求1所述的基于TR069协议的大规模交互电视终端管理系统,其特征在于,所述ACS服务器集群包括多个ACS服务器,各个ACS服务器之间成环状拓扑结构,该环形拓扑结构将所有的ACS服务器连成首尾相接的环;每台ACS服务器都有一个监测和被监测的对象,分别定义为该服务器Si的前趋节点Si+1和后继节点Si-1,每台ACS服务器节点维护一个双向循环链表,每个节点中包含一个指向其前趋节点的prior指针和一个指向其后继节点的next指针,由所述前趋节点Si+1监测服务器Si的存活状况。
5.根据权利要求4所述的基于TR069协议的大规模交互电视终端管理系统,其特征在于,在所述ACS服务器集群中,每台ACS服务器都有一台备份服务器,所述备用服务器为一ACS服务器的后继结点或前趋结点。
6.一种基于权利要求1-5之一所述的大规模交互电视终端管理系统实现的ACS服务器动态添加方法,包括:
步骤11)、发现新接入的交互电视终端,通过负载均衡计算对当前ACS服务器集群中的各个ACS服务器进行分组,得到忙组、空闲组和中等组,若所述忙组中的成员数量已经达到总成员数量的一阈值,则所述ACS服务器集群需要增加新的成员,执行下一步;其中,所述ACS服务器集群当前具有n台ACS服务器;
步骤12)、管理服务器从候选设备中选出一台Ai,将其插入空闲组中,此时Ai在集群中变为Sn+1,并把它作为服务器S1的备份服务器,Sn+1的next指针指向S1,同时S1的prior指针指向Sn+1;然后将S1的数据拷贝到Sn+1中,由Sn+1来监测Sn的状态,S1监测Sn+1的状态;
步骤13)、将S1原来的备份服务器Sn内的备份数据清除,Sn开始备份向Sn+1发起连接的终端的数据,其他服务器不做改变;
步骤14)、所述管理服务器对拓扑更新的信息进行保存,并将Sn+1的地址分配给新开机的终端;
步骤15)、一个周期后,所述管理服务器再重新进行判断,如果新加入的服务器依然不能满足终端需求,重复步骤12)—步骤14),重新加入新的成员,否则,结束ACS服务器加入的操作。
7.根据权利要求6所述的ACS服务器动态添加方法,其特征在于,在所述的步骤11)中,所述的负载均衡计算包括:
步骤a)、设定ACS服务器综合值的阈值Lmax、CPU使用率的阈值Cmax、内存占用率的阈值Mmax的大小;
步骤b)、每台ACS服务器每隔一个周期T采集一次服务器当前的CPU使用率、内存占用率、服务器负载量,并上报给所述管理服务器;
步骤c)、所述管理服务器收到各ACS服务器的负载参数后,根据公式计算出各服务器的综合值Li
Li=Wi×(k1×Ci+k2×Mi+k3×Ri),(1≤i≤n)
其中,Wi=I/Ji,I为参考服务器的性能值,Ji为服务器Si的性能值;Ci为服务器Si的CPU使用率,Mi为服务器Si的内存占用率,Ri为服务器Si的服务器负载;ki为CPU使用率的加权值,k2为内存占用率的加权值,k3为服务器负载的加权值;
步骤d)、所述管理服务器将各ACS服务器的综合值与所述阈值Lmax进行比较,小于该阈值就执行步骤e),否则执行步骤f);
步骤e)、所述管理服务器判断各ACS服务器的CPU使用率与内存占用率是否大于设定的阈值Cmax,如果其中一个ACS服务器的参数大于或等于该阈值,就执行步骤f),否则执行步骤g);
步骤f)、设定该ACS服务器的综合负载率Ki=1,执行步骤h);
步骤g)、计算各ACS服务器的综合负载率Ki,并按照分组的规则将各ACS服务器添加到相应的组内,其中Ki=1的服务器在此周期内不能再为其分配其他的终端;其中,
综合负载率Ki的计算公式如下:
Ki=Li/L,(1≤i≤n);
L为集群中所有服务器的综合值的总和:
L=∑Li,(1≤i≤n);
所述分组的规则包括:设定Ki值大于等于Kmax的这组为忙组,Ki值小于等于Kmin的这组为空闲组,Ki值介于Kmax和Kmin之间的这组为中等组;所述Kmax和Kmin的取值通过下列方法确定:结合实际系统中ACS服务器的硬件配置,通过多次设定Kmax和Kmin这两个值进行测试,最终保证整个系统能在最短时间内对开机终端进行响应;
步骤h)、选出综合负载率Ki小于或等于Kmin的空闲组服务器,使用轮循法从该组内选取要为当前开机终端进行响应的服务器Si
8.一种基于权利要求1-5之一所述的大规模交互电视终端管理系统实现的ACS服务器动态删除方法,包括:
步骤21)、当某一ACS服务器Si发生故障或过于空闲时,所述管理服务器通知服务器Si的前趋节点Si+1和后继节点Si-1:Si即将退出该集群;
步骤22)、Si+1和Si-1收到消息后,由Si-1来做Si+1的备份服务器,Si+1的next指针指向Si-1,Si-1的prior指针指向Si+1,原来Si-1中保存的Si所管理的终端数据仍然保存,同时由Si+1来监测Si-1的状态;
步骤23)、所述管理服务器对拓扑更新的信息进行保存,并将Si-1的地址分配给原来由Si所管理的终端,此时这些终端进行重启,重新连接Si-1的地址来接受管理。
CN201310048732.3A 2013-02-06 2013-02-06 一种基于tr069协议的大规模交互电视终端管理方法及系统 Active CN103974140B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310048732.3A CN103974140B (zh) 2013-02-06 2013-02-06 一种基于tr069协议的大规模交互电视终端管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310048732.3A CN103974140B (zh) 2013-02-06 2013-02-06 一种基于tr069协议的大规模交互电视终端管理方法及系统

Publications (2)

Publication Number Publication Date
CN103974140A true CN103974140A (zh) 2014-08-06
CN103974140B CN103974140B (zh) 2017-05-17

Family

ID=51243095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310048732.3A Active CN103974140B (zh) 2013-02-06 2013-02-06 一种基于tr069协议的大规模交互电视终端管理方法及系统

Country Status (1)

Country Link
CN (1) CN103974140B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105847055A (zh) * 2016-03-25 2016-08-10 乐视控股(北京)有限公司 一种服务器分组管理方法和装置
WO2016155611A1 (zh) * 2015-04-02 2016-10-06 重庆邮电大学 一种面向wia-pa网络的tr069协议管理方法
WO2016197861A1 (zh) * 2015-06-11 2016-12-15 阿里巴巴集团控股有限公司 远程管理方法、被管理设备、管理设备和智能电视系统
CN106452848A (zh) * 2016-09-22 2017-02-22 上海斐讯数据通信技术有限公司 一种瘦接入点远程升级的方法和系统
CN107205030A (zh) * 2017-05-31 2017-09-26 成都博视美达文化传播有限公司 服务器资源调度方法及系统
CN108200218A (zh) * 2018-03-09 2018-06-22 北京奇艺世纪科技有限公司 一种实现负载均衡的方法、装置及电子设备
CN109496420A (zh) * 2018-08-22 2019-03-19 袁振南 环状服务器集群管理方法、装置及计算机存储介质
CN110138584A (zh) * 2019-03-25 2019-08-16 视联动力信息技术股份有限公司 一种监测方法及装置
CN112668882A (zh) * 2020-12-29 2021-04-16 浙江科钛机器人股份有限公司 一种移动机器人集群自主存活检测与分布式协调方法
CN114116237A (zh) * 2022-01-28 2022-03-01 深圳市玩物科技有限公司 一种大规模网络设备的分级自治远程管理方法
CN114338103A (zh) * 2021-12-15 2022-04-12 中电信数智科技有限公司 一种基于tr069协议结合日志分析的异常流量处方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100054266A1 (en) * 2008-09-01 2010-03-04 Alcatel-Lucent Method, device and module for optimising the remote management of home network devices
CN101674322A (zh) * 2008-09-12 2010-03-17 深圳华为通信技术有限公司 终端设备的管理方法、服务器及终端设备
CN101854299A (zh) * 2010-05-21 2010-10-06 中国科学院软件研究所 一种发布/订阅系统的动态负载平衡方法
CN101969468A (zh) * 2010-10-14 2011-02-09 广州从兴电子开发有限公司 查询服务器集群系统及查询方法
CN102014282A (zh) * 2010-10-25 2011-04-13 深圳市融创天下科技发展有限公司 一种分布式视频转码调度方法及系统
CN102893557A (zh) * 2010-03-22 2013-01-23 皇家Kpn公司 用于处理配置请求的系统和方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100054266A1 (en) * 2008-09-01 2010-03-04 Alcatel-Lucent Method, device and module for optimising the remote management of home network devices
CN101674322A (zh) * 2008-09-12 2010-03-17 深圳华为通信技术有限公司 终端设备的管理方法、服务器及终端设备
CN102893557A (zh) * 2010-03-22 2013-01-23 皇家Kpn公司 用于处理配置请求的系统和方法
CN101854299A (zh) * 2010-05-21 2010-10-06 中国科学院软件研究所 一种发布/订阅系统的动态负载平衡方法
CN101969468A (zh) * 2010-10-14 2011-02-09 广州从兴电子开发有限公司 查询服务器集群系统及查询方法
CN102014282A (zh) * 2010-10-25 2011-04-13 深圳市融创天下科技发展有限公司 一种分布式视频转码调度方法及系统

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016155611A1 (zh) * 2015-04-02 2016-10-06 重庆邮电大学 一种面向wia-pa网络的tr069协议管理方法
US9967128B2 (en) 2015-04-02 2018-05-08 Chongqing University Of Posts And Telecommunications TR069 protocol management method oriented to WIA-PA network
WO2016197861A1 (zh) * 2015-06-11 2016-12-15 阿里巴巴集团控股有限公司 远程管理方法、被管理设备、管理设备和智能电视系统
CN106302615A (zh) * 2015-06-11 2017-01-04 阿里巴巴集团控股有限公司 远程管理方法、被管理设备、管理设备和智能电视系统
CN105847055A (zh) * 2016-03-25 2016-08-10 乐视控股(北京)有限公司 一种服务器分组管理方法和装置
WO2017161820A1 (zh) * 2016-03-25 2017-09-28 乐视控股(北京)有限公司 一种服务器分组管理方法、装置和电子设备
CN106452848A (zh) * 2016-09-22 2017-02-22 上海斐讯数据通信技术有限公司 一种瘦接入点远程升级的方法和系统
CN107205030A (zh) * 2017-05-31 2017-09-26 成都博视美达文化传播有限公司 服务器资源调度方法及系统
CN108200218A (zh) * 2018-03-09 2018-06-22 北京奇艺世纪科技有限公司 一种实现负载均衡的方法、装置及电子设备
CN109496420A (zh) * 2018-08-22 2019-03-19 袁振南 环状服务器集群管理方法、装置及计算机存储介质
WO2020037580A1 (zh) * 2018-08-22 2020-02-27 袁振南 环状服务器集群管理方法、装置及计算机存储介质
CN109496420B (zh) * 2018-08-22 2021-02-23 袁振南 环状服务器集群管理方法、装置及计算机存储介质
CN110138584A (zh) * 2019-03-25 2019-08-16 视联动力信息技术股份有限公司 一种监测方法及装置
CN112668882A (zh) * 2020-12-29 2021-04-16 浙江科钛机器人股份有限公司 一种移动机器人集群自主存活检测与分布式协调方法
CN112668882B (zh) * 2020-12-29 2024-04-16 浙江科钛机器人股份有限公司 一种移动机器人集群自主存活检测与分布式协调方法
CN114338103A (zh) * 2021-12-15 2022-04-12 中电信数智科技有限公司 一种基于tr069协议结合日志分析的异常流量处方法及系统
CN114338103B (zh) * 2021-12-15 2024-01-19 中电信数智科技有限公司 一种基于tr069协议结合日志分析的异常流量处方法及系统
CN114116237A (zh) * 2022-01-28 2022-03-01 深圳市玩物科技有限公司 一种大规模网络设备的分级自治远程管理方法
CN114116237B (zh) * 2022-01-28 2022-05-10 深圳市玩物科技有限公司 一种大规模网络设备的分级自治远程管理方法

Also Published As

Publication number Publication date
CN103974140B (zh) 2017-05-17

Similar Documents

Publication Publication Date Title
CN103974140A (zh) 一种基于tr069协议的大规模交互电视终端管理方法及系统
CN105933448B (zh) 一种自管理的微服务架构及其服务方法
Ruiz et al. Manna: A management architecture for wireless sensor networks
CN103236949B (zh) 一种服务器集群的监控方法、装置与系统
Houidi et al. Adaptive virtual network provisioning
CN102739775B (zh) 物联网数据采集服务器集群的监控和管理方法
US9081617B1 (en) Provisioning of virtual machines using an N-ARY tree of clusters of nodes
CN101282237B (zh) 一种基于snmp协议的综合网管系统
CN102447574B (zh) 一种实现irf设备零配置的方法及设备
CN103475722A (zh) 一种业务协同平台实现系统
KR101111155B1 (ko) 통신망 시스템과 통신망 서비스 처리 방법
CN109698757A (zh) 切换主备设备、恢复用户数据的方法、服务器及网络设备
CN101502144A (zh) 无线通信网络中的元件管理系统
CN109002354B (zh) 一种基于OpenStack的计算资源容量弹性伸缩方法及系统
CN100479380C (zh) 网络设备管理方法、网络设备和网络设备管理系统
EP3132567B1 (en) Event processing in a network management system
US20180124168A1 (en) Load balancing server for forwarding prioritized traffic from and to one or more prioritized auto-configuration servers
CN101300779A (zh) 网络配置
WO2012024882A1 (zh) 无线传感器网络网关的备份方法及系统
CN104468633A (zh) 一种sdn南向安全代理产品
CN114338670B (zh) 一种边缘云平台和具有其的网联交通三级云控平台
EP2645625B1 (en) Computer system and subsystem management method
US11824640B2 (en) System and method for reconfiguring a network using network traffic comparisions
KR20140061534A (ko) 확장가능 분산 멀티클러스터 장치 관리 서버 아키텍처 및 그 동작 방법
CN110196721A (zh) 一种互联网数据中心管理方法、系统及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant