CN103283180B - 一种故障检测方法、网关、用户设备及通信系统 - Google Patents

一种故障检测方法、网关、用户设备及通信系统 Download PDF

Info

Publication number
CN103283180B
CN103283180B CN201180035254.1A CN201180035254A CN103283180B CN 103283180 B CN103283180 B CN 103283180B CN 201180035254 A CN201180035254 A CN 201180035254A CN 103283180 B CN103283180 B CN 103283180B
Authority
CN
China
Prior art keywords
gateway
server
fault
service server
dns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180035254.1A
Other languages
English (en)
Other versions
CN103283180A (zh
Inventor
于益俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201510882383.4A priority Critical patent/CN105338563B/zh
Publication of CN103283180A publication Critical patent/CN103283180A/zh
Application granted granted Critical
Publication of CN103283180B publication Critical patent/CN103283180B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2025Failover techniques using centralised failover control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/45Network directories; Name-to-address mapping
    • H04L61/4505Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols
    • H04L61/4511Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols using domain name system [DNS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/02Terminal devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/16Gateway arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供一种故障检测方法,包括发现与UE相关的DNS服务器或业务服务器故障;网关执行到DNS服务器或业务服务器的故障检测;所述故障恢复后,通知UE建立与所述DNS服务器或业务服务器的连接。相应地,本发明实施例还提供一种网关、UE和通信系统,避免了频繁的空口释放与连接,以及频繁的承载去激活与激活,减轻了系统的信令开销,增强了移动网络的稳定性。

Description

一种故障检测方法、网关、用户设备及通信系统
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种故障检测方法、网关、用户设备及通信系统。
背景技术
随着智能终端的普及,涌现出了大量丰富多彩的移动数据业务,支持用户设备(UserEquipment,UE)通过不同制式的移动网络接入到互联网中,例如QQ、Facebook、新浪微博、网页浏览、电子邮件处理等。
由于移动数据网络流量的激增,原本适配传统终端的移动网络不堪重负,网络质量明显下降。而传统的互联网业务服务器,如QQ服务器、Fackbook服务器、为Android设置的google服务器等、DNS服务器等IT设备更是不堪重负,而此类IT设备的健壮性远远不如电信网络设备,因此经常会发生系统拥塞、宕机等故障。当这些设备故障之后,通过移动网络接入的用户设备(如智能终端)会进行不断的尝试,以尽快检测该业务何时恢复,例如不断进行DNS查询尝试、TCP连接尝试等。上述尝试行为的时间间隔一般可达到数十秒,甚至更长,远大于移动网络空口不活动性检测时长(一般为6~8秒)。而按照移动网络的工作机制,当网络发现在移动网络空口不活动性检测时长的连续时间内没有数据传输,会触发网络释放空口连接,将用户设备从连接态(例如ECM_CONNECTED状态)转为空闲态(例如ECM_IDLE状态)。因此上述TCP/DNS等重试行为,会导致UE和移动网络的空口连接不断建立和释放,而每次连接建立都要求UE和移动网络执行相关的连接建立流程,从而产生频繁和大量的连接建立信令(例如ServiceRequest)以及由于相当长时间内空口不活动导致的连接释放信令,因此,一旦互联网业务服务器发生故障,在故障恢复之前,上述用户设备的行为给移动网络带来了严重的信令冲击。
另外,UE在进行一段时间的业务尝试一直无法成功之后,往往会发起承载的去激活处理,并会立即再激活该承载,以检测是否是由于移动网络的问题导致无法使用业务。上述去激活/激活流程之间的时间间隔相对较大,但是由于使用相同互联网业务的用户设备数量往往很大,因此当某一个互联网业务服务器故障,或者公共服务器故障(例如DNS服务器),会导致受到影响的大量的用户设备在短时间内同时进行承载去激活/激活处理,也会给移动网络带来严重的信令冲击。
为此,现有技术引入了一种网络空口连接控制的方法,该方法引入了一种称之为“CELL_PCH”的状态,该状态可以认为是连接态的一种子状态,比正常的连接态省电,且节省空口资源,但是区别于空闲态,即能够保持空口的连接。引入该控制机制之后,当无线网络检测到UE没有数据传输(例如6~8秒)之后,将UE的状态迁移到CELL_PCH状态,而不是空闲态,此时不会释放空口连接以及网络侧连接。当UE处于CELL_PCH状态在一段时间内仍然没有数据传输,则将UE迁移到空闲态,并释放空口连接。如果UE在上述时间内发生了数据传输,则网络将UE再次迁移到连接态的主状态,完成数据传输。
现有技术中,业务服务器或DNS服务器故障后,UE主动发起故障检测,难免会执行频繁空口的连接和释放,或者频繁承载去激活与激活,给移动网络带来巨大的信令冲击。
发明内容
本发明实施例提供一种故障检测方法、网关、用户设备及通信系统,用以解决现有技术中因UE主动发起故障检测而造成频繁空口的连接和释放,或者频繁承载去激活与激活的问题。
一方面,本发明实施例提供一种故障检测方法,包括:
检测与用户设备UE相关的域名系统DNS服务器或业务服务器故障;
网关执行到DNS服务器或业务服务器的故障检测;
所述故障恢复后,通知UE建立与所述DNS服务器或业务服务器的连接。
另一方面,本发明实施例提供一种网关,包括:
故障发现单元,用于发现与用户设备UE相关的域名系统DNS服务器或业务服务器发生故障;
故障检测单元,用于执行到DNS服务器或业务服务器的故障检测;
通知单元,用于在检测到故障恢复后,通知UE建立与所述DNS服务器或业务服务器的连接。
另外,本发明实施例还提供一种用户设备UE,包括:
故障发现单元,用于发现域名系统DNS服务器或业务服务器故障;
接收单元,用于接收网关执行到DNS服务器或业务服务器的故障检测通知;所述故障恢复后,接收所述网关发送的建立与所述DNS服务器或业务服务器的连接的通知;
连接建立单元,建立与所述DNS服务器或业务服务器的连接。
本发明实施例还提供一种通信系统,包括网关和用户设备UE,所述网关,用于发现与UE相关的域名系统DNS服务器或业务服务器发生故障,执行到DNS服务器或业务服务器的故障检测,在检测到故障恢复后,通知UE建立与所述DNS服务器或业务服务器的连接;
所述UE,用于接收网关执行到DNS服务器或业务服务器的故障检测通知;所述故障恢复后,接收所述网关发送的建立与所述DNS服务器或业务服务器的连接的通知,并建立与所述DNS服务器或业务服务器的连接。
通过本发明实施例提供的方法、网关、用户设备及通信系统,由网关设备进行路径检测,避免了频繁的空口释放与连接,以及频繁的承载去激活与激活,减轻了系统的信令开销,增强了移动网络的稳定性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一的方法流程图;
图2为本发明实施例二的方法流程图;
图3为本发明实施例三的方法流程图;
图4为本发明实施例四的方法流程图;
图5为本发明实施例五的方法流程图;
图6为本发明实施例六的方法流程图;
图7为本发明实施例七的方法流程图;
图8为本发明实施例八的方法流程图;
图9为本发明实施例九的方法流程图;
图10为本发明实施例十的网关结构框图;
图11为本发明实施例十一的UE结构框图;
图12为本发明实施例十二的通信系统结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例一:
本发明实施例提供一种故障检测方法,参见图1,包括:
步骤101、发现与UE相关的域名系统(DomainNameSystem,DNS)服务器或业务服务器故障;
这里,可以是UE自身发现DNS服务器或业务服务器故障,也可以是网关发现DNS服务器或业务服务器故障。需要指出的是,本发明实施例中与UE相关的DNS服务器或业务服务器故障可以是服务器自身故障导致,如服务器重启,也可以是负责路由功能的服务器发生故障导致,也可以是连接移动网络和服务器的路径发生故障导致,例如路径链路发生故障或者路径上的路由器发生故障等。
UE可以通过承载更新流程,将需要网关代为进行故障检测的服务器信息通知网关,这里的服务器地址信息可以包括DNS服务器或业务服务器的IP地址和/或端口号,或所述服务器的域名等。这里的承载更新流程可以是UE向服务GPRS支持节点(ServingGPRSSupportNode,SGSN)发送修改PDP上下文请求消息,SGSN向网关GPRS支持节点(GatewayGPRSSupportNode,GGSN)发送更新PDP上下文请求消息;也可以是UE向移动性管理实体(MobilityManagementEntity,MME)发送请求承载资源修改消息,所述MME向服务网关(ServingGateway,S-GW)发送承载资源命令消息,所述S-GW向分组数据网络网关(PacketDataNetworkGateway,P-GW)发送所述承载资源命令消息或代理绑定更新消息,或所述S-GW向策略与计费规则功能(PolicyandChargingRulesFunction,PCRF)发送策略计费控制(PolicyandChargingControl,PCC)更新请求消息,所述PCRF向P-GW发送所述PCC更新请求消息。
当网关检测出DNS服务器或业务服务器故障时,可以通知UE停止DNS查询或者TCP连接尝试。
步骤102、网关执行到DNS服务器或业务服务器的故障检测;
网关可以代替UE执行到DNS服务器或业务服务器的故障检测,具体可以在获取到与UE相关的DNS服务器或业务服务器故障后,向DNS服务器发送DNS探测消息,或者向业务服务器发送路径探测消息,例如发送连接建立请求消息以检测是否能收到响应。
步骤103、所述故障恢复后,通知UE建立与所述DNS服务器或业务服务器的连接。
需要指出的是,UE和网关可以在数据通道建立流程,或建立缺省承载流程,或PDN连接建立流程,或专有承载建立流程中,交互网关代理UE进行故障检测的能力指示,该能力指示可以是由网关设备提供的指示网关支持代理UE进行故障检测的能力,也可以是由UE提供的指示UE支持由网关代理UE进行故障检测的能力。
本发明实施例提供通过由网关设备进行故障检测,避免了频繁的空口释放与连接,以及频繁的承载去激活与激活,减轻了系统的信令开销,增强了移动网络的稳定性。
本发明实施例二:
本实施例中UE自身检测服务器故障,进而通知网关设备进行路径检测,参见图2。
步骤201、UE和网关GGSN/P-GW之间建立用于数据传输的数据通道;
在GPRS网络中,可以通过PDP激活流程建立UE和GGSN之间的PDP(PacketDataProtocol)通道;在EPS网络中,可以通过承载建立流程建立UE和EPS网络中的Bearer承载;
在上述流程中,UE和网关设备GGSN/P-GW之间可以交互对“网关代理UE进行故障检测”特性的支持能力,具体可参考实施例四至九。
步骤202、UE检测到DNS服务器或者业务服务器(例如QQ服务器、Facebook服务器、腾讯微博服务器、新闻网站、邮件服务器等)发生故障;
上述故障可以是由于服务器故障(例如服务器重启)导致,也可以是因为负责路由功能的服务器发生故障导致等,也可以是连接移动网络和服务器的路径发生故障导致,例如路径链路发生故障或者路径上的路由器发生故障等。外在表现是UE无法获取DNS查询响应,或者无法获取TCP连接建立响应等。
当UE检测到上述故障时,可以先执行下述步骤202a、步骤202b,当步骤202a或者202b中无法获取响应消息后,再执行步骤203;也可跳过步骤202a、202b,直接执行步骤203。
步骤202a、UE通过步骤201中建立的数据通道向DNS服务器发送DNS探测消息,例如发送DNS查询请求消息。
步骤202b、UE通过步骤201中建立的数据通道向目标服务器发送连接建立请求消息,例如TCP握手消息、或者HTTP连接建立请求消息等。
上述步骤202a或者步骤202b之间可以独立执行,相关的目的DNS服务器或者业务服务器也可以存在备份服务器,此时当主服务器没有响应之后,UE可以向备份服务器发送相关的探测请求。当上述探测请求均不成功时,执行步骤203。
步骤203、UE向SGSN/MME,并进而向GGSN/P-GW发送更新承载请求消息,指示GGSN/PGW代理UE进行故障检测;
上述更新承载请求消息可以任选数据通道中的一条承载,或者选定一条特定的承载,例如缺省承载(defaultbearer)来执行。
具体可以在上述更新承载请求消息中携带一个“故障检测标识”来进行指示。
此外,该请求消息中还可以携带需要检测的目的服务器如DNS服务器或者业务服务器地址信息,例如IP地址和或端口号,或者上述服务器的域名等信息。上述目的服务器地址信息可以采用单独的信元提供,也可以通过扩展现有的信元来实现,例如扩展分组配置选项(PacketConfigurationOption,PCO)信元。上述目的服务器地址信息也可以包括所述服务器的主备服务器地址信息。
如果上述请求消息中包括了目的服务器地址信息后,则上述的“故障检测标识”也可以不用显示提供,网关可以根据收到的目的服务器地址信息执行后续处理。
分GPRS网络和EPS网络两种情况,承载更新的具体流程如下:
在GPRS网络中,UE向SGSN发送的更新承载请求消息具体为修改PDP上下文请求(ModifyPDPContextRequest)消息;在EPS网络中,UE向MME发送的更新承载请求消息具体为请求承载资源修改(RequestBearerResourceModification)消息。
当SGSN/MME收到上述请求消息后,根据网络的接口情况执行如下处理流程之一:
1)在GPRS网络中,如果该SGSN是Gn/GpSGSN,则该SGSN向GGSN发送更新PDP上下文请求(UpdatePDPContextRequest)消息,即步骤203a1;此时GGSN执行步骤203a2,向SGSN发送更新PDP上下文响应(UpdatePDPContextResponse)消息。
2)在GPRS网络中,如果该SGSN是S4SGSN,或者在EPS网络中,则SGSN/MME向S-GW发送承载资源命令(BearerResourceCommand)消息,即步骤203b1,然后根据S-GW的接口协议情况执行如下处理流程之一:
2-1)当S-GW和P-GW之间采用GTP(GPRSTunnelingProtocol,GPRS隧道协议)协议,则S-GW向P-GW发送承载资源命令消息(BearerResourceCommand),即步骤203b2-a1。此时,P-GW执行步骤203b2-a2,向S-GW发送更新承载请求(UpdateBearerRequest)消息;
2-2)当S-GW和P-GW之间采用PMIP(ProxyMobileIPProtocol,代理移动IP协议)协议时,则S-GW向P-GW发送代理绑定更新(ProxyBindingUpdate)消息,即步骤203b2-b1。此时,P-GW后续执行步骤203b2-b2,向S-GW发送代理绑定确认(ProxyBindingAck)消息;
2-3)当S-GW和P-GW之间采用PMIP协议时,S-GW也可以通过PCRF完成和P-GW的交互,即S-GW执行步骤203b2-c1,向PCRF发送PCC更新请求消息,PCRF执行步骤203b2-c2,向P-GW发送PCC更新请求消息,P-GW执行步骤203b2-c3,向PCRF发送PCC更新确认消息,PCRF执行步骤203b2-c4,向S-GW发送PCC更新确认消息。
上述步骤203a1、203b1、203b2-a1、203b2-b1、203b2-c1、203b2-c2包含上述需要检测的DNS服务器或者业务服务器地址信息,以及“故障检测标识”等信息。
当网关设备GGSN/P-GW收到上述步骤203a1,203b2-a1,203b2-b1,或203b2-c2的消息之后,向UE发送响应消息,即步骤203a2,203b2-a2,203b2-b2,或203b2-c3。上述响应消息中可以指示UE网关接受UE的请求,例如提供接受指示;或者如果网关无法提供检测功能,此时网关可以返回拒绝响应;或者如果网关无法提供对所有目的服务器的查询,则网关可以在响应消息中提供指示,具体可以是返回“可代为检测的服务器信息”或“无法代为检测的服务器信息”等。上述信息可以采用单独的信元提供,也可以通过扩展现有的信元来实现,例如可以放在PCO信元中。
当S-GW收到上述203b2-a2,203b2-b2,或203b2-c4的响应消息之后,执行步骤203b3,向MME发送更新承载请求消息,该消息中包括P-GW提供的上述响应消息。
步骤204、SGSN/MME收到步骤203a2或者步骤203b3的消息后,向UE发送更新承载响应消息;
上述更新承载响应消息可以指示UE上述网关提供的响应信息。
UE收到该响应消息之后,停止步骤202a/202b中进行的DNS或者连接建立检测处理。如果UE仍然收到用户设备上运行的业务软件(例如QQ)发送的向业务服务器的检测请求,则UE可以直接丢弃该请求,而不执行步骤202a/202b。
上述的更新承载响应消息具体可以分为如下几种情况:
1)GPRS网络中,SGSN向UE发送修改PDP上下文接受(ModifyPDPContextAccept)消息;
2)EPS网络中,MME向UE发送UpdateBearerRequest消息。该场景下,UE收到该UpdateBearerRequest消息后,向MME,并进而向S-GW和P-GW发送UpdateBearerResponse消息。
步骤205a、GGSN/P-GW根据UE在步骤203中提供的DNS服务器的地址信息代替UE发起DNS探测流程;
步骤205b、GGSN/P-GW根据UE在步骤203中提供的目的业务服务器地址信息代替UE发起连接建立检测流程;
上述步骤204和步骤205a/205b可以没有先后关系。
步骤206、网关检测到相关一个或者多个目的服务器故障恢复;
例如收到了DNS查询的响应,或者都某个目的服务器的TCP或者HTTP连接建立成功等。
当网关检测到目的服务器故障恢复或路径可达时,可重复执行下述步骤。
网关向UE发送承载更新请求消息,通知UE当前已经路径可达的DNS服务器或者业务服务器信息;
网关可以向所有已经建立了数据通道的UE发送上述承载更新请求消息。为了减少更新承载请求的消息量,网关也可以仅向之前请求过网关代理执行故障检测的UE(例如,在步骤204中记录了相关信息的UE)发送上述承载更新请求消息。具体方法例如,网关根据检测到的已经故障恢复或路径可达的DNS服务器或者业务服务器信息(域名、或者IP地址等),对比记录的信息,向订阅了该故障检测信息的UE发送承载更新请求消息。
该承载更新请求消息中还可以携带除之前根据UE要求代为检测的其他已经检测到故障恢复或路径可达的DNS服务器或者业务服务器地址信息,例如IP地址和/或端口号、域名等信息。上述信息可以采用单独的信元提供,也可以通过扩展现有的信元(如PCO)来实现。上述服务器地址信息可以包括主备服务器的信息。
具体流程包括如下处理:
在GPRS网络中,GGSN向SGSN发送更新PDP上下文请求消息。
在EPS网络中,根据S-GW和P-GW之间的接口协议情况执行如下处理流程之一:
1)若S-GW和P-GW之间采用GTP协议,则P-GW执行步骤207b1-a1,即向S-GW发送更新承载请求消息。
2)若S-GW和P-GW之间采用PMIP协议,则P-GW执行步骤207b1-b1,向PCRF发送PCC更新请求消息,PCRF执行步骤207b1-b2,向S-GW发送PCC更新请求消息,S-GW执行步骤207b1-b3,向PCRF发送PCC更新确认消息,PCRF执行步骤207b1-b4,向P-GW发送PCC更新请求消息。
S-GW收到上述步骤207b1-a1或者步骤207b1-b2的请求消息后,执行步骤207b2,向MME发送更新承载请求消息。
SGSN/MME收到上述步骤207a1或者步骤207b2的请求消息之后,向UE发送承载更新请求消息。上述的承载更新请求消息具体可以分为如下几种情况:
1)GPRS网络中,SGSN向UE发送修改PDP上下文请求(ModifyPDPContextRequest)消息;
2)EPS网络中,MME向UE发送更新承载请求消息。
UE根据步骤207c中收到的故障恢复或路径可达的DNS服务器或者业务服务器信息,恢复相关业务,执行步骤207d,向SGSN/MME发送承载更新响应消息。具体流程为,GPRS网络中,UE向SGSN发送修改PDP上下文响应消息;EPS网络中,UE向MME发送更新承载响应消息。
SGSN/MME收到上述步骤207d消息之后,通知GGSN/P-GW,具体处理如下:
1)在GPRS网络中,如果该SGSN是Gn/GpSGSN,则该SGSN执行步骤207a2,向GGSN发送更新PDP上下文响应(UpdatePDPContextResponse)消息。
2)在GPRS网络中,如果该SGSN是S4SGSN;或者在EPS网络中,所述SGSN/MME执行步骤207b3,向S-GW发送更新承载响应。如果当S-GW和P-GW之间采用GTP协议,则执行步骤207b1-a2,向P-GW发送更新承载响应消息;如果当S-GW和P-GW之间采用PMIP协议,如果步骤207b1-b3没有之前执行,则S-GW执行207b1-b3,以及207b1-b4。
本实施例通过UE自身检测服务器故障,由网关设备GGSN/P-GW进行故障检测,避免了频繁的空口释放与连接,以及频繁的承载去激活与激活,减轻了系统的信令开销,增强了移动网络的稳定性。
本发明实施例三:
与实施例二不同的是,本实施例由网关检测服务器故障,参见图3。
步骤301、UE和网关GGSN/P-GW之间建立用于数据传输的数据通道;
在GPRS网络中,可以通过PDP激活流程建立UE和GGSN之间的PDP(PacketDataProtocol)通道;在EPS网络中,可以通过承载建立流程建立UE和EPS网络中的Bearer承载。
具体地,所述网关检测到的服务器故障可以为DNS服务器或业务服务器故障,参见步骤302a或302b。
步骤302a、和UE相关的DNS服务器发生故障;
外在表现是UE无法获取DNS查询响应。则UE会向该DNS服务器发送频繁的DNS探测消息,例如发送DNS查询请求消息。
步骤302b、和UE相关的业务服务器(例如QQ服务器、Facebook服务器、腾讯微博服务器、新闻网站、邮件服务器等)发生故障;
可以是由于目的服务器故障(例如服务器重启)导致,也可以是因为负责路由功能的服务器发生故障导致,也可以是连接移动网络和服务器的路径发生故障导致,例如路径链路发生故障或者路径上的路由器发生故障等。外在表现是UE无法获取TCP连接建立响应等,则UE会向目标服务器(包括主备服务器)发送连接建立请求消息,例如TCP握手消息、或者HTTP连接建立请求消息等。
步骤303、网关检测到DNS服务器或者业务服务器发生故障;
具体方法,可以是网关通过DPI(DataPacketInspection)或者DFI(DataFlowInspection)等机制检测出UE在频繁的进行DNS查询或者TCP连接尝试,但是始终收不到响应;或者网关通过自身的路径探测,检测出DNS服务器故障或者业务服务器故障等。
此时,网关可以发起到相关DNS服务器或者业务服务器的路径检测,即执行下述步骤303a、步骤303b。网关执行到DNS服务器或业务服务器的故障检测之前,或者同时,或者之后,可以通知UE停止DNS查询或者TCP连接尝试。
步骤303a、GGSN/P-GW向故障的DNS服务器发起DNS检测流程;
步骤303b、GGSN/P-GW向故障的目的业务服务器发起连接建立检测流程;
网关可以向UE发送承载更新请求消息,通知UE网关当前代为执行故障探测的DNS服务器或者业务服务器信息。
网关可以向所有已经建立了数据通道的UE发送上述承载更新请求消息;也可以为了减少更新承载请求的消息量,网关仅向当前正在进行故障检测的UE发送上述承载更新请求消息。
该承载更新请求消息中还可以包含网关代为进行故障检测的DNS服务器或者业务服务器地址信息,例如IP地址和/或端口号、所述服务器的域名等信息。上述服务器地址信息可以采用单独的信元提供,也可以通过扩展现有的信元来实现,例如可以放在分组配置选项(PacketConfigurationOption,PCO)信元中。上述服务器地址信息可以包括所述主备服务器的信息。
具体流程可以包括:
在GPRS网络中,GGSN执行步骤304a1,向SGSN发送更新PDP上下文请求消息。
在EPS网络中,根据S-GW和P-GW之间的接口协议情况执行如下处理流程之一:
1)当S-GW和P-GW之间采用GTP协议,则P-GW执行步骤304b1-a1,即向S-GW发送更新承载请求消息。
2)当S-GW和P-GW之间采用PMIP协议时,则P-GW执行步骤304b1-b1,向PCRF发送PCC更新请求消息,PCRF执行步骤304b1-b2,向S-GW发送PCC更新请求消息,S-GW执行步骤304b1-b3,向PCRF发送PCC更新确认消息,PCRF执行步骤304b1-b4,向P-GW发送PCC更新请求消息。
S-GW收到上述步骤304b1-a1或者步骤304b1-b2的请求消息后,执行步骤304b2,向MME发送更新承载请求消息。
SGSN/MME收到上述步骤304a1或者步骤304b2的请求消息之后,执行步骤304c,向UE发送承载更新请求消息。上述的承载更新请求消息具体可以分为如下几种情况:
1)GPRS网络中,SGSN向UE发送修改PDP上下文请求消息;
2)EPS网络中,MME向UE发送更新承载请求消息。
UE根据步骤304c中收到的网关代为进行故障检测的DNS服务器或者业务服务器信息,如果UE正在进行到相同目的地址的故障检测(如进行路径探测),则UE停止上述检测流程(步骤302a、步骤302b),执行步骤304d,向网关发送承载更新响应消息。
如果UE正在进行的故障检测处理的DNS服务器或者业务服务器没有包括在上述承载更新请求消息中包含的网关代为进行故障检测的DNS服务器或者业务服务器信息中,则UE在上述向网关发送的承载更新响应消息中包括上述网关没有提供的DNS服务器或者业务服务器信息,例如IP地址和/或端口号、域名等。此时当网关收到上述信息时,代替UE发起到新的DNS服务器或者业务服务器的故障检测。
具体流程为,GPRS网络中,UE向SGSN发送ModifyPDPContextAccept消息;EPS网络中,UE向MME发送UpdateBearerResponse消息。
SGSN/MME收到上述步骤304d消息之后,通知GGSN/P-GW,具体处理如下:
1)在GPRS网络中,如果该SGSN是Gn/GpSGSN,则该SGSN执行步骤304a2,向GGSN发送更新PDP上下文响应消息。
2)在GPRS网络中,如果该SGSN是S4SGSN;或者在EPS网络中,所述SGSN/MME执行步骤304b3,向S-GW发送更新承载响应。当S-GW和P-GW之间采用GTP协议时,则执行步骤304b1-a2,向P-GW发送更新承载响应消息;当S-GW和P-GW之间采用PMIP协议时,如果步骤304b1-b3没有之前执行,则S-GW执行304b1-b3,以及304b1-b4。
需要说明的是,每当检测到新的DNS服务器或者业务服务器故障时,网关可以再次执行上述步骤通知UE。
GGSN/P-GW检测到DNS服务器或者业务服务器故障恢复(步骤305),306a1,306b1-a1,306b1-b1,306b1-b2,306b1-b3,306b1-b4,306b2,306c,306d,306a2,306b3,306b1-a2与207a1,207b1-a1,207b1-b1,207b1-b2,207b1-b3,207b1-b4,207b2,207c,207d,207a2,207b3,207b1-a2分别相同,在此不再赘述。
本实施例通过网关设备发现服务器故障,由网关设备代替UE进行目的服务器故障检测,避免了频繁的空口释放与连接,以及频繁的承载去激活与激活,减轻了系统的信令开销,增强了移动网络的稳定性。
下面分几个实施例具体介绍UE和网关之间交互网关进行故障检测能力的指示。下面实施例中的“网关代理UE进行故障检测”指示可以采用单独的信元提供,也可以通过扩展现有的信元来实现,例如可以放在PCO信元中,下不赘述。UE在所述数据通道建立流程,或建立缺省承载流程,或PDN连接建立流程,或专有承载建立流程中,向网关提供UE支持网关代理UE进行服务器故障检测的能力指示;和/或,网关在所述数据通道建立流程,或建立缺省承载流程,或PDN连接建立流程,或专有承载建立流程中,向UE提供网关支持网关代理UE进行服务器故障检测的能力指示。
本发明实施例四:
本实施例介绍GPRS网络中UE发起的数据通道建立场景下,UE和网关进行故障检测能力交互的具体方案。
步骤401、UE向SGSN发送激活PDP上下文请求消息。如果UE支持网关代理进行DNS服务器或者业务服务器故障检测功能,则UE在上述请求消息中包括该“网关代理UE进行故障检测”指示。上述的激活PDP上下文请求消息具体可以分为如下几种情况:
1)激活PDP上下文请求消息(ActivatePDPContextRequest),或者;
2)激活二次PDP上下文请求消息(ActivateSecondaryPDPContextRequest)。
步骤402、SGSN向GGSN/P-GW发送建立PDP上下文请求消息,如果UE在步骤401中提供了“网关代理UE进行故障检测”指示,则SGSN将该指示包括在上述发送给GGSN/P-GW的请求消息中。上述的建立PDP上下文请求消息具体可以分为如下几种情况:
1)如果该SGSN为Gn/GpSGSN,则该SGSN向GGSN发送建立PDP上下文请求消息;
2)如果该SGSN为S4SGSN,则改SGSN向S-GW发送建立会话请求消息。当S-GW和P-GW之间采用GTP协议,则S-GW向P-GW发送建立会话请求消息;当S-GW和P-GW之间采用PMIP协议时,则S-GW向P-GW发送代理绑定更新(ProxyBindingUpdate)消息。
步骤403、GGSN/P-GW建立相应的PDP上下文,记录UE“网关代理UE进行故障检测”指示,向SGSN发送建立PDP上下文响应消息。如果GGSN/P-GW支持网关代理进行DNS服务器或者业务服务器故障检测功能,则GGSN/P-GW在上述响应消息中包括该“网关代理UE进行故障检测”指示。
上述的建立PDP上下文响应消息具体可以分为如下几种情况:
1)如果该SGSN为Gn/GpSGSN,则该GGSN向SGSN发送建立PDP上下文响应消息;
2)如果该SGSN为S4SGSN,当S-GW和P-GW之间采用GTP协议,则该P-GW向S-GW发送建立会话响应消息;当S-GW和P-GW之间采用PMIP协议时,则上述P-GW向S-GW发送的消息具体为代理绑定确认(ProxyBindingAck)消息。S-GW向SGSN发送建立会话响应消息。
步骤404、SGSN向UE发送激活PDP上下文接受消息。如果GGSN/P-GW在步骤403中提供了“网关代理UE进行故障检测”指示,则SGSN将该指示包括在上述发送给UE的接受消息中。相应地,上述的激活PDP上下文接受消息具体可以分为如下两种情况:
1)激活PDP上下文接受消息(ActivatePDPContextAccept),或者;
2)激活二次PDP上下文接受消息(ActivateSecondaryPDPContextAccept)。
本发明实施例通过在UE发起的数据通道建立流程中,UE和网关交互网关代理UE进行故障检测指示,以便于后续当DNS服务器或业务服务器发生故障时,网关代理UE进行故障检测。
本发明实施例五:
本实施例介绍GPRS网络中网络侧发起的数据通道建立场景下,UE和网关进行故障检测能力交互的具体方案。
步骤501、GGSN向SGSN发送分组数据单元通知请求(PDUNotificationRequest)消息。如果GGSN支持网关代理进行DNS服务器或者业务服务器故障检测功能,则GGSN在上述请求消息中包括该“网关代理UE进行故障检测”指示。
步骤502、SGSN向GGSN发送分组数据单元通知响应(PDUNotificationResponse)消息。
步骤503、SGSN向UE发送请求PDP上下文激活(RequestPDPContextActivation)消息。如果GGSN在步骤501中提供了“网关代理UE进行故障检测”指示,则SGSN将该指示包括在上述发送给UE的请求消息中。
步骤504~步骤507与实施例四中的步骤401~步骤404中UE发起PDP激活的处理相同(不包括PDP二次激活的处理),此处不再赘述。
需要补充说明的是,本实施例中步骤4~步骤7中的具体消息处理不包括SGSN是S4SGSN的场景,仅包括SGSN是Gn/GpSGSN的处理。
本发明实施例通过在网络侧发起的数据通道建立流程中,UE和网关交互网关代理UE进行故障检测指示,以便于后续当DNS服务器或业务服务器发生故障时,网关代理UE进行故障检测。
本发明实施例六:
本实施例介绍EPS网络中UE发起Attach流程建立缺省承载的场景下,UE和网关进行故障检测能力交互的具体方案。
步骤601、UE向MME发送附着请求消息。如果UE支持网关代理进行DNS服务器或者业务服务器故障检测功能。则UE在上述请求消息中包括该“网关代理UE进行故障检测”指示。上述指示也可以不在步骤601中提供,而在步骤603中提供。
步骤602、MME向UE发送加密选项请求(CipheredOptionsRequest)消息。
步骤603、UE向MME发送加密选项响应消息(CipheredOptionsResponse)。如果UE支持网关代理进行DNS服务器或者业务服务器故障检测功能,且UE没有在步骤601中提供给MME,则UE在上述响应消息中包括该“网关代理UE进行故障检测”指示。UE执行Attach流程的其他处理,例如完成和HLR/HSS的交互,建立UE的上下文等,执行下述步骤。
步骤604、MME向S-GW发送建立会话请求消息。
当S-GW和P-GW之间采用GTP协议时,则S-GW向P-GW发送建立会话请求消息;当S-GW和P-GW之间采用PMIP协议时,则S-GW向P-GW发送代理绑定更新消息。
如果UE在步骤601或者步骤603中提供了“网关代理UE进行故障检测”指示,则MME将该指示包括在上述发送给S-GW/P-GW的请求消息中。
步骤605、P-GW建立相应的会话上下文,记录UE“网关代理UE进行故障检测”指示,向S-GW发送建立会话响应消息。
相应地,当S-GW和P-GW之间采用GTP协议,则上述P-GW向S-GW发送的消息具体为建立会话响应消息;当S-GW和P-GW之间采用PMIP协议时,则上述P-GW向S-GW发送消息具体为代理绑定确认消息。
S-GW向MME发送建立会话响应消息(CreateSessionResponse)。
如果P-GW支持网关代理进行DNS服务器或者业务服务器故障检测功能,则P-GW在上述响应消息中包括该“网关代理UE进行故障检测”指示。
步骤606、MME向UE发送附着接受消息。如果P-GW在步骤5中提供了“网关代理UE进行故障检测”指示,则MME将该指示包括在上述发送给UE的接受消息中。
本发明实施例通过UE发起Attach流程建立缺省承载过程中,UE和网关交互网关代理UE进行故障检测指示,以便于后续当DNS服务器或业务服务器发生故障时,网关代理UE进行故障检测。
本发明实施例七:
本实施例介绍EPS网络中UE请求PDN连接的场景下,UE和网关进行故障检测能力交互的具体方案。
步骤701、UE向MME发送PDN连接建立请求消息;
如果UE支持网关代理进行DNS服务器或者业务服务器故障检测功能,则UE在上述请求消息中包括该“网关代理UE进行故障检测”指示。
步骤702、MME向S-GW发送建立会话请求消息;
当S-GW和P-GW之间采用GTP协议时,则S-GW向P-GW发送建立会话请求消息;当S-GW和P-GW之间采用PMIP协议时,则S-GW向P-GW发送代理绑定更新消息。
如果UE在步骤701中提供了“网关代理UE进行故障检测”指示,则MME将该指示包括在上述发送给S-GW/P-GW的请求消息中。
步骤703、P-GW建立相应的会话上下文,记录UE“网关代理UE进行故障检测”指示,向S-GW发送建立会话响应消息;
相应地,当S-GW和P-GW之间采用GTP协议,则上述P-GW向S-GW发送的消息具体为建立会话响应消息;当S-GW和P-GW之间采用PMIP协议时,则上述P-GW向S-GW发送的消息具体为代理绑定确认消息。
S-GW向MME发送建立会话响应消息。
如果P-GW支持网关代理进行DNS服务器或者业务服务器故障检测功能,则P-GW在上述响应消息中包括该“网关代理UE进行故障检测”指示。
步骤704、MME向UE发送PDN连接接受消息(PDNConnectivityAccept)。如果P-GW在步骤703中提供了“网关代理UE进行故障检测”指示,则MME将该指示包括在上述发送给UE的接受消息中。
本发明实施例通过UE请求PDN连接过程中,UE和网关交互网关代理UE进行故障检测指示,以便于后续当DNS服务器或业务服务器发生故障时,网关代理UE进行故障检测。
本发明实施例八:
本实施例介绍EPS网络中基于GTP协议的专有承载建立流程的场景下,UE和网关进行故障检测能力交互的具体方案。
步骤801、P-GW向S-GW,并进而向MME发送建立承载请求消息,如果P-GW支持网关代理进行DNS服务器或者业务服务器故障检测功能,则P-GW在上述请求消息中包括该“网关代理UE进行故障检测”指示。
步骤802、MME向UE发送会话管理请求消息。如果P-GW在步骤801中提供了“网关代理UE进行故障检测”指示,则MME将该指示包括在上述发送给UE的请求消息中。
步骤803、UE记录P-GW“网关代理UE进行故障检测”指示,向MME发送会话管理响应消息。如果UE支持网关代理进行DNS服务器或者业务服务器故障检测功能,则UE在上述响应消息中包括该“网关代理UE进行故障检测”指示。
步骤804、MME向S-GW,并进而向P-GW发送建立承载响应消息。如果UE在步骤803中提供了“网关代理UE进行故障检测”指示,则MME将该指示包括在上述发送给P-GW的响应消息中。
本发明实施例通过基于GTP协议的专有承载建立流程中,UE和网关交互网关代理UE进行故障检测指示,以便于后续当DNS服务器或业务服务器发生故障时,网关代理UE进行故障检测。
本发明实施例九:
本实施例介绍EPS网络中基于PMIP协议的专有承载建立流程的场景下,UE和网关进行故障检测能力交互的具体方案。
P-GW执行步骤901a,向PCRF发送PCC更新请求,PCRF执行步骤901b向S-GW发送PCC更新请求,S-GW执行步骤901c向PCRF发送PCC更新确认消息,PCRF执行步骤901d向P-GW发送PCC更新确认。
如果P-GW支持网关代理进行DNS服务器或者业务服务器故障检测功能,则P-GW在上述步骤901a、步骤901b消息中包括该“网关代理UE进行故障检测”指示,发送给S-GW。
步骤902、S-GW向MME发送建立承载请求消息。如果P-GW在步骤1中提供了“网关代理UE进行故障检测”指示,则S-GW将该指示包括在上述发送给MME的请求消息中。
步骤903、MME向UE发送会话管理请求消息。如果P-GW在步骤901a或901b中提供了“网关代理UE进行故障检测”指示,则MME将该指示包括在上述发送给UE的请求消息中。
步骤904、UE记录P-GW“网关代理UE进行故障检测”指示,向MME发送会话管理响应消息。如果UE支持网关代理进行DNS服务器或者业务服务器故障检测功能,则UE在上述响应消息中包括该“网关代理UE进行故障检测”指示。
步骤905、MME向S-GW发送建立承载响应消息(CreateBearerResponse)。如果UE在步骤904中提供了“网关代理UE进行故障检测”指示,则MME将该指示包括在上述发送给P-GW的响应消息中。
S-GW执行步骤906a,向PCRF发送PCC更新请求消息,PCRF执行步骤906b,向P-GW发送PCC更新请求消息,P-GW执行步骤906c,向PCRF发送PCC更新确认,PCRF执行步骤906d,向S-GW发送PCC更新确认。如果S-GW在步骤905中提供了“网关代理UE进行故障检测”指示,则S-GW将该指示包括在上述步骤906a、步骤906b的消息中。
本发明实施例通过基于PMIP协议的专有承载建立流程中,UE和网关交互网关代理UE进行故障检测指示,以便于后续当DNS服务器或业务服务器发生故障时,网关代理UE进行故障检测。
本发明实施例十:
本实施例提供一种网关设备,参见图10,包括:
故障发现单元1001,用于发现与UE相关的DNS服务器或业务服务器故障;
故障检测单元1002,用于执行到DNS服务器或业务服务器的故障检测;
通知单元1003,用于检测到故障恢复后,通知UE建立与所述DNS服务器或业务服务器的连接。
这里,故障发现单元1001通过数据包检测DPI或者数据流检测DFI机制检测到UE进行DNS查询或者TCP连接尝试,且所述UE收不到响应。或者,收到UE进行故障检测的请求。
故障检测单元1002执行到DNS服务器或业务服务器的故障检测,可以具体为:向DNS服务器发送DNS探测消息,或者向业务服务器发送连接建立请求消息等。
本发明实施例中的网关可以为GGSN或P-GW。
本发明实施例的网关设备,代理UE执行故障检测,可以避免频繁的空口释放与连接,以及频繁的承载去激活与激活,减轻系统的信令开销,增强移动网络的稳定性。
本发明实施例十一:
本实施例提供一种UE,参见图11,包括:
故障发现单元1101,用于发现DNS服务器或业务服务器故障;
接收单元1102,用于接收网关执行到DNS服务器或业务服务器的故障检测的通知;所述故障恢复后,接收所述网关发送的建立与所述DNS服务器或业务服务器的连接的通知;
连接建立单元1103,用于建立与所述DNS服务器或业务服务器的连接。
这里,UE可以进一步包括发送单元1104,用于通过承载更新流程将需要网关执行故障检测的服务器地址信息发送给网关。这里的承载更新流程可以是UE向SGSN发送修改PDP上下文请求消息,SGSN向GGSN发送更新PDP上下文请求消息;也可以是UE向MME发送请求承载资源修改消息,所述MME向S-GW发送承载资源命令消息,所述S-GW向P-GW发送所述承载资源命令消息或代理绑定更新消息,或所述S-GW向PCRF发送PCC更新请求消息,所述PCRF向P-GW发送所述PCC更新请求消息。
本发明实施例提供的UE,通过UE发现DNS服务器或业务服务器故障,并由网关执行故障检测,可以避免频繁的空口释放与连接,以及频繁的承载去激活与激活,减轻系统的信令开销,增强移动网络的稳定性。
本发明实施例十二:
本实施例提供一种通信系统,参见图12,包括:
网关1201,用于发现与UE相关的DNS服务器或业务服务器发生故障,执行到DNS服务器或业务服务器的故障检测,在检测到故障恢复后,通知UE建立与所述DNS服务器或业务服务器的连接;
UE1202,用于接收网关1201执行到DNS服务器或业务服务器的故障检测通知;所述故障恢复后,接收所述网关1201发送的建立与所述DNS服务器或业务服务器的连接的通知,并建立与所述DNS服务器或业务服务器的连接。
这里的网关1201可以为GGSN或P-GW。
本发明实施例的通信系统,由网关代理UE进行故障检测,可以避免频繁的空口释放与连接,以及频繁的承载去激活与激活,减轻系统的信令开销,增强移动网络的稳定性
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,简称ROM)、随机存取存储器(RandomAccessMemory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (18)

1.一种故障检测方法,其特征在于,包括:
发现与用户设备UE相关的域名系统DNS服务器或业务服务器故障;
接收UE通过承载更新流程发送的需要网关执行故障检测的服务器地址信息;
网关执行到DNS服务器或业务服务器的故障检测;
所述故障恢复后,通知UE建立与所述DNS服务器或业务服务器的连接。
2.根据权利要求1所述的方法,其特征在于,所述发现与UE相关的DNS服务器或业务服务器故障,包括:
UE无法获取DNS服务器或者业务服务器的响应。
3.根据权利要求1所述的方法,其特征在于,所述承载更新流程包括:
UE向服务GPRS支持节点SGSN发送修改分组数据协议PDP上下文请求消息;
SGSN向网关GPRS支持节点GGSN发送更新PDP上下文请求消息。
4.根据权利要求1所述的方法,其特征在于,所述承载更新流程包括:
UE向移动性管理实体MME发送请求承载资源修改消息;
所述MME向服务网关S-GW发送承载资源命令消息;
所述S-GW向分组数据网络网关P-GW发送所述承载资源命令消息或代理绑定更新消息,或所述S-GW向PCRF发送PCC更新请求消息,所述PCRF向P-GW发送所述策略控制计费PCC更新请求消息。
5.根据权利要求1所述的方法,其特征在于,所述发现与UE相关的DNS服务器或业务服务器故障,包括:
网关通过数据包检测DPI或者数据流检测DFI机制检测UE进行DNS查询或者TCP连接尝试,且所述UE收不到响应。
6.根据权利要求1或5所述的方法,其特征在于,所述网关执行到DNS服务器或业务服务器的故障检测包括:
所述网关通知UE停止DNS查询或者TCP连接尝试。
7.根据权利要求6所述的方法,其特征在于,所述网关通知UE停止DNS查询或者TCP连接尝试,包括:
网关向UE发送网关代理UE执行故障检测的指示,和/或网关代理UE执行故障检测的服务器地址信息。
8.根据权利要求1所述的方法,其特征在于,所述网关执行到DNS服务器或业务服务器的故障检测,包括:
网关向DNS服务器发送DNS探测消息,或者向应用服务器发送连接建立请求消息。
9.根据权利要求1所述的方法,其特征在于,所述故障恢复后,通知UE建立与所述DNS服务器或业务服务器的连接,包括:
网关将已经恢复故障的DNS服务器或业务服务器地址信息发送给UE;
所述UE建立与所述已经恢复故障的DNS服务器或业务服务器的连接。
10.根据权利要求1至5、8、9中任一项所述的方法,其特征在于,所述服务器地址信息,包括:
所述服务器的IP地址和/或端口号;
或者,所述服务器的域名信息。
11.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:
在数据通道建立流程,或建立缺省承载流程,或PDN连接建立流程,或专有承载建立流程中,UE和网关交互网关代理UE进行故障检测的能力指示。
12.根据权利要求11所述的方法,其特征在于,所述UE和网关交互网关代理UE进行故障检测的能力指示,包括:
UE向网关提供支持网关代理UE进行服务器故障检测的能力指示;
和/或,网关向UE提供支持网关代理UE进行服务器故障检测的能力指示。
13.一种网关,其特征在于,包括:
故障发现单元,用于发现与用户设备UE相关的域名系统DNS服务器或业务服务器发生故障;
故障检测单元,用于执行到DNS服务器或业务服务器的故障检测;
通知单元,用于在检测到故障恢复后,通知UE建立与所述DNS服务器或业务服务器的连接;
其中,在所述故障检测单元执行到DNS服务器或业务服务器的故障检测之前,所述网关用于接收UE通过承载更新流程发送的需要网关执行故障检测的服务器地址信息。
14.根据权利要求13所述的网关,其特征在于,所述故障发现单元发现与UE相关的DNS服务器或业务服务器发生故障,包括:
通过数据包检测DPI或者数据流检测DFI机制检测UE进行DNS查询或者TCP连接尝试,且所述UE收不到响应;
或者,收到UE进行故障检测的请求。
15.根据权利要求13所述的网关,其特征在于,所述故障检测单元执行到DNS服务器或业务服务器的故障检测,包括:
向DNS服务器发送DNS探测消息,或者向业务服务器发送连接建立请求消息。
16.根据权利要求13所述的网关,其特征在于,所述网关为GGSN或P-GW。
17.一种用户设备UE,其特征在于,包括:
故障发现单元,用于发现域名系统DNS服务器或业务服务器故障;
发送单元,用于通过承载更新流程将需要网关执行故障检测的服务器地址信息发送给网关;
接收单元,用于接收网关执行到DNS服务器或业务服务器的故障检测的通知;所述故障恢复后,接收所述网关发送的建立与所述DNS服务器或业务服务器的连接的通知;
连接建立单元,建立与所述DNS服务器或业务服务器的连接。
18.一种通信系统,包括网关和用户设备UE,其特征在于,所述网关,用于发现与UE相关的域名系统DNS服务器或业务服务器发生故障,接收UE通过承载更新流程发送的需要网关执行故障检测的服务器地址信息,执行到DNS服务器或业务服务器的故障检测,在检测到故障恢复后,通知UE建立与所述DNS服务器或业务服务器的连接;
所述UE,用于接收网关执行到DNS服务器或业务服务器的故障检测;所述故障恢复后,接收所述网关发送的建立与所述DNS服务器或业务服务器的连接的通知,并建立与所述DNS服务器或业务服务器的连接。
CN201180035254.1A 2011-12-02 2011-12-02 一种故障检测方法、网关、用户设备及通信系统 Active CN103283180B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510882383.4A CN105338563B (zh) 2011-12-02 2011-12-02 一种故障检测方法、网关、用户设备及通信系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/083348 WO2013078671A1 (zh) 2011-12-02 2011-12-02 一种故障检测方法、网关、用户设备及通信系统

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201510882383.4A Division CN105338563B (zh) 2011-12-02 2011-12-02 一种故障检测方法、网关、用户设备及通信系统

Publications (2)

Publication Number Publication Date
CN103283180A CN103283180A (zh) 2013-09-04
CN103283180B true CN103283180B (zh) 2015-12-02

Family

ID=48534647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180035254.1A Active CN103283180B (zh) 2011-12-02 2011-12-02 一种故障检测方法、网关、用户设备及通信系统

Country Status (4)

Country Link
US (3) US9405638B2 (zh)
EP (1) EP2775661B1 (zh)
CN (1) CN103283180B (zh)
WO (1) WO2013078671A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10284419B2 (en) 2017-06-06 2019-05-07 Mediatek Inc. User equipment and data connection recovery method thereof

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150084307A (ko) * 2014-01-13 2015-07-22 삼성전자주식회사 네트워크에서 웹 로딩 시간 제어 방법 및 장치
US9639424B2 (en) * 2015-04-13 2017-05-02 Verizon Patent And Licensing Inc. Server reset and recovery
CN106412016A (zh) * 2016-08-31 2017-02-15 广州唯品会信息科技有限公司 服务器的连接控制方法及装置
CN106375150A (zh) * 2016-08-31 2017-02-01 广州唯品会信息科技有限公司 服务器的断开控制方法及装置
JP7289111B2 (ja) * 2019-06-26 2023-06-09 パナソニックIpマネジメント株式会社 通信装置、認証方法およびコンピュータプログラム
CN113067742A (zh) * 2020-01-02 2021-07-02 中国移动通信有限公司研究院 IPoE的处理方法、装置及家庭网关
CN111371641B (zh) * 2020-02-26 2021-11-16 RealMe重庆移动通信有限公司 网络检测方法及相关产品
CN113448795A (zh) * 2020-03-26 2021-09-28 伊姆西Ip控股有限责任公司 用于获取系统诊断信息的方法、设备和计算机程序产品
CN113497727B (zh) * 2020-04-01 2024-02-27 中国移动通信集团辽宁有限公司 Sae网关故障处理方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1589545A (zh) * 2001-09-18 2005-03-02 艾利森公司 自适应节点选择
CN101662387A (zh) * 2009-10-14 2010-03-03 中国电信股份有限公司 一种检测网络中计算机接入状态的系统及方法
CN102064979A (zh) * 2010-12-15 2011-05-18 刘俊 网络故障修复系统及其装置和方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6654914B1 (en) * 1999-05-28 2003-11-25 Teradyne, Inc. Network fault isolation
US20010039585A1 (en) * 1999-12-06 2001-11-08 Leonard Primak System and method for directing a client to a content source
US6976090B2 (en) * 2000-04-20 2005-12-13 Actona Technologies Ltd. Differentiated content and application delivery via internet
US7392435B2 (en) * 2003-05-09 2008-06-24 Nokia Inc. Email gateway diagnostic tool, system, and method
US8135828B2 (en) * 2005-03-14 2012-03-13 Microsoft Corporation Cooperative diagnosis of web transaction failures
WO2008037083A1 (en) * 2006-09-28 2008-04-03 Research In Motion Limited Method and apparatus for buffering packets in a network
US7680956B2 (en) * 2006-10-24 2010-03-16 Cisco Technology, Inc. Communicating additional information in a DNS update response by requesting deletion of a specific record
US7680876B1 (en) * 2006-12-14 2010-03-16 Cisco Technology, Inc. Highly available domain name system
CN101656633A (zh) 2008-08-21 2010-02-24 北京亿企通信息技术有限公司 一种在即时通信工具中检测网络的方法
JP5237034B2 (ja) * 2008-09-30 2013-07-17 株式会社日立製作所 イベント情報取得外のit装置を対象とする根本原因解析方法、装置、プログラム。
EP2356776B1 (en) * 2008-11-14 2013-05-22 Telefonaktiebolaget L M Ericsson (publ) Configuration of a network node using captive mode
CN101442452A (zh) * 2008-12-31 2009-05-27 中兴通讯股份有限公司 Dns服务器不可达的告警方法及告警装置
US8935428B2 (en) * 2009-06-24 2015-01-13 Broadcom Corporation Fault tolerance approaches for DNS server failures
JP5498102B2 (ja) * 2009-09-02 2014-05-21 アラクサラネットワークス株式会社 ネットワークシステム、ネットワーク中継装置、それらの制御方法
US9130766B2 (en) * 2009-12-17 2015-09-08 Verizon Patent And Licensing Inc. System for and method of performing residential gateway diagnostics and corrective actions
CN102130791B (zh) 2010-01-14 2013-02-13 深圳市深信服电子科技有限公司 一种在网关上检测代理的方法、装置及网关服务器
US20110185237A1 (en) * 2010-01-28 2011-07-28 Futurewei Technologies, Inc. System and Method for Delivering Messages
US8103915B2 (en) * 2010-02-12 2012-01-24 Verizon Patent And Licensing Inc. Failure system for domain name system client
CN102843391B (zh) * 2011-06-21 2017-04-05 中兴通讯股份有限公司 一种信息发送方法及网关
KR101228896B1 (ko) * 2011-06-27 2013-02-06 주식회사 안랩 도메인의 신뢰 ip 주소를 이용한 업데이트 서버 접속 장치 및 방법
EP3105902B1 (en) * 2014-02-14 2018-09-19 British Telecommunications public limited company Methods, apparatus and systems for processing service requests

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1589545A (zh) * 2001-09-18 2005-03-02 艾利森公司 自适应节点选择
CN101662387A (zh) * 2009-10-14 2010-03-03 中国电信股份有限公司 一种检测网络中计算机接入状态的系统及方法
CN102064979A (zh) * 2010-12-15 2011-05-18 刘俊 网络故障修复系统及其装置和方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10284419B2 (en) 2017-06-06 2019-05-07 Mediatek Inc. User equipment and data connection recovery method thereof

Also Published As

Publication number Publication date
US20140281667A1 (en) 2014-09-18
EP2775661B1 (en) 2019-09-18
US10567216B2 (en) 2020-02-18
US20160308711A1 (en) 2016-10-20
CN103283180A (zh) 2013-09-04
US9405638B2 (en) 2016-08-02
EP2775661A1 (en) 2014-09-10
US9942088B2 (en) 2018-04-10
US20180191556A1 (en) 2018-07-05
EP2775661A4 (en) 2015-03-11
WO2013078671A1 (zh) 2013-06-06

Similar Documents

Publication Publication Date Title
CN103283180B (zh) 一种故障检测方法、网关、用户设备及通信系统
KR101802005B1 (ko) 장애가 생긴 서빙 게이트웨이를 통한 접속의 재배치 및 복구 및 트래픽 오프로딩을 위한 방법 및 장치
CN101730124A (zh) 恢复业务的方法、装置和系统
CN101651608A (zh) 链路管理方法及相应管理实体、执行节点和移动通信系统
CN103841545B (zh) 一种mme池场景能力信息上报的方法及装置
WO2016065552A1 (zh) 一种心跳周期的设置方法及终端
EP2925051B1 (en) Method, device and wireless communication system for dual-network backup
WO2012089025A1 (zh) 基于基站控制设备群组的通信方法、装置及系统
US20180084597A1 (en) Method of managing communication interfaces for a multipath transmission control protocol (mptcp) connection
CN105814934A (zh) 处理被叫业务的方法、移动管理实体和归属用户服务器
US10091832B2 (en) Call failure reduction
CN101772010B (zh) 分组交换业务小区更新时的终端和网络的异常处理方法
CN103200635B (zh) 用户设备在无线网络控制器之间迁移的方法、装置及系统
CN105338563A (zh) 一种故障检测方法、网关、用户设备及通信系统
CN103634941A (zh) 资源释放方法及装置
CN103051484A (zh) 会话业务处理方法、系统和会话边缘控制器
CN101335702B (zh) 一种gprs业务支持节点容灾的处理方法
CN102742314B (zh) 一种数据传输异常的处理方法、设备和系统
CN101945426B (zh) Rlc不可恢复性错误与高优先级小区更新并发的方法和装置
CN101365148A (zh) 呼叫接入控制方法、系统和设备
JP6301614B2 (ja) 通信制御装置及び通信制御方法
WO2011160287A1 (zh) 拥塞的控制方法及装置
JP6387268B2 (ja) 通信制御装置、通信制御システム、及び通信制御方法
KR20160050563A (ko) 통화 서비스 설정 제어 방법 및 이를 위한 장치
CN103987132A (zh) 一种业务处理方法、系统以及相关设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant