CN113032220B - 一种基于会话染色实现全链路性能安全追踪的方法 - Google Patents

一种基于会话染色实现全链路性能安全追踪的方法 Download PDF

Info

Publication number
CN113032220B
CN113032220B CN202110338172.XA CN202110338172A CN113032220B CN 113032220 B CN113032220 B CN 113032220B CN 202110338172 A CN202110338172 A CN 202110338172A CN 113032220 B CN113032220 B CN 113032220B
Authority
CN
China
Prior art keywords
module
cluster module
session
dyeing
business service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110338172.XA
Other languages
English (en)
Other versions
CN113032220A (zh
Inventor
杨航
叶思斯
张华兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Digital Power Grid Group Information Communication Technology Co ltd
China Southern Power Grid Co Ltd
Southern Power Grid Digital Grid Research Institute Co Ltd
Original Assignee
China Southern Power Grid Co Ltd
Southern Power Grid Digital Grid Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Southern Power Grid Co Ltd, Southern Power Grid Digital Grid Research Institute Co Ltd filed Critical China Southern Power Grid Co Ltd
Priority to CN202110338172.XA priority Critical patent/CN113032220B/zh
Publication of CN113032220A publication Critical patent/CN113032220A/zh
Application granted granted Critical
Publication of CN113032220B publication Critical patent/CN113032220B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/325Display of status information by lamps or LED's
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

本发明公开了一种基于会话染色实现全链路性能安全追踪的方法,包括会话染色模块和压测系统模块,所述会话染色模块与业务服务集群模块相连,所述业务服务集群模块与存储模块相连,所述业务服务集群模块与实时计算集群模块相连,所述实时计算集群模块与链路跟踪系统模块相连,所述实时计算集群模块与报警处理集群模块相连,所述日志系统集群模块与链路跟踪系统模块相连,所述存储模块与链路跟踪系统模块相连。该基于会话染色实现全链路性能安全追踪的方法设置链路跟踪系统模块采集、存储和分析rpc调用的trace数据、指标数据,并与日志系统集群模块所传输的日志数据相互配合,从而实现快速故障定位、链路梳理的功能。

Description

一种基于会话染色实现全链路性能安全追踪的方法
技术领域
本发明涉及链路追踪技术领域,具体为一种基于会话染色实现全链路性能安全追踪的方法。
背景技术
为了支撑日益增长的庞大业务量,业界大量使用微服务架构。服务按照不同的维度进行拆分,互联网应用构建在不同的软件模块集上,这些软件模块可能是由不同的团队开发、可能使用不同的编程语言来实现、可能布在了几千台服务器,横跨多个不同的数据中心,分布式系统变得日趋复杂,为了实现对故障进行定位,因此需要通过链路跟踪来解决问题,链路指无源的点到点的物理连接,有线通信时,链路指两个节点之间的物理线路,如电缆或光纤。无线电通信时,链路指基站和终端之间传播电磁波的路径空间。水声通信时链路指换能器和水听器之间的传播声波的路径空间。
而目前所使用的链路系统,在基于于会话染色的前提下,不能够较为精确的追踪故障,且不便于对业务进行容量分析。
发明内容
本发明的目的在于提供一种基于会话染色实现全链路性能安全追踪的方法,以解决上述背景技术提出的目前市场上的所使用的链路系统,在基于于会话染色的前提下,不能够较为精确的追踪故障,且业务服务集群模块比较容易崩溃的问题。
为实现上述目的,本发明提供如下技术方案:一种基于会话染色实现全链路性能安全追踪的方法,包括会话染色模块和压测系统模块,所述会话染色模块与业务服务集群模块相连,所述业务服务集群模块与存储模块相连,所述业务服务集群模块与实时计算集群模块相连,所述实时计算集群模块与链路跟踪系统模块相连,所述实时计算集群模块与报警处理集群模块相连,所述日志系统集群模块与链路跟踪系统模块相连,所述存储模块与链路跟踪系统模块相连。
优选的,所述压测系统模块与容量管理系统模块模块相连,所述容量管理系统模块与业务服务集群模块相连。
优选的,所述会话染色模块、业务服务集群模块、存储模块、实时计算集群模块、链路跟踪系统模块、报警处理集群模块和日志系统集群模块之间均通过电性连接。
优选的,所述存储模块由四组存储主机构成,且四组存储主机型号均为DS-V2410RH。
优选的,所述实时计算集群模块所使用的CPU型号为AMD RYZEN R9 3950X。
优选的,所述压测系统模块、容量管理系统模块和业务服务集群模块之间均通过电性连接。
与现有技术相比,本发明的有益效果是:该基于会话染色实现全链路性能安全追踪的方法:
1.设置有业务服务集群模块、存储模块、实时计算集群模块、链路跟踪系统模块、报警处理集群模块和日志系统集群模块,首先会话染色模块对数据进行收集并进行标记,并将数据输入至存储模块和业务服务集群模块,业务服务集群模块对微服务系统进行集群,统一管理,业务服务集群模块将内部故障信息传输至实时计算集群模块,实时计算集群模块,实时计算业务服务集群模块所传输的数据流,并将分析处理完成的数据传输至链路跟踪系统模块,当数据异常时,报警处理集群模块会接收到实时计算集群模块所发出的指令后,迅速报警,并发出鸣叫和闪烁灯光,同时链路跟踪系统模块采集、存储和分析rpc调用的trace数据、指标数据,并与日志系统集群模块所传输的日志数据相互配合,从而实现快速故障定位、链路梳理的功能;
2.设置有压测系统模块和容量管理系统模块,压测系统模块压测出单服务的性能数据,结合链路跟踪以及指标统计数据,分析出整个系统的性能瓶颈,找出优化方向,同时将数据传到至容量管理系统模块,容量管理系统模块计算并评估不同入口的流量,能够对业务服务集群模块进行自动扩容,防止业务服务集群模块因流量过大,导致崩溃。
附图说明
图1为本发明主视结构示意图;
图2为本发明流程结构示意图;
图3为本发明原理结构示意图。
图中:1、会话染色模块;2、业务服务集群模块;3、存储模块;4、实时计算集群模块;5、链路跟踪系统模块;6、压测系统模块;7、容量管理系统模块;8、报警处理集群模块;9、日志系统集群模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,部属于本发明保护的范围。
请参阅图1-3,本发明提供一种技术方案:一种基于会话染色实现全链路性能安全追踪的方法,包括会话染色模块1、业务服务集群模块2、存储模块3、实时计算集群模块4、链路跟踪系统模块5、压测系统模块6、容量管理系统模块7、报警处理集群模块8和日志系统集群模块9,所述会话染色模块1与业务服务集群模块2相连,所述业务服务集群模块2与存储模块3相连,所述存储模块3由四组存储主机构成,且四组存储主机型号均为DS-V2410RH,提高存储效率,所述业务服务集群模块2与实时计算集群模块4相连,所述实时计算集群模块4所使用的CPU型号为AMD RYZEN R9 3950X,提高数据处理效率,所述实时计算集群模块4与链路跟踪系统模块5相连,所述实时计算集群模块4与报警处理集群模块8相连,所述日志系统集群模块9与链路跟踪系统模块5相连,所述存储模块3与链路跟踪系统模块5相连,所述压测系统模块6与容量管理系统模块7模块相连,所述压测系统模块6、容量管理系统模块7和业务服务集群模块2之间均通过电性连接,便于数据之间传输,所述容量管理系统模块7与业务服务集群模块2相连,便于扩容业务服务集群模块2,防止流量过大,导致业务服务集群模块2崩溃,所述会话染色模块1、业务服务集群模块2、存储模块3、实时计算集群模块4、链路跟踪系统模块5、报警处理集群模块8和日志系统集群模块9之间均通过电性连接,提高数据传输效率。
基于会话染色实现全链路性能安全追踪的方法:在使用该基于会话染色实现全链路性能安全追踪的方法时,对本装置进行简单的一个了解,首先,会话染色模块1对数据进行收集并进行标记,并将数据输入至存储模块3和业务服务集群模块2,业务服务集群模块2对微服务系统进行集群,统一管理,业务服务集群模块2将内部故障信息传输至实时计算集群模块4,实时计算集群模块4,实时计算业务服务集群模块2所传输的数据流,并将分析处理完成的数据传输至链路跟踪系统模块5,当数据异常时,报警处理集群模块8会接收到实时计算集群模块4所发出的指令后,迅速报警,并发出鸣叫和闪烁灯光,同时链路跟踪系统模块5采集、存储和分析rpc调用的trace数据、指标数据,并与日志系统集群模块9所传输的日志数据相互配合,从而实现快速故障定位、链路梳理的功能,然后,压测系统模块6压测出单服务的性能数据,结合链路跟踪以及指标统计数据,分析出整个系统的性能瓶颈,找出优化方向,同时将数据传到至容量管理系统模块7,容量管理系统模块7计算并评估不同入口的流量,能够对业务服务集群模块2进行自动扩容,防止业务服务集群模块2因流量过大,导致崩溃,本说明中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于会话染色实现全链路性能安全追踪的方法,包括会话染色模块(1)、压测系统模块(6)和日志系统集群模块(9),所述会话染色模块(1)与业务服务集群模块(2)相连,所述业务服务集群模块(2)与存储模块(3)相连,其特征在于:所述业务服务集群模块(2)与实时计算集群模块(4)相连,所述实时计算集群模块(4)与链路跟踪系统模块(5)相连,所述实时计算集群模块(4)与报警处理集群模块(8)相连,所述日志系统集群模块(9)与链路跟踪系统模块(5)相连,所述存储模块(3)与链路跟踪系统模块(5)相连;
基于会话染色实现全链路性能安全追踪的方法:首先,会话染色模块(1)与存储模块(3)相连,压测系统模块(6)与容量管理系统模块(7)相连,容量管理系统模块(7)与业务服务集群模块(2)相连,会话染色模块(1)对数据进行收集并进行标记,并将数据输入至存储模块(3)和业务服务集群模块(2),业务服务集群模块(2)对微服务系统进行集群,统一管理,业务服务集群模块(2)将内部故障信息传输至实时计算集群模块(4),实时计算集群模块(4),实时计算业务服务集群模块(2)所传输的数据流,并将分析处理完成的数据传输至链路跟踪系统模块(5),当数据异常时,报警处理集群模块(8)会接收到实时计算集群模块(4)所发出的指令后,迅速报警,并发出鸣叫和闪烁灯光,同时链路跟踪系统模块(5)采集、存储和分析rpc调用的trace数据、指标数据,并与日志系统集群模块(9)所传输的日志数据相互配合,从而实现快速故障定位、链路梳理的功能,然后,压测系统模块(6)压测出单服务的性能数据,结合链路跟踪以及指标统计数据,分析出整个系统的性能瓶颈,找出优化方向,同时将数据传到至容量管理系统模块(7),容量管理系统模块(7)计算并评估不同入口的流量,能够对业务服务集群模块(2)进行自动扩容,防止业务服务集群模块(2)因流量过大,导致崩溃。
2.根据权利要求1所述的一种基于会话染色实现全链路性能安全追踪的方法,其特征在于:所述会话染色模块(1)、业务服务集群模块(2)、存储模块(3)、实时计算集群模块(4)、链路跟踪系统模块(5)、报警处理集群模块(8)和日志系统集群模块(9)之间均通过电性连接。
3.根据权利要求1所述的一种基于会话染色实现全链路性能安全追踪的方法,其特征在于:所述存储模块(3)由四组存储主机构成,且四组存储主机型号均为DS-V2410RH。
4.根据权利要求1所述的一种基于会话染色实现全链路性能安全追踪的方法,其特征在于:所述实时计算集群模块(4)所使用的CPU型号为AMD RYZEN R9 3950X。
5.根据权利要求1所述的一种基于会话染色实现全链路性能安全追踪的方法,其特征在于:所述压测系统模块(6)、容量管理系统模块(7)和业务服务集群模块(2)之间均通过电性连接。
CN202110338172.XA 2021-03-29 2021-03-29 一种基于会话染色实现全链路性能安全追踪的方法 Active CN113032220B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110338172.XA CN113032220B (zh) 2021-03-29 2021-03-29 一种基于会话染色实现全链路性能安全追踪的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110338172.XA CN113032220B (zh) 2021-03-29 2021-03-29 一种基于会话染色实现全链路性能安全追踪的方法

Publications (2)

Publication Number Publication Date
CN113032220A CN113032220A (zh) 2021-06-25
CN113032220B true CN113032220B (zh) 2022-06-07

Family

ID=76452812

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110338172.XA Active CN113032220B (zh) 2021-03-29 2021-03-29 一种基于会话染色实现全链路性能安全追踪的方法

Country Status (1)

Country Link
CN (1) CN113032220B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113660166A (zh) * 2021-08-17 2021-11-16 中国工商银行股份有限公司 交易路由控制方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104581794A (zh) * 2013-10-22 2015-04-29 中国移动通信集团四川有限公司 一种中间件业务故障处理方法及系统
CN112256530A (zh) * 2020-10-27 2021-01-22 广州助蜂网络科技有限公司 一种可链路追踪的日志服务方法及其系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5302050B2 (ja) * 2009-03-04 2013-10-02 富士通株式会社 障害解析のためのトレース装置およびトレース方法
CN101599870B (zh) * 2009-06-30 2011-06-15 西北工业大学 网络链路性能测量方法
CN103297927A (zh) * 2012-03-04 2013-09-11 山东大学威海分校 无线传感器网络的分布式图着色链路调度
CN106100902B (zh) * 2016-08-04 2020-04-03 腾讯科技(深圳)有限公司 云端指标监控方法和装置
CN109818784A (zh) * 2019-01-10 2019-05-28 中国南方电网有限责任公司 智能变电站过程层物理链路故障诊断的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104581794A (zh) * 2013-10-22 2015-04-29 中国移动通信集团四川有限公司 一种中间件业务故障处理方法及系统
CN112256530A (zh) * 2020-10-27 2021-01-22 广州助蜂网络科技有限公司 一种可链路追踪的日志服务方法及其系统

Also Published As

Publication number Publication date
CN113032220A (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
EP3863222A1 (en) Service quality evaluation model training method and device
CN111176879A (zh) 设备的故障修复方法及装置
CN108038145A (zh) 分布式服务跟踪方法、系统、存储介质和电子设备
CN113032220B (zh) 一种基于会话染色实现全链路性能安全追踪的方法
CN103457763B (zh) 基于策略的多通道信息分发方法和系统及自动化运维平台
CN116166505B (zh) 金融行业双态it架构的监控平台、方法、存储介质及设备
CN108984332A (zh) 一种定位服务器宕机故障的装置及方法
CN111897718A (zh) 一种基于大数据的车机自动测试方法及存储介质
CN109993189A (zh) 一种网络故障预警方法、装置和介质
CN104732608A (zh) 一种实时质检方法、装置及巡检系统
CN109347703A (zh) 一种cps节点故障检测装置与方法
CN112769622A (zh) 一种基于rpc服务监控的集群服务故障预警系统
CN109583598A (zh) 一种电力设备自动巡检系统
CN110429977A (zh) 一种基于光源光探测器阵列的光缆纤芯实时监测系统及方法
JP2022000775A (ja) 交通流監視測定システムのテスト方法、装置及び機器
CN110647070A (zh) 一种用于超大规模数据中心的动力环境监控系统
CN111580412A (zh) 基于半实物模型的测试评价系统
CN113722178A (zh) 一种告警信息智能降噪与告警收敛的系统
CN110275815A (zh) 一种系统异常告警处理方法及装置
CN206181058U (zh) 一种基于云计算的数据交换监控系统
CN115593375A (zh) 车辆紧急制动方法、装置、设备和计算机可读介质
CN109409295A (zh) 多终端立体化智能人证核验系统
CN114513553A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN112261138A (zh) 一种基于云制造模式的设备维修人员调度方法及物联网系统
CN112835957B (zh) 基于区块链技术的数据中台的数据质量监控方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 510000 No. 11 Kexiang Road, Science City, Luogang District, Guangzhou City, Guangdong Province

Patentee after: CHINA SOUTHERN POWER GRID Co.,Ltd.

Country or region after: China

Patentee after: Southern Power Grid Digital Grid Research Institute Co.,Ltd.

Address before: 510000 No. 11 Kexiang Road, Science City, Luogang District, Guangzhou City, Guangdong Province

Patentee before: CHINA SOUTHERN POWER GRID Co.,Ltd.

Country or region before: China

Patentee before: Southern Power Grid Digital Grid Research Institute Co.,Ltd.

CP03 Change of name, title or address
TR01 Transfer of patent right

Effective date of registration: 20240411

Address after: 510000 No. 11 Kexiang Road, Science City, Luogang District, Guangzhou City, Guangdong Province

Patentee after: CHINA SOUTHERN POWER GRID Co.,Ltd.

Country or region after: China

Patentee after: China Southern Power Grid Digital Power Grid Group Information Communication Technology Co.,Ltd.

Address before: 510000 No. 11 Kexiang Road, Science City, Luogang District, Guangzhou City, Guangdong Province

Patentee before: CHINA SOUTHERN POWER GRID Co.,Ltd.

Country or region before: China

Patentee before: Southern Power Grid Digital Grid Research Institute Co.,Ltd.

TR01 Transfer of patent right