CN105159955B - 一种换流站控制保护系统数据库服务器故障在线监测的方法 - Google Patents

一种换流站控制保护系统数据库服务器故障在线监测的方法 Download PDF

Info

Publication number
CN105159955B
CN105159955B CN201510505027.0A CN201510505027A CN105159955B CN 105159955 B CN105159955 B CN 105159955B CN 201510505027 A CN201510505027 A CN 201510505027A CN 105159955 B CN105159955 B CN 105159955B
Authority
CN
China
Prior art keywords
server
warning
event
monitoring
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510505027.0A
Other languages
English (en)
Other versions
CN105159955A (zh
Inventor
吉培荣
曾怡
陈诚
张古月
许国君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Three Gorges University CTGU
Original Assignee
China Three Gorges University CTGU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Three Gorges University CTGU filed Critical China Three Gorges University CTGU
Priority to CN201510505027.0A priority Critical patent/CN105159955B/zh
Publication of CN105159955A publication Critical patent/CN105159955A/zh
Application granted granted Critical
Publication of CN105159955B publication Critical patent/CN105159955B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Debugging And Monitoring (AREA)

Abstract

一种换流站控制保护系统数据库服务器故障在线监测的方法,通过sql语言直接建立服务器错误和警告事件的存储过程,然后通过Visual Basic应用程序直接实时调用存储过程,获取警告或错误事件的信息,达到快速定位故障。系统将自动搜索主机上所有服务器,提供给操作人员选择所需要监视的服务器;系统连接服务器;判断是否连接成功;设置警告和错误事件数据列的信息,追踪服务器的警告和错误事件,获取警告和故障信息;显示警告和错误事件的数据列信息,处理故障,保存故障信息,完成监视过程。本发明通过sql语言直接建立服务器错误和警告事件的存储过程,然后通过Visual Basic直接实时调用存储过程,获取警告或错误事件的信息,达到快速定位故障。

Description

一种换流站控制保护系统数据库服务器故障在线监测的方法
技术领域
本发明一种换流站控制保护系统数据库服务器故障在线监测的方法,涉及换流站在监测领域。
背景技术
在直流换流站系统中,直流换流站控制保护系统与服务器是紧密耦合的,服务器故障可能导致主机故障,直接影响到直流换流站主机系统的安全运行,目前还没有专门针对换流站服务器进行诊断的任何工具,当需要监视服务器故障时只能借助于服务器自带的事件探测器来完成,服务器自带的事件探测器是一个面向所有使用的SQL服务器故障监测的工具,为了满足不同用户的需求它的事件类很多而且每个事件数据列的信息量也很多,当直流换流站工作人员需要监视服务器时,就需要对事件进行筛选,会给操作人员带来很大的麻烦。对于发生异常或故障的服务器,若不能快速的排除异常或故障,会使服务器得到的信息是不正常的或是错误的,当主机访问服务器信息时,有可能会使主机得到错误的信息,从而使主机产生错误的信号,引起主机故障,将直接威胁到直流系统的安全稳定运行。开发一套专门针对直流换流站服务器在线监测系统有利于降低直流系统带病运行的时间,提高换流站系统的安全可靠性。
现有的监测方法主要是通过服务器自带的事件探查器来完成对服务器的故障监测方法,每次监视服务器时都需要花很长时间去手动配置SQL服务器的事件探测器的事件和事件数据列的信息,而且还需要工作人员有较强的专业知识,如果跟踪事件设置不合理将会严重影响到服务器的性能。
中国专利《监测数据库异常数据的方法及系统》(公开号 CN:104077371A)提出了一种通过用户自定义异常数据模型;然后获取异常监控引擎所得到的数据信息,根据异常数据监控引擎的输出数据对异常情况进行处理。该方法实现比较为复杂,并且不能对服务器进行实时的故障跟踪。
中国专利《ORACLE数据库操作监控系统》(公开号 CN :102855319A)提出了一种通过sql语言调用了服务器Trace的存储过程,完成对数据库新增、修改和删除等操作的监测,它并不能有效的监测到数据库发生登陆失败等其他故障。
发明内容
本发明提供一种换流站控制保护系统数据库服务器故障在线监测的方法,通过sql语言直接建立服务器错误和警告事件的存储过程,然后通过Visual Basic直接实时调用存储过程,获取警告或错误事件的信息,达到快速定位故障。同时,本发明还提供了警告和错误事件、数据列的相关解释信息,方便工作人员更好的定位故障。
本发明所采用的技术方案是:
一种换流站控制保护系统数据库服务器故障在线监测的方法,通过sql语言直接建立服务器错误和警告事件的存储过程,然后通过Visual Basic应用程序直接实时调用存储过程,获取警告或错误事件的信息,达到快速定位故障;
其具体步骤方法如下:系统将自动搜索主机上所有服务器,提供给操作人员选择所需要监视的服务器;系统连接服务器;判断是否连接成功;设置警告和错误事件数据列的信息,追踪服务器的警告和错误事件,获取警告和故障信息;显示警告和错误事件的数据列信息,处理故障,保存故障信息,完成监视过程。
一种换流站控制保护系统数据库服务器故障在线监测的方法,包括以下步骤:
步骤1:启动系统时,系统将自动搜索所有有效的数据库服务器,同时将所有数据库名称导入到主界面的下拉菜单中,提供给工作人员选择使用;
步骤2:工作人员选择需要监视的服务器,通过ODBC应用程序接口来连接直流换流站的数据库服务器;
步骤3:判断服务器监视系统是否能正常连接到换流站数据库服务器;如果能则转向下一步,否则服务器监视系统的主界面显示连接失败提示并返回到步骤3;
步骤4:设置服务器监视系统的警告和错误事件数据列信息,对警告和错误事件进行筛选,实时跟踪服务器;
步骤5:判断服务器监视系统能否正常跟踪服务器事件;如果能则转向下一步,否则服务器监视系统的主界面显示连接失败提示,并返回到步骤4:
步骤6:服务器监视系统主界面显示跟踪的警告和错误事件数据列信息,暂停监视,根据事件类型判断服务器出现了什么故障,事件的文本值捕获故障信息,通过获得客户的计算机名称等等相关信息,根据数据列的信息定位故障,排除故障,然后保存这些数据列信息,最后启动监视,查看是否还有警告或错误事件,没有则退出运行完成监视过程,有则继续处理故障:
步骤7:服务器监视系统主界面没有显示警告和错误事件数据列信息,说明外部没有引起服务器发生故障,完成监视过程。
在步骤1中,需要查询主机应用程序接口ODBC配置了多少台数据库服务器,以供工作人员选择监视对象。
在步骤4中,进行筛选主要是去掉换流站常期存在的一些警告或错误事件,这些警告或错误并不影响换流站的工作,或是当警告或错误事件很多时,进行筛选。
本发明一种换流站控制保护系统数据库服务器故障在线监测的方法,技术效果如下:
1)、通过sql语言建立服务器警告和错误事件的完整跟踪存储过程,由于sql语句与Visual Basic语言有较好的兼容性,因此采用Visual Basic语言调用警告或错误事件的存储过程,将跟踪到的信息写入到跟踪文件trc中,最后使用sql语句读取跟踪文件中的信息返回到主界面上,同时在服务器监测主界面对警告或错误事件的相关事件和数据列信息进行了翻译或解释,方便工作人选择需要查看的信息。
2)、提供了服务器警告和错误事件以及事件数据列信息的筛选功能,同时给出了事件和事件数据列信息的解释,方便工作人员更好的定位故障。本发明能够实时在线监测服务器的故障和记录服务器故障信息,对数据库服务器进行故障定位和故障重放。应用本方法快速的定位故障提高工作效率,有效的节省直流换流站服务器故障后恢复时间,为换流站的运行和检修工作提供方便。
3)、本发明还提供了服务器警告和错误事件以及事件数据列信息的筛选功能,同时给出了事件和事件数据列信息的解释,方便工作人员更好的定位故障。利用本方法将能解决换流站服务在线故障监测的空白,避免运行检修人员每次监测服务器时都需要花很长时间去手动设置SQL服务器自带的事件探测器,它需要工作人员对服务器事件有较强的专业知识。应用本方法快速的定位故障提高工作效率。
4)、利用本方法将避免运行检修人员每次监视服务器时都需要花很长时间去手动配置SQL服务器的事件探测器的事件和事件数据列的信息,本方法能快速的定位故障提高工作效率,有效的节省直流换流站服务器故障后恢复时间,同时降因服务器故障导致主机故障的可能性,提高了直流换流站的安全稳定运行。
5)、本发明通过sql语言编写了包含所有警告和错误事件的存储过程,可以更全面的监测服务器的各种故障,同时也避免了需要花很长时间去手动配置SQL服务器的事件探测器的事件和事件数据列的信息,达到快速获取故障信息的目的。通过Visual Basic应用程序与服务器建立的存储过程相结合,利用Visual Basic应用程序的定时器控制对存储过程的调用,达到实时监测服务器的目的。本发明还提供了事件和事件数据列信息筛选的选项,以达到减少服务器不必要的内存开销的目的。
附图说明
图1为本发明的设计框图。
图2为本发明的在线监测的流程图。
具体实施方式
一种换流站控制保护系统数据库服务器故障在线监测的方法,通过sql语言直接建立服务器错误和警告事件的存储过程,然后通过Visual Basic应用程序直接实时调用存储过程,获取警告或错误事件的信息,达到快速定位故障;
其具体步骤方法如下:系统将自动搜索主机上所有服务器,提供给操作人员选择所需要监视的服务器;系统连接服务器;判断是否连接成功;设置警告和错误事件数据列的信息,追踪服务器的警告和错误事件,获取警告和故障信息;显示警告和错误事件的数据列信息,处理故障,保存故障信息,完成监视过程。如果没有警告或错误事件数据列信息的显示,则表示服务器运行正常,完成监视过程。
一种换流站控制保护系统数据库服务器故障在线监测的方法,如图1所示,由三部分构成:分别为用户、数据库服务器和服务器实时在线监测系统。总体方案具体技术实施方案如图2所示,具体过程如下:
步骤1:启动系统时,系统将自动搜索所有主机应用程序配置了ODBC接口的服务器,以供工作人员选择所需要监视的服务器。例如:对换流站系统服务器来说,启动在线监测系统时,系统通过解析ODBC的DNS获得所有服务器的名称,其中主要包括PCP(极控制保护主机)、ACP(交流控制主机)、ASI(辅助诊断系统接口主机)、AFP(交流滤波器保护主机)、LFL(直流线路故障定位仪)所对应的主机服务器,这些主机服务器将提供给工作人员选择。
步骤2:工作人员选择需要监视的服务器,通过ODBC应用程序接口来连接直流换流站的数据库服务器。例如:对于换流站服务器来说,由于LFL主机不具备任何控制和保护功能,只具备直流线路故障测距逻辑,该主机短时退出,不会影响MACH2系统其他设备,也不会造成系统可靠性降低,因此采用LFL来模拟故障,即删除LFL主机上的ODBC连接,修改LFL主机ODBC客户端密码,使其密码错误,导致LFL主机服务器事件上传中断。然后利用ODBC应用程序接口来连接LFL所对应的服务器scmdb。
步骤3:判断服务器监视系统是否能正常连接到换流站数据库服务器;如果能则转向下一步,否则服务器监视系统的主界面显示连接失败提示并返回到步骤3。如:对于步骤2连接LFL所对应的服务器实例来说,系统通过ADO连接服务器之后反回来的返回代码值err.number来判断服务器连接是否成功,如果返回值为-2147467259,找不到指定的数据库服务器或数据库,数据库连接失败。
步骤4:设置服务器监视系统的警告和错误事件和数据列信息,对警告和错误事件进行筛选,筛选主要是去掉那些换流站常期存在的一些警告或错误事件,这些警告或错误并不影响换流站的工作,因此它有利于方便工作人员查看故障信息。根据所选择的实例,服务器的警告和错误事件主要有10大类,数据列信息有25种,根据需要选择了Attention(收集所有提示事件,如客户端中断请求或当客户端连接中断时)、Exception (SQL Server产生的异常错误事件)、Excecution Warnings(在执行 SQL Server 语句或存储过程时出现的任何警告)这三类警告和错误事件,数据列信息选择了TextData(错误事件关联的文本数据)、ClientProcessID(与错误事件关联的客户端进程 ID)、SPID(与错误事件关联的用户会话的服务器进程 ID) 、ClientHostName(发生错误事件的计算机的名称)、ApplicationName(与错误事件关联的客户端应用程序的名称)、StartTime(登录事件的开始时间)、Seventy(发生错误事件的严重性) 、NTDomainName(发生错误事件实例的名称),配置好服务器的跟踪事件和事件的相关数据列信息,启动跟踪,调用服务器建立的跟踪过程,实现服务器的在线监测。
步骤5:判断服务器监视系统能否正常跟踪服务器事件,如果能则转向下一步,否则服务器监视系统的主界面显示连接失败提示并返回到步骤4。具体实例说明如下:在步骤4启动跟踪存储过程,根据存储过程sp_trace_create返回来的代码值err.Number来判断跟踪是否正常建立,如果返回值为0,则表示正常,如果返回为其他的值,则表示出现了问题,同时根据err.Description来获取出现故障的原因。
步骤6:服务器监视系统主界面显示跟踪的警告和错误事件数据列信息,暂停监视,根据事件类型(EventClass)判断服务器出现了什么故障,事件的文本值(textData)捕获故障信息,通过(ClientHostName)获得客户的计算机名称等等相关信息。根据数据列的信息定位故障,排除故障,然后保存这些数据列信息,最后启动监视,查看是否还有警告或错误事件,没有则退出运行完成监视过程,有则继续处理故障。具体实例说明如下:系统通过调用fn_trace_gettable存储过程获取跟踪文件信息,然后采用sql语句insert into记录获取的存储信息。根据之前对LFL主机的设置,断开了LFL的连接修改了服务器登录密码,因此会产生一些故障信息。故障信息显示户端进程ID号为7996的主机,大量发出因密码错误导致登录失败告警,工作人员迅速赶往LFL屏柜,使用任务管理器,检查MainCPU_Event进程的进程ID号,发现该进程ID号为7996。证明LFL事件中断,与设置的错误是吻合的。
步骤7:服务器监视系统主界面没有显示警告和错误事件数据列信息,说明外部没有引起服务器发生故障,完成监视过程。如果服务器监视系统主界面在很长一端时间没有出现警告和错误的相关数据列信息,则表明服务器没有出现故障,正常运行。
数据库服务器在线监测警告和错误事件存储过程的建立:
通过sql语言编写服务器警告和错误事件的存储过程,此过程主要利用事件探查器内的5类过程来完成,其5类过程有创建跟踪(sp_trace_create)、设置跟踪事件(sp_trace_generateevent)、设置跟踪事件数据列(sp_trace_setevent)、跟踪事件过滤(sp_trace_setfilter)、跟踪事件启动停止(sp_trace_setstatus);
Visual Basic应用程序对存储过程的调用和事件、事件数据列信息的筛选:
通过ADODB对象的属性和方法来实现存储过程,同时采用参数传递的方式来完成对事件、事件数据列信息的选择。
服务器故障信息的实时获取与记录:
利用Visual Basic ADODB对象调用服务器跟踪文件信息fn_trace_gettable存储过程,获取跟踪文件中的信息,然后根据sql语句insert into记录获取的存储信息。

Claims (3)

1.一种换流站控制保护系统数据库服务器故障在线监测的方法,其特征在于,通过sql语言直接建立服务器错误和警告事件的存储过程,然后通过Visual Basic应用程序直接实时调用存储过程,获取警告或错误事件的信息,达到快速定位故障;
其具体步骤方法如下:系统将自动搜索主机上所有服务器,提供给操作人员选择所需要监视的服务器;系统连接服务器;判断是否连接成功;设置警告和错误事件数据列的信息,追踪服务器的警告和错误事件,获取警告和故障信息;显示警告和错误事件的数据列信息,处理故障,保存故障信息,完成监视过程;
包括以下步骤:
步骤1: 启动系统时,系统将自动搜索所有有效的数据库服务器,同时将所有数据库名称导入到主界面的下拉菜单中,提供给工作人员选择使用;
步骤2:工作人员选择需要监视的服务器,通过ODBC应用程序接口来连接直流换流站的数据库服务器;
步骤3:判断服务器监视系统是否能正常连接到换流站数据库服务器;如果能则转向下一步,否则服务器监视系统的主界面显示连接失败提示并返回到步骤3;
步骤4:设置服务器监视系统的警告和错误事件数据列信息,对警告和错误事件进行筛选,实时跟踪服务器;
步骤5:判断服务器监视系统能否正常跟踪服务器事件;如果能则转向下一步,否则服务器监视系统的主界面显示连接失败提示,并返回到步骤4:
步骤6:服务器监视系统主界面显示跟踪的警告和错误事件数据列信息,暂停监视,根据事件类型判断服务器出现了什么故障,事件的文本值捕获故障信息,通过获得客户的计算机名称等等相关信息,根据数据列的信息定位故障,排除故障,然后保存这些数据列信息,最后启动监视,查看是否还有警告或错误事件,没有则退出运行完成监视过程,有则继续处理故障:
步骤7:服务器监视系统主界面没有显示警告和错误事件数据列信息,说明外部没有引起服务器发生故障,完成监视过程。
2.根据权利要求1所述一种换流站控制保护系统数据库服务器故障在线监测的方法,其特征在于,在步骤1中,需要查询主机应用程序接口ODBC配置了多少台数据库服务器,以供工作人员选择监视对象。
3.根据权利要求1所述一种换流站控制保护系统数据库服务器故障在线监测的方法,其特征在于,在步骤4中,进行筛选主要是去掉换流站常期存在的一些警告或错误事件,这些警告或错误并不影响换流站的工作,或是当警告或错误事件很多时,进行筛选。
CN201510505027.0A 2015-08-18 2015-08-18 一种换流站控制保护系统数据库服务器故障在线监测的方法 Active CN105159955B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510505027.0A CN105159955B (zh) 2015-08-18 2015-08-18 一种换流站控制保护系统数据库服务器故障在线监测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510505027.0A CN105159955B (zh) 2015-08-18 2015-08-18 一种换流站控制保护系统数据库服务器故障在线监测的方法

Publications (2)

Publication Number Publication Date
CN105159955A CN105159955A (zh) 2015-12-16
CN105159955B true CN105159955B (zh) 2018-03-27

Family

ID=54800811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510505027.0A Active CN105159955B (zh) 2015-08-18 2015-08-18 一种换流站控制保护系统数据库服务器故障在线监测的方法

Country Status (1)

Country Link
CN (1) CN105159955B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111090131A (zh) * 2019-12-16 2020-05-01 亿水泰科(北京)信息技术有限公司 雨量雷达智能预警系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101022363A (zh) * 2007-03-23 2007-08-22 杭州华为三康技术有限公司 网络存储设备的故障保护方法及装置
CN104699759A (zh) * 2015-02-10 2015-06-10 上海新炬网络信息技术有限公司 一种数据库自动化运行维护方法
CN104756082A (zh) * 2012-10-16 2015-07-01 微软公司 用于数据库应用的智能错误恢复

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7590666B2 (en) * 2006-06-16 2009-09-15 Microsoft Corporation Predicting capacity consumption in a memory component

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101022363A (zh) * 2007-03-23 2007-08-22 杭州华为三康技术有限公司 网络存储设备的故障保护方法及装置
CN104756082A (zh) * 2012-10-16 2015-07-01 微软公司 用于数据库应用的智能错误恢复
CN104699759A (zh) * 2015-02-10 2015-06-10 上海新炬网络信息技术有限公司 一种数据库自动化运行维护方法

Also Published As

Publication number Publication date
CN105159955A (zh) 2015-12-16

Similar Documents

Publication Publication Date Title
CN107037800B (zh) 基于客户端制氧设备远程故障诊断系统的故障诊断方法
EP3252556A2 (en) Wind farm supervision monitoring system
CN104125085B (zh) 一种基于esb的数据管控方法及装置
CN108667666A (zh) 一种基于可视化技术的智能运维方法及其系统
CN102722431B (zh) 进程监控方法及装置
CN103378982A (zh) 互联网业务运行监测方法和系统
CN108039015A (zh) 一种核电厂火警联动视频监控系统
CN103699111A (zh) 分布式监控系统的故障检测方法和装置
CN107066370A (zh) 一种自动监控并收集故障硬盘日志的工具及方法
CN107749778B (zh) 一种通信光缆故障预警方法及装置
CN110674021A (zh) 一种移动应用登录日志的检测方法及系统
CN104331766A (zh) 基于自动化健康管理的综合业务系统
WO2022252860A1 (zh) 一种事件处理方法、装置、计算机设备及存储介质
CN104036622A (zh) 一种基于互联网的报警服务信息发布系统
CN105159955B (zh) 一种换流站控制保护系统数据库服务器故障在线监测的方法
CN108011906A (zh) 具有智能监控功能的数字标牌管理系统及监控方法
CN106897189A (zh) 一种基于数据实时推送的日志监控系统
CN114500178B (zh) 一种自运维的智慧物联网关
WO2016127483A1 (zh) 一种采集适配器管理系统的处理方法和装置
JP2004094701A (ja) 監視情報表示システムと監視情報表示方法およびプログラムならびに監視装置
CN107273390A (zh) 基于sql脚本流媒体数据库的管理方法
CN110532146A (zh) 一种数据采集监控方法及装置
US9542250B2 (en) Distributed maintenance mode control
CN112131090B (zh) 业务系统性能监控方法及装置、设备及介质
KR20090026873A (ko) 배전 자동화 모의훈련 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant