CN117873408A - 一种云打印机数据恢复方法以及相关装置 - Google Patents
一种云打印机数据恢复方法以及相关装置 Download PDFInfo
- Publication number
- CN117873408A CN117873408A CN202410270282.0A CN202410270282A CN117873408A CN 117873408 A CN117873408 A CN 117873408A CN 202410270282 A CN202410270282 A CN 202410270282A CN 117873408 A CN117873408 A CN 117873408A
- Authority
- CN
- China
- Prior art keywords
- real
- time
- file
- log
- abnormal behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000011084 recovery Methods 0.000 title claims abstract description 48
- 206010000117 Abnormal behaviour Diseases 0.000 claims abstract description 179
- 230000000694 effects Effects 0.000 claims abstract description 123
- 230000006399 behavior Effects 0.000 claims abstract description 50
- 230000008439 repair process Effects 0.000 claims abstract description 50
- 238000001514 detection method Methods 0.000 claims abstract description 46
- 238000012545 processing Methods 0.000 claims abstract description 37
- 238000012544 monitoring process Methods 0.000 claims abstract description 24
- 230000002159 abnormal effect Effects 0.000 claims abstract description 22
- 230000008447 perception Effects 0.000 claims abstract description 11
- 238000009826 distribution Methods 0.000 claims description 65
- 238000004458 analytical method Methods 0.000 claims description 49
- 230000005540 biological transmission Effects 0.000 claims description 21
- 230000005856 abnormality Effects 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000010223 real-time analysis Methods 0.000 abstract description 8
- 238000007639 printing Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000007726 management method Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 239000002699 waste material Substances 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/12—Digital output to print unit, e.g. line printer, chain printer
- G06F3/1201—Dedicated interfaces to print systems
- G06F3/1223—Dedicated interfaces to print systems specifically adapted to use a particular technique
- G06F3/1229—Printer resources management or printer maintenance, e.g. device status, power levels
- G06F3/1234—Errors handling and recovery, e.g. reprinting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1469—Backup restoration techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/12—Digital output to print unit, e.g. line printer, chain printer
- G06F3/1201—Dedicated interfaces to print systems
- G06F3/1278—Dedicated interfaces to print systems specifically adapted to adopt a particular infrastructure
- G06F3/1285—Remote printer device, e.g. being remote from client or server
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/098—Distributed learning, e.g. federated learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请属于数据处理领域,尤其涉及一种云打印机数据恢复方法以及相关装置,该方法包括:实时监测云打印机的本地数据状态和/或设备运行情况,以构成实时活动日志;通过异常检测模型对实时活动日志进行实时分析,以识别实时活动日志中是否包含异常行为;若实时活动日志中包含异常行为,则对与异常行为关联的待处理文件进行文件修复处理,以实现云打印机中损坏数据的无感知修复。该方法能够通过异常检测模型实时分析以发现实时活动日志中的异常行为,并自动化修复异常行为,以达到云打印机中损坏数据的无感知修复,提高云打印机数据的恢复效率,提升用户体验。
Description
技术领域
本申请属于数据处理领域,尤其涉及一种云打印机数据恢复方法以及相关装置。
背景技术
在打印机作业过程中,可以处于不同的状态,包括等待RIP处理、RIP处理完成等待打印和打印完成。对应不同状态的作业,打印机控制器通常会有不同的作业队列。每个作业队列中可能包含成百上千个作业文件。随着作业处理状态的变化,作业所属的作业队列也会相应变化。
相关技术中,如果打印机出现异常或计算机系统发生未知崩溃,正在处理作业过程中的文件可能会被破坏。或者,如网络中断、用户误操作等问题,也可能会导致正在处理的文件被破坏。以作业中断为例,当尝试恢复打印机时,某些作业可能由于上次非正常退出而无法恢复到正常的作业列表状态。这些无法恢复的作业可能会被控制器丢弃。一旦出现上述情况,用户需要重新提交作业到打印机控制器。然而,由于作业数量繁多,很可能无法快速确定出现错误的作业,这可能会浪费用户的时间。
因此,为提升用户的打印体验,亟待提出一种全新的云打印机数据恢复方案,用以克服上述技术问题。
发明内容
本申请提供了一种云打印机数据恢复方法以及相关装置,用以通过异常检测模型实时分析以发现实时活动日志中的异常行为,并自动化修复异常行为,以达到云打印机中损坏数据的无感知修复,提高云打印机数据的恢复效率,提升用户体验。
第一方面,本申请提供了一种云打印机数据恢复方法,该方法包括:
实时监测云打印机的本地数据状态和/或设备运行情况,以构成实时活动日志;实时活动日志至少包括:每个本地文件的操作内容、操作时间、操作类型、操作者信息;
通过异常检测模型,对实时活动日志进行实时分析,以识别实时活动日志中是否包含异常行为;异常行为包括以下之一:设备硬件故障、网络故障、存储介质损坏、传输错误、文件损坏、文件格式错误、人为误操作;
若实时活动日志中包含异常行为,则对与异常行为关联的待处理文件进行文件修复处理,以实现云打印机中损坏数据的无感知修复。
第二方面,本申请实施例提供了一种云打印机数据恢复装置,该装置包括:
获取单元,被配置为实时监测云打印机的本地数据状态和/或设备运行情况,以构成实时活动日志;实时活动日志至少包括:每个本地文件的操作内容、操作时间、操作类型、操作者信息;
检测单元,被配置为通过异常检测模型,对实时活动日志进行实时分析,以识别实时活动日志中是否包含异常行为;异常行为包括以下之一:设备硬件故障、网络故障、存储介质损坏、传输错误、文件损坏、文件格式错误、人为误操作;
修复单元,被配置为若实时活动日志中包含异常行为,则对与异常行为关联的待处理文件进行文件修复处理,以实现云打印机中损坏数据的无感知修复。
第三方面,本申请实施例提供了一种计算设备,所述计算设备包括:
至少一个处理器、存储器和输入输出单元;
其中,所述存储器用于存储计算机程序,所述处理器用于调用所述存储器中存储的计算机程序来执行第一方面的云打印机数据恢复方法。
第四方面,提供了一种计算机可读存储介质,其包括指令,当其在计算机上运行该指令时,使得计算机执行第一方面的云打印机数据恢复方法。
本申请实施例提供的技术方案中,首先,实时监测云打印机的本地数据状态和/或设备运行情况,以构成实时活动日志。其中,实时活动日志至少包括:每个本地文件的操作内容、操作时间、操作类型、操作者信息。这样,通过实时监测云打印机的本地数据状态和设备运行情况,可以实时追踪云打印机在执行打印任务的过程中出现的设备硬件故障、网络故障等问题。例如,如果打印机出现硬件故障(如打印头问题或传送带故障),该信息将被记录在实时活动日志中。这能够促使后续步骤及时采取措施维修或更换设备,以确保打印机的正常运行。进而,通过异常检测模型,对实时活动日志进行实时分析,以识别实时活动日志中是否包含异常行为。其中,异常行为包括以下之一:设备硬件故障、网络故障、存储介质损坏、传输错误、文件损坏、文件格式错误、人为误操作。最终,若实时活动日志中包含异常行为,则对与异常行为关联的待处理文件进行文件修复处理。这样,能够实现云打印机中损坏数据的无感知修复,避免因打印任务的中断、延误带来用户体验下降。
本申请技术方案中,通过异常检测模型实时分析以发现实时活动日志中的异常行为,并自动化修复异常行为,以达到云打印机中损坏数据的无感知修复,提高云打印机数据的恢复效率,提升用户体验。同时,通过实时监测活动日志以及异常检测模型,能够及时发现设备故障、网络问题、存储介质问题、传输错误、文件损坏、文件格式错误、人为误操作等异常行为,并且能够针对相关的待处理文件进行修复处理,有助于保护数据的完整性、提高系统的可靠性,并减少人为误操作对数据造成的负面影响。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请实施例的一种云打印机数据恢复方法的流程示意图;
图2是本申请实施例的一种异常检测模型的原理示意图;
图3是本申请实施例的一种异常行为预测层的原理示意图;
图4是本申请实施例的一种文件修复处理的原理示意图;
图5是本申请实施例的一种损坏模式分析模型的原理示意图;
图6是本申请实施例的一种云打印机数据恢复装置的结构示意图;
图7是本申请实施例的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。
在打印机作业过程中,可以处于不同的状态,包括等待RIP处理、RIP处理完成等待打印和打印完成。对应不同状态的作业,打印机控制器通常会有不同的作业队列。每个作业队列中可能包含成百上千个作业文件。随着作业处理状态的变化,作业所属的作业队列也会相应变化。
相关技术中,如果打印机出现异常或计算机系统发生未知崩溃,正在处理作业过程中的文件可能会被破坏。或者,如网络中断、用户误操作等问题,也可能会导致正在处理的文件被破坏。以作业中断为例,当尝试恢复打印机时,某些作业可能由于上次非正常退出而无法恢复到正常的作业列表状态。这些无法恢复的作业可能会被控制器丢弃。一旦出现上述情况,用户需要重新提交作业到打印机控制器。然而,由于作业数量繁多,很可能无法快速确定出现错误的作业,这可能会浪费用户的时间。
因此,为提升用户的打印体验,亟待提出一种全新的云打印机数据恢复方案,用以克服上述技术问题。
为解决上述至少一个技术问题,本申请实施例提供了一种云打印机数据恢复方法以及相关装置。
具体而言,云打印机数据恢复方案中,首先,实时监测云打印机的本地数据状态和/或设备运行情况,以构成实时活动日志。其中,实时活动日志至少包括:每个本地文件的操作内容、操作时间、操作类型、操作者信息。这样,通过实时监测云打印机的本地数据状态和设备运行情况,可以实时追踪云打印机在执行打印任务的过程中出现的设备硬件故障、网络故障等问题。例如,如果打印机出现硬件故障(如打印头问题或传送带故障),该信息将被记录在实时活动日志中。这能够促使后续步骤及时采取措施维修或更换设备,以确保打印机的正常运行。进而,通过异常检测模型,对实时活动日志进行实时分析,以识别实时活动日志中是否包含异常行为。其中,异常行为包括以下之一:设备硬件故障、网络故障、存储介质损坏、传输错误、文件损坏、文件格式错误、人为误操作。最终,若实时活动日志中包含异常行为,则对与异常行为关联的待处理文件进行文件修复处理。这样,能够实现云打印机中损坏数据的无感知修复,避免因打印任务的中断、延误带来用户体验下降。具体来说,通过实时活动日志的记录,异常检测模型能够识别出存储介质损坏和传输错误等问题。例如,如果活动日志中出现文件读写错误、存储介质不可访问或传输错误的信息,可以及时发现并采取措施修复或更换存储介质,避免数据丢失或损坏。同时,当实时活动日志中包含不能正常处理的文件、文件损坏或文件格式错误等异常行为时,异常检测模型可以识别出这些问题。接着,针对与异常行为相关的待处理文件,可以进行文件修复处理。修复过程可以采用数据恢复算法和技术,如文件恢复、数据校验和同类文件特征分析等手段,以尽可能地恢复文件的完整性和可读性。并且,通过实时活动日志中记录的操作内容、操作时间、操作类型和操作者信息,可以追踪和识别人为误操作。异常检测模型能够分析这些信息,识别出异常的人为误操作行为。通过即时发现和纠正这些问题,可以减少由于误操作导致的数据丢失或错误打印等情况,提高系统的可靠性和数据完整性。
在云打印机数据恢复方案中,通过异常检测模型实时分析以发现实时活动日志中的异常行为,并自动化修复异常行为,以达到云打印机中损坏数据的无感知修复,提高云打印机数据的恢复效率,提升用户体验。同时,通过实时监测活动日志以及异常检测模型,能够及时发现设备故障、网络问题、存储介质问题、传输错误、文件损坏、文件格式错误、人为误操作等异常行为,并且能够针对相关的待处理文件进行修复处理,有助于保护数据的完整性、提高系统的可靠性,并减少人为误操作对数据造成的负面影响。
本申请实施例提供的云打印机数据恢复方案,可以由一电子设备来执行,该电子设备可以是服务器、服务器集群、云服务器。该电子设备也可以是诸如手机、计算机、平板电脑、可穿戴设备、或者专用设备(如带有云打印机数据恢复系统的专用终端设备等)等终端设备。在一可选实施例中,该电子设备上可以安装有用于执行云打印机数据恢复方案的服务程序。本申请实施例的云打印机可以是热敏打印机、票据打印机、条码打印机等等,该云打印机可以应用领域包括但是不限于商超、餐饮(外卖)、零售、物流等领域。
图1为本申请实施例提供的一种云打印机数据恢复方法的示意图,如图1所示,该方法包括以下步骤:
101,实时监测云打印机的本地数据状态和/或设备运行情况,以构成实时活动日志。
本申请实施例中,实时活动日志至少包括:每个本地文件的操作内容、操作时间、操作类型、操作者信息。
举例来说,假设在云打印机本地的系统中实时检测并记录有一个实时活动日志记录,该日志记录了云打印机中每个本地文件的操作内容、操作时间、操作类型和操作者信息。
101中,首先,通过在云打印机本地的系统中引入监控软件或监控设备,可以实时监测云打印机的数据状态和设备运行情况。这些监控工具可以定期检查数据的读写状态、传输情况、设备连接状态以及其他关键指标,以便及时掌握系统运行情况。
当引入监控工具来实时监测云打印机的数据状态和设备运行情况时,以网络监控工具为例,使用Ping工具可以检测云打印机的可达性和网络连接延迟。通过周期性地发送一个ICMP回显请求到云打印机,并接收回显应答,可以确定设备是否在线以及网络质量。简单网络管理协议(Simple Network Management Protocol,SNMP)是一种用于网络设备管理的标准协议。通过使用SNMP协议,监控软件可以周期性地查询云打印机的SNMP代理,获取设备的状态信息,如CPU利用率、内存使用情况等。Syslog是一种标准化的日志消息传输协议。云打印机可以将关键事件和状态信息记录为日志,并通过Syslog协议发送到中央日志服务器。监控软件可以通过解析和分析Syslog消息来获得实时的设备运行情况。
以文件监控工具为例,监控软件可以监听云打印机本地的系统中关键文件的读写状态。通过监控文件系统的事件,可以检测新文件的创建、旧文件的修改或删除,以及文件的大小变化等。这样可以及时发现文件读写异常或错误情况。
以状态采集工具为例,在Windows管理规范(Windows ManagementInstrumentation,WMI)下,对于基于Windows操作系统的云打印机,可以使用WMI来获取系统和设备的状态信息。监控软件可以通过查询WMI提供的类和属性来获取云打印机本地的系统的各种指标,如CPU利用率、磁盘空间使用情况等。在Java管理规范(Java ManagementExtensions,JMX)下,对于基于Java的云打印机应用,可以使用JMX来监控应用程序的状态和性能。通过暴露MBeans(管理Bean),可以获取应用程序的各种指标,如内存使用情况、线程数等。
可以理解的是,以上是一些监控工具和技术示例,通过上述示例性方式可以用于实时监测云打印机的数据状态和设备运行情况。实际应用中,具体选择适用工具和技术取决于云打印机本地的系统的架构、操作系统和应用程序等因素。
进而,101中,由监控工具构建的实时监控机制的基础上,需要将获取到的数据状态和运行情况记录下来,形成实时活动日志。这些日志至少应包括每个文件的操作内容、操作时间、操作类型和操作者等关键信息。同时,也可以记录其他相关信息,如设备连接状态变化、传输错误信息等。示例性地,“打印文件”对应的实时活动日志中至少包括:
操作内容:打印文件;
操作文档名称(或者其他文件标识信息);
操作时间:2024-02-04 09:00:00;
操作类型:打印;
操作者信息:John Doe (员工编号: 12345)。
另一示例中,“删除文件”对应的实时活动日志中至少包括:
操作内容:删除文件;
操作文档名称(或者其他文件标识信息);
操作时间:2024-02-04 11:30:00;
操作类型:删除;
操作者信息:Jane Smith (员工编号: 67890)。
再一示例中,“复制文件”对应的实时活动日志中至少包括:
操作内容:复制文件;
操作文档名称(或者其他文件标识信息);
操作时间:2024-02-04 14:15:00;
操作类型:复制;
操作者信息:Alice Johnson (管理员)。
通过记录这些信息,实时活动日志可以提供详细的操作记录,包括文件的具体操作内容(如打印、删除、复制、重命名等),操作发生的时间,以及进行操作的人员的信息(如姓名、员工编号等)。这些日志记录可以帮助跟踪和管理本地文件的操作情况,进一步分析、审计云打印机本地的系统的使用情况,以及识别和解决潜在的问题。
当然,除了文档之外,本地文件还可以是图像、网页,或其他形式的文件数据。
102中,通过异常检测模型,对实时活动日志进行实时分析,以识别实时活动日志中是否包含异常行为。
本申请实施例中,异常行为包括以下之一:设备硬件故障、网络故障、存储介质损坏、传输错误、文件损坏、文件格式错误、人为误操作。
其中,设备硬件故障,指打印机硬件部件发生故障或损坏,如打印头故障、传感器失效等。这种故障会导致打印机无法正常工作或产生错误的打印结果。网络故障,指与云打印机连接的网络出现故障或中断,可能是由于网络设备故障、网络延迟过高、网络连接不稳定等原因导致无法正常传输打印任务或获取打印机状态信息。存储介质损坏,指云打印机所使用的存储介质(如硬盘、闪存)发生损坏或故障,导致打印机无法读取或写入数据,从而无法完成打印任务。传输错误,指在打印任务传输过程中出现的错误,可能是由于网络传输不稳定、数据包丢失、传输协议错误等原因导致打印数据损坏或丢失。文件损坏,指打印任务中的文件在传输或存储过程中发生损坏,导致无法正确解析或打印文件内容。文件格式错误,指打印任务中的文件格式与打印机不兼容或不支持,无法正确解析或打印文件内容。人为误操作,指操作人员在使用云打印机时出现的错误操作,如错误设置打印参数、选择错误文件进行打印等,导致打印结果异常或失败。
通过异常检测模型对实时活动日志进行分析,可以利用实时活动日志中包含的本地文件信息以及操作信息来检测这些异常行为,并及时发出警报或采取相应的措施,从而提高云打印机的可靠性和稳定性。
作为一个可选实施例,假设异常检测模型至少包括以下结构:特征提取层、分布模式学习层、异常行为预测层、行为预警层。
基于上述结构,102中通过异常检测模型,对实时活动日志进行实时分析,以识别实时活动日志中是否包含异常行为,如图2所示,可以实现为如下步骤:
201,通过特征提取层,从实时活动日志中提取实时日志特征。
其中,实时日志特征至少包括时间窗特征、日志级别分布特征、行为类型特征、日志噪声统计特征。
实际应用中,可以通过多分支特征提取单元,从实时日志特征中分别提取得到上述特征。具体来说,时间窗特征是将实时活动日志按时间窗口进行划分,并计算每个时间窗口内的日志数量或日志发生频率。日志级别分布特征是统计各个日志级别(如DEBUG、INFO、WARN、ERROR等)在时间窗口内的分布情况。行为类型特征是通过文本挖掘或基于规则匹配的方法,提取日志中的关键词、短语或模式,以识别特定的行为类型。日志噪声统计特征是计算日志中的噪声比例(如无效日志、重复日志等)以及异常日志占比。
202,通过分布模式学习层,对实时日志特征进行潜在行为分析,并基于分析得到的潜在行为分布模式,重构实时日志特征,以获得实时日志重构编码特征。
这一步骤中,通过对实时日志特征进行潜在行为分析,重构实时日志特征,以获得实时日志重构编码特征。该层可采用无监督学习的方法,如聚类算法(如K-means、DBSCAN等)、主成分分析(PCA)或自编码器等,来学习实时日志特征的潜在分布模式,并将学习到的潜在分布模式重新编码为实时日志重构特征。
实际应用中,作为一个可选实施例,分布模式学习层中获得实时日志重构编码特征的过程,表示为如下表达式:;
其中,表示对第1到第i个聚类中心特征的加权求和,/>表示潜在行为分布模式hi的映射函数,/>是通过分布模式学习层中将实时日志特征分析得到的第i个聚类中心特征对应的潜在行为分布模式,/>是通过分布模式学习层中将实时日志特征分析得到的第i-1个聚类中心特征对应的潜在行为分布模式,/>是分布模式学习层的权重参数矩阵,/>是第 i 个聚类中心特征对应的参数,/>是分布模式学习层的偏置参数,/>是分布模式学习层的重构映射函数。
203,通过异常行为预测层,基于实时日志特征与实时日志重构编码特征,判断实时活动日志中是否包含异常行为。
这一步骤意在,通过将实时日志特征与实时日志重构编码特征作为输入,以便区分实时活动日志中的正常行为和异常行为。值得说明的是,通过实时日志特征与重构编码特征的比较,可以区分正常行为和异常行为的原因是因为异常行为在特征表现上通常会与正常行为存在差异。
在异常检测模型中,实时日志特征是从原始实时活动日志中提取得到的,可以反映系统活动的各种指标和属性。这些特征包含了系统正常运行时的行为模式,因此当系统出现异常行为时,这些特征可能会显示出与正常情况不一致的变化。例如,突然出现大量错误级别的日志、异常行为的时间窗口特征明显偏离正常行为模式等。
而重构编码特征是利用分布模式学习层对实时日志特征进行重构得到的。分布模式学习层会根据实时日志特征的潜在分布模式进行编码和重构,从而提取出隐藏在数据中的更高级别的表示。如果系统出现异常行为,这些重构编码特征可能无法有效地还原出原始的正常行为模式。
通过将实时日志特征与重构编码特征进行比较,模型能够发现实时日志特征与重构编码特征之间的差异。这些差异可能反映了系统当前状态与正常行为之间的不一致。如果差异超过了事先设定的阈值或被识别为异常模式,就可以判断当前的行为是异常行为。总之,通过将实时日志特征与重构编码特征进行比较,异常检测模型能够捕捉到异常行为与正常行为之间的差异,从而帮助区分正常行为和异常行为。
在203的一个可选实施例中,通过异常行为预测层,基于实时日志特征与实时日志重构编码特征,判断实时活动日志中是否包含异常行为,如图3所示,可以实现为:
301,对实时日志特征与对应的实时日志重构编码特征进行差异性预测,以获得实时日志特征对应的差异性预估分数;
302,基于差异性预估分数,构建实时活动日志对应的差异性分布集合;
303,采用异常行为动态阈值对差异性分布集合中的各个行为元素进行评估;
304,若差异性分布集合中包含差异性分布值高于异常行为动态阈值的异常行为元素,则确定实时活动日志中包含异常行为。
具体来说,301中,对实时日志特征与对应的实时日志重构编码特征进行差异性预测,以获得实时日志特征对应的差异性预估分数。这一步骤可以建立实时日志特征与重构编码特征之间的差异性预测模型。进而,通过输入实时日志特征和重构编码特征,采用该差异性预测模型计算出某个时间窗口内实时日志特征的差异性程度,并将该差异性程度转换为差异性预估分数。
302中,基于差异性预估分数,构建出实时活动日志对应的差异性分布集合。将实时日志特征与预测得到的差异性预估分数进行匹配,将每个时间窗口内的实时日志特征按照差异性预估分数进行分组或排序,形成差异性分布集合。
303中,采用异常行为动态阈值对差异性分布集合中的各个行为元素进行评估。异常行为动态阈值可以根据历史数据或预先定义的规则进行确定。对于每个行为元素,比较其差异性预估分数与动态阈值的大小关系,判断其是否为异常行为。当然,实际应用中,异常行为动态阈值也可以根据实时检测情况以及所处的应用场景进行动态设置。
304中,若差异性分布集合中包含差异性分布值高于异常行为动态阈值的异常行为元素,则确定实时活动日志中包含异常行为。根据异常行为的具体需求,可以将异常行为进行记录、报警或采取其他相应的处理措施。
通过上述步骤,可以实现基于实时日志特征与实时日志重构编码特征的异常行为预测。通过差异性预测和动态阈值的判断,可以准确地识别实时活动日志中的异常行为,帮助及时发现、分析和应对潜在的风险和问题。
作为一个可选实施例,假设异常检测模型还包括:异常行为定位层。基于上述假设,通过异常行为定位层,基于异常行为元素在差异性分布集合中所处的分布位置,获取异常行为元素对应的实时日志索引概率。通过应用实时日志索引概率,可以更准确地定位、度量以及解释异常行为,这将有助于提高异常行为检测的可靠性和准确性,并为系统操作人员或处理算法提供更好的决策依据,以解决异常行为带来的问题。
通过以上步骤,实时日志索引概率可以用于定位异常行为元素在实时活动日志中的位置。较高的实时日志索引概率表示该行为元素在整个实时活动日志中更为突出,可能是重要的异常行为点。通过分析概率较高的索引位置,可以更精确地确认异常行为发生的时间和位置。并且,实时日志索引概率可以用于相对度量不同异常行为元素之间的异常程度。相对于邻居顺序中包含的其他异常行为元素,实时日志索引概率较高的元素可以被视为相对较为突出的异常,可能需要更加紧急的关注和处理。
此外,实时日志索引概率的计算中还涉及到局部离群因子的英文(Local OutlierFactor,LOF)的计算。LOF是一种度量异常程度的方法,可以衡量一个数据点相对于其邻居数据点的离群程度。实时日志索引概率的计算将邻居局部离群因子与异常行为元素的离群程度联系起来。这有助于更全面地理解异常行为元素的异常性,并为之后的进一步分析和处理提供辅助信息。
实际应用中,实时日志索引概率为实时活动日志中各处存在异常实时操作数据的概率值;实时日志索引概率的获取过程表示为如下公式:;
其中,p(t)表示第t个异常行为元素的实时日志索引概率,N(t)表示与第t个异常行为元素相邻的邻居索引集合,局部离群因子LOF(j)表示异常实时操作数据点j位于局部邻域内相对于其邻居数据点的离群程度,局部离群因子LOF(t)表示异常实时操作数据点t位于局部邻域内相对于其邻居数据点的离群程度,k表示邻居数量。
103中,若实时活动日志中包含异常行为,则对与异常行为关联的待处理文件进行文件修复处理,以实现云打印机中损坏数据的无感知修复。
具体介绍实现云打印机中损坏数据的无感知修复的步骤如下:
在103之前,需要通过异常检测模型对实时活动日志执行异常行为检测,例如按照之前提到的步骤301至304,基于实时日志特征与实时日志重构编码特征判断实时活动日志中是否包含异常行为。如果检测到异常行为存在,则进行下一步处理。进而,根据异常行为检测结果来定位具体的异常行为元素在实时活动日志中的位置。通过实时日志索引概率的计算,可以得到异常行为元素的位置信息,以及其与邻居数据点的离群程度。最终,103中,根据异常行为的位置信息,在云打印机本地的系统中找到与异常行为关联的待处理文件。这些文件可能是由于异常行为导致的数据损坏或错误。对于关联的待处理文件,采取文件修复处理措施。具体的修复方法可能取决于损坏的数据类型和原因。修复可以包括但不限于以下操作:重新生成错误数据、恢复或重建丢失的数据、修复数据结构或校正错误。修复处理的目标是将损坏的数据恢复到正常状态,以确保后续的打印工作和数据处理不受影响。
另外,为了进一步提升用户体验,修复过程可以是无感知的,即不会对用户的打印操作造成中断或明显影响。这意味着修复过程应该在后台进行,并且应该尽量快速和高效,以确保用户能够继续使用云打印机,同时无需等待修复完成。
通过以上步骤,实现云打印机中损坏数据的无感知修复。通过异常行为检测和定位,可以准确找到异常行为元素,并关联到相应的待处理文件。然后,在修复过程中,根据具体情况采取适当的修复方法,使损坏的数据恢复到正常状态,保证用户的打印工作不受影响。最后,修复过程应该是无感知的,不会中断用户的使用体验。
上述步骤中,对与异常行为关联的待处理文件进行文件修复处理,如图4所示,可以实现为:
401,从云打印机的本地文件系统中,获取与异常行为关联的待处理文件;
402,采用损坏模式分析模型,对待处理文件进行损坏情况分析,以得到待处理文件的损坏情况分析结果;
403,根据损坏情况分析结果,对待处理文件执行匹配的文件恢复操作,并将恢复后的待处理文件更新至本地文件系统中。
示例性地,401中,根据异常行为定位的结果,确定与异常行为关联的待处理文件的文件路径或标识。从云打印机的本地文件系统中,根据文件路径或标识,获取待处理文件的原始数据。402中,使用预先训练好的损坏模式分析模型,对待处理文件进行分析。损坏模式分析模型可以根据文件的特征、结构以及可能的损坏模式,对待处理文件进行损坏情况的分析和检测。损坏模式分析模型可以识别出文件的损坏位置、类型和程度等信息。403中,根据损坏情况分析结果,选择合适的文件恢复操作。例如,如果损坏是由于数据块丢失导致的,可以使用冗余数据或纠错码进行数据恢复。如果损坏是由于数据错误导致的,可以尝试使用错误纠正算法进行数据校正。执行文件恢复操作,并将恢复后的待处理文件更新至云打印机的本地文件系统,确保后续的打印工作能够使用修复后的文件。更新后的文件应具有正确的数据和结构,以保证用户的打印操作的顺利进行。
需要注意的是,根据具体的需求和系统环境,可以选择对应处理方式来实现步骤401至403,以实现云打印机中损坏数据的无感知修复。
作为一个可选实施例中,假设损坏模式分析模型至少包括以下结构:特征编码层、特征解码层、损坏模式分析层。基于上述结构,402中,采用损坏模式分析模型,对待处理文件进行损坏情况分析,以得到待处理文件的损坏情况分析结果,如图5所示,可以实现为:
501,通过特征编码层,从待处理文件中提取原始损坏特征,并对原始损坏特征进行特征编码处理,以获得损坏编码特征;
502,通过特征解码层,将损坏编码特征进行特征解码处理,以获得重构解码特征;
503,通过损坏模式分析层,以重构解码特征与原始损坏特征之间的差异信息作为待处理文件对应的重构损失;
504,基于重构损失计算待处理文件中的损坏程度分析结果。
其中,原始损坏特征可以是文件的不同属性、数据块的分布情况、数据结构、校验和等信息,用于表示文件的属性和结构特征。
在特征解码后,比较重构解码特征与原始损坏特征之间的差异。上述步骤得到的差异信息代表待处理文件对应的重构损失,即损坏程度。这里的损坏程度可以理解为文件数据的完整性和可用性的指标。例如,重构解码特征与原始损坏特征的差异可以反映出文件数据的丢失、破坏或错误。差异信息的大小和性质用于表示文件损坏的严重程度。通过损坏模式分析层的计算,可以基于差异信息和其他损坏模式的分析结果,量化待处理文件的损坏程度。这有助于判断文件是否可修复以及选择适当的修复策略。
损坏程度的计算结果可以是一个指标,用于描述待处理文件的损坏程度。这个指标可以是一个数值,例如损坏程度的百分比或绝对值,或者是一个分类,例如轻微、中等、严重或不可修复。这取决于具体情况和损坏模式分析模型的设计。通过计算损坏程度,可以更好地了解待处理文件的损坏情况,并为后续的文件修复操作提供可行性和指导。
本申请实施例中,通过异常检测模型实时分析以发现实时活动日志中的异常行为,并自动化修复异常行为,以达到云打印机中损坏数据的无感知修复,提高云打印机数据的恢复效率,提升用户体验。同时,通过实时监测活动日志以及异常检测模型,能够及时发现设备故障、网络问题、存储介质问题、传输错误、文件损坏、文件格式错误、人为误操作等异常行为,并且能够针对相关的待处理文件进行修复处理,有助于保护数据的完整性、提高系统的可靠性,并减少人为误操作对数据造成的负面影响。
在上述或下述实施例中,本申请实施例还提供了一种数据冗余备份机制。进一步可选地,为云打印机建立数据冗余备份机制。即将数据存储在多个位置,以防止单点故障。这可以提高数据恢复的准确率和效率,因为即使一个位置的数据损坏,仍然可以从其他位置恢复。
若实时活动日志中包含异常行为,并且异常行为导致本地文件系统中存储的待处理文件丢失,则从云打印机关联的冗余备份系统中,查询与异常行为关联的备份文件,并将查询到的备份文件重新载入到本地文件系统中。
其中,冗余备份系统至少包括:多个云存储节点、冗余备份服务器。具体来说,多个云存储节点是分布在不同地理位置的物理或虚拟存储设备。每个云存储节点都可以独立地存储数据,并具有高可用性和冗余能力。这些节点之间可能采用不同的数据复制技术,如镜像、副本或分片等。冗余备份服务器是负责管理和维护冗余备份系统的中心控制节点,负责与云存储节点之间的数据同步和复制操作。冗余备份服务器可以使用复制、同步或备份策略来保证数据的一致性和可靠性。
基于上述数据冗余备份机制,进一步可选地,在查询与异常行为关联的备份文件之前,还可以检测本地文件系统中是否载入新增的本地文件。若检测到新增的本地文件,则生成新增的本地文件对应的备份标识。进而,将新增的本地文件上传至冗余备份系统中,并将新增的本地文件插入备份标识在冗余备份系统中对应的存储空间。
在上述数据冗余备份机制的基础上,确保冗余备份系统中包含本地文件系统中的新增文件,可以进一步提升数据的完整性和备份的可靠性。
首先,上述步骤中,监控本地文件系统的变动,可通过定期扫描或实时监测的方式。检测新增文件的方式可以是基于文件的创建时间、修改时间或其它属性等。进而,当检测到本地文件系统中有新增文件时,生成相应的备份标识,用于在冗余备份系统中进行关联和存储。备份标识可以是文件的路径、文件名、唯一标识符或其他特定标识。接着,使用备份标识将新增文件上传至冗余备份系统中的相应存储空间。上传可以通过网络传输或其他适配的方式进行,确保文件能够被准确备份到冗余备份服务器或云存储节点。最终,在冗余备份系统中,为新增文件的备份标识创建对应的存储空间,用于存储备份文件。存储空间可以是独立的目录、文件夹或其他专门用于存储备份文件的容器。
通过以上步骤,可以确保本地文件系统中新增的文件能够被正确备份到冗余备份系统中。这样,不仅可以在异常行为导致本地文件丢失时进行恢复,还可以在出现其他故障或数据丢失的情况下,通过冗余备份系统中已有的备份文件保障数据的可靠性和完整性。
需要注意的是,冗余备份系统中的备份标识和存储空间应当与本地文件系统中的新增文件进行同步和更新,以保持数据的一致性和正确性。同时,对于已备份到冗余备份系统的文件,还可以根据需求制定相应的数据保留策略和定期清理策略,以避免不必要的数据冗余和存储浪费。
进而,在步骤101的一个可选实施例中,获取与新增的本地文件关联的实时操作数据;在构建实时活动日志的过程中,将新增的本地文件的实时操作数据关联至备份标识。
本申请实施例中,实时操作数据可以包括对新增文件的读取、写入、修改、删除等操作的记录。这些数据可以通过监控文件系统的系统调用、API调用或其他可获得数据的方式进行获取。通过跟踪文件的访问记录,可以获得与新增文件关联的实时操作数据。
实时活动日志是用于记录系统中发生的实时操作的记录。在构建实时活动日志的过程中,将新增的本地文件的实时操作数据与备份标识进行关联。备份标识可以作为实时活动日志的一个字段,记录与新增文件相关的操作记录。
实际上,通过关联新增文件的实时操作数据至备份标识,可以使得实时活动日志中的异常行为和操作记录更加精准和完整。这样,在发生异常行为并且导致本地文件丢失时,可以通过实时活动日志中的记录判断异常行为对应的备份标识,并从冗余备份系统中查询相关的备份文件进行恢复。
此外,关联实时操作数据还可以为后续的数据审计、故障分析和安全监控等提供更全面的信息,有助于系统运维和问题排查。
需要注意的是,在构建实时活动日志的过程中,应该保证数据的准确性和一致性,确保实时操作数据和备份标识的正确关联,并采取必要的安全控制措施,以防止日志数据被篡改或访问权限被滥用。
通过以上操作,可以进一步增强冗余备份系统的功能,提高数据恢复的准确性和效率,并提供更全面的实时活动日志,以满足对数据安全性和业务可控性的要求。
上述步骤中,从云打印机关联的冗余备份系统中,查询与异常行为关联的备份文件,可以实现为:基于包含异常行为的实时操作数据、以及实时操作数据与备份标识的关联关系,获取与异常行为关联的备份标识;通过获取到的备份标识,在云打印机关联的冗余备份系统中查询对应的备份文件。
示例性地,首先,获取与异常行为关联的实时操作数据,即通过实时活动日志或其他方式,获取包含异常行为的实时操作数据。这些实时操作数据可以包括异常文件的读取、写入、修改、删除等操作的记录。进而,通过实时操作数据和备份标识的关联关系获取备份标识。具体地,根据实时操作数据中记录的文件信息,确定与异常行为相关的文件的备份标识。实时操作数据中可能包含备份标识的字段或关联字段,可利用这些信息来确定备份标识。继而,利用获取到的备份标识,在云打印机关联的冗余备份系统中进行查询。查询可能需要通过备份标识与冗余备份系统中的存储空间或文件索引进行匹配和定位。最终,通过查询操作,从冗余备份系统中获取与异常行为关联的备份文件。其中,备份文件可以是完整的文件副本,或者是文件的增量备份或差异备份。通过上述过程,可以根据异常行为关联的实时操作数据和备份标识的关联关系,从冗余备份系统中获取与异常行为关联的备份文件。这样,即使本地文件系统中的文件由于异常行为导致丢失,仍然能够通过冗余备份系统中的备份文件进行恢复。
在实施过程中,需要确保实时操作数据的准确性和一致性,以及备份标识与冗余备份系统中存储空间或文件索引的匹配关系的正确性。此外,为了提高查询效率,可以采用合适的索引技术或缓存策略来优化查询操作。
此外,实际应用中,为进一步加强数据保护措施,还可以对云打印机的本地文件实施加密存储、定期备份等保护方式,以提高数据的安全性和可靠性。
本申请实施例中,通过引入冗余备份系统,即将数据存储在多个位置,可以提高数据恢复的准确率和效率。即使在本地文件系统中的待处理文件丢失的情况下,可以通过查询冗余备份系统中的备份文件来恢复数据,从而保证云打印机的正常操作和数据的安全性。
在本申请的又一实施例中,还提供了一种云打印机数据恢复装置,参见图6所示,该装置包括以下单元:
获取单元,被配置为实时监测云打印机的本地数据状态和/或设备运行情况,以构成实时活动日志;实时活动日志至少包括:每个本地文件的操作内容、操作时间、操作类型、操作者信息;
检测单元,被配置为通过异常检测模型,对实时活动日志进行实时分析,以识别实时活动日志中是否包含异常行为;异常行为包括以下之一:设备硬件故障、网络故障、存储介质损坏、传输错误、文件损坏、文件格式错误、人为误操作;
修复单元,被配置为若实时活动日志中包含异常行为,则对与异常行为关联的待处理文件进行文件修复处理,以实现云打印机中损坏数据的无感知修复。
进一步可选地,所述异常检测模型至少包括:特征提取层、分布模式学习层、异常行为预测层、行为预警层;所述检测单元,具体被配置为:
通过所述特征提取层,从所述实时活动日志中提取实时日志特征;所述实时日志特征至少包括时间窗特征、日志级别分布特征、行为类型特征、日志噪声统计特征;
通过所述分布模式学习层,对所述实时日志特征进行潜在行为分析,并基于分析得到的潜在行为分布模式,重构所述实时日志特征,以获得实时日志重构编码特征;
通过所述异常行为预测层,基于所述实时日志特征与所述实时日志重构编码特征,判断所述实时活动日志中是否包含异常行为。
进一步可选地,所述检测单元,通过所述异常行为预测层,基于所述实时日志特征与所述实时日志重构编码特征,判断所述实时活动日志中是否包含异常行为,具体被配置为:
对所述实时日志特征与对应的实时日志重构编码特征进行差异性预测,以获得所述实时日志特征对应的差异性预估分数;
基于所述差异性预估分数,构建所述实时活动日志对应的差异性分布集合;
采用异常行为动态阈值对所述差异性分布集合中的各个行为元素进行评估;
若所述差异性分布集合中包含差异性分布值高于异常行为动态阈值的异常行为元素,则确定所述实时活动日志中包含异常行为。
进一步可选地,所述分布模式学习层中获得实时日志重构编码特征的过程,表示为如下公式:;
其中,表示对第1到第i个聚类中心特征的加权求和,/>表示潜在行为分布模式hi的映射函数,/>是通过分布模式学习层中将实时日志特征分析得到的第i个聚类中心特征对应的潜在行为分布模式,/>是通过分布模式学习层中将实时日志特征分析得到的第i-1个聚类中心特征对应的潜在行为分布模式,/>是分布模式学习层的权重参数矩阵,/>是第 i 个聚类中心特征对应的参数,/>是分布模式学习层的偏置参数,/>是分布模式学习层的重构映射函数。
进一步可选地,所述异常检测模型还包括:异常行为定位层;所述检测单元,还被配置为:
通过所述异常行为定位层,基于所述异常行为元素在所述差异性分布集合中所处的分布位置,获取异常行为元素对应的实时日志索引概率;
其中,所述实时日志索引概率为所述实时活动日志中各处存在异常实时操作数据的概率值;所述实时日志索引概率的获取过程表示为如下公式:;
其中,p(t)表示第t个异常行为元素的实时日志索引概率,N(t)表示与第t个异常行为元素相邻的邻居索引集合,局部离群因子LOF(j)表示异常实时操作数据点j位于局部邻域内相对于其邻居数据点的离群程度,局部离群因子LOF(t)表示异常实时操作数据点t位于局部邻域内相对于其邻居数据点的离群程度,k表示邻居数量。
进一步可选地,所述修复单元,具体被配置为:
从云打印机的本地文件系统中,获取与所述异常行为关联的待处理文件;
采用损坏模式分析模型,对所述待处理文件进行损坏情况分析,以得到所述待处理文件的损坏情况分析结果;
根据损坏情况分析结果,对所述待处理文件执行匹配的文件恢复操作,并将恢复后的所述待处理文件更新至本地文件系统中。
进一步可选地,所述损坏模式分析模型至少包括:特征编码层、特征解码层、损坏模式分析层;所述修复单元,采用损坏模式分析模型,对所述待处理文件进行损坏情况分析,以得到所述待处理文件的损坏情况分析结果,具体被配置为:
通过所述特征编码层,从所述待处理文件中提取原始损坏特征,并对所述原始损坏特征进行特征编码处理,以获得损坏编码特征;
通过所述特征解码层,将所述损坏编码特征进行特征解码处理,以获得重构解码特征;
通过所述损坏模式分析层,以所述重构解码特征与所述原始损坏特征之间的差异信息作为所述待处理文件对应的重构损失;基于所述重构损失计算所述待处理文件中的损坏程度分析结果。
进一步可选地,所述装置还包括备份单元,被配置为,若所述实时活动日志中包含所述异常行为,并且所述异常行为导致本地文件系统中存储的所述待处理文件丢失,则从云打印机关联的冗余备份系统中,查询与所述异常行为关联的备份文件,并将查询到的备份文件重新载入到本地文件系统中;其中,冗余备份系统至少包括:多个云存储节点、冗余备份服务器。
进一步可选地,所述备份单元,还被配置为:从云打印机关联的冗余备份系统中,查询与所述异常行为关联的备份文件之前,检测本地文件系统中是否载入新增的本地文件;若检测到新增的本地文件,则生成所述新增的本地文件对应的备份标识;将所述新增的本地文件上传至冗余备份系统中,并将所述新增的本地文件插入所述备份标识在冗余备份系统中对应的存储空间。
所述获取单元,被配置为:获取与所述新增的本地文件关联的实时操作数据;在构建所述实时活动日志的过程中,将所述新增的本地文件的实时操作数据关联至所述备份标识。
所述备份单元,从云打印机关联的冗余备份系统中,查询与所述异常行为关联的备份文件,被配置为:
基于包含所述异常行为的实时操作数据、以及实时操作数据与备份标识的关联关系,获取与所述异常行为关联的备份标识;通过获取到的备份标识,在云打印机关联的冗余备份系统中查询对应的备份文件。
本申请实施例中,通过云打印机数据恢复装置,通过异常检测模型实时分析以发现实时活动日志中的异常行为,并自动化修复异常行为,以达到云打印机中损坏数据的无感知修复,提高云打印机数据的恢复效率,提升用户体验。同时,通过实时监测活动日志以及异常检测模型,能够及时发现设备故障、网络问题、存储介质问题、传输错误、文件损坏、文件格式错误、人为误操作等异常行为,并且能够针对相关的待处理文件进行修复处理,有助于保护数据的完整性、提高系统的可靠性,并减少人为误操作对数据造成的负面影响。
在本申请的又一实施例中,还提供一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现方法实施例所述的云打印机数据恢复方法。
上述电子设备提到的通信总线1140可以是外设部件互连标准(PeripheralComponent Interconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线1140可以分为地址总线、数据总线、控制总线等。
为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口1120用于上述电子设备与其他设备之间的通信。
存储器1130可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(non-volatil ememory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器1110可以是通用处理器,包括中央处理器(Central Pro-
cessing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(ApplicationSpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现上述方法实施例中可由电子设备执行的各步骤。
Claims (9)
1.一种云打印机数据恢复方法,其特征在于,包括:
实时监测云打印机的本地数据状态和/或设备运行情况,以构成实时活动日志;所述实时活动日志至少包括:每个本地文件的操作内容、操作时间、操作类型、操作者信息;
通过异常检测模型,对所述实时活动日志进行实时分析,以识别所述实时活动日志中是否包含异常行为;所述异常行为包括以下之一:设备硬件故障、网络故障、存储介质损坏、传输错误、文件损坏、文件格式错误、人为误操作;
若所述实时活动日志中包含所述异常行为,则对与所述异常行为关联的待处理文件进行文件修复处理,以实现云打印机中损坏数据的无感知修复;
所述异常检测模型至少包括:特征提取层、分布模式学习层、异常行为预测层、行为预警层;
所述通过异常检测模型,对所述实时活动日志进行实时分析,以识别所述实时活动日志中是否包含异常行为,包括:
通过所述特征提取层,从所述实时活动日志中提取实时日志特征;所述实时日志特征至少包括时间窗特征、日志级别分布特征、行为类型特征、日志噪声统计特征;
通过所述分布模式学习层,对所述实时日志特征进行潜在行为分析,并基于分析得到的潜在行为分布模式,重构所述实时日志特征,以获得实时日志重构编码特征;
通过所述异常行为预测层,基于所述实时日志特征与所述实时日志重构编码特征,判断所述实时活动日志中是否包含异常行为。
2.根据权利要求1所述的云打印机数据恢复方法,其特征在于,所述通过所述异常行为预测层,基于所述实时日志特征与所述实时日志重构编码特征,判断所述实时活动日志中是否包含异常行为,包括:
对所述实时日志特征与对应的实时日志重构编码特征进行差异性预测,以获得所述实时日志特征对应的差异性预估分数;
基于所述差异性预估分数,构建所述实时活动日志对应的差异性分布集合;
采用异常行为动态阈值对所述差异性分布集合中的各个行为元素进行评估;
若所述差异性分布集合中包含差异性分布值高于异常行为动态阈值的异常行为元素,则确定所述实时活动日志中包含异常行为。
3.根据权利要求1所述的云打印机数据恢复方法,其特征在于,所述分布模式学习层中获得实时日志重构编码特征的过程,表示为如下公式:
;
其中,表示对第1到第i个聚类中心特征的加权求和,/>表示潜在行为分布模式hi的映射函数,/>是通过所述分布模式学习层中将所述实时日志特征分析得到的第i个聚类中心特征对应的潜在行为分布模式,/>是通过所述分布模式学习层中将所述实时日志特征分析得到的第i-1个聚类中心特征对应的潜在行为分布模式,/>是所述分布模式学习层的权重参数矩阵,/>是第 i 个聚类中心特征对应的参数,/>是所述分布模式学习层的偏置参数,/>是所述分布模式学习层的重构映射函数。
4.根据权利要求2所述的云打印机数据恢复方法,其特征在于,所述异常检测模型还包括:异常行为定位层;所述方法还包括:
通过所述异常行为定位层,基于所述异常行为元素在所述差异性分布集合中所处的分布位置,获取异常行为元素对应的实时日志索引概率;
其中,所述实时日志索引概率为所述实时活动日志中各处存在异常实时操作数据的概率值;所述实时日志索引概率的获取过程表示为如下公式:
;
其中,p(t)表示第t个异常行为元素的实时日志索引概率,N(t)表示与第t个异常行为元素相邻的邻居索引集合,局部离群因子LOF(j)表示异常实时操作数据点j位于局部邻域内相对于其邻居数据点的离群程度,局部离群因子LOF(t)表示异常实时操作数据点t位于局部邻域内相对于其邻居数据点的离群程度,k表示邻居数量。
5.根据权利要求1所述的云打印机数据恢复方法,其特征在于,所述对与所述异常行为关联的待处理文件进行文件修复处理,包括:
从云打印机的本地文件系统中,获取与所述异常行为关联的待处理文件;
采用损坏模式分析模型,对所述待处理文件进行损坏情况分析,以得到所述待处理文件的损坏情况分析结果;
根据损坏情况分析结果,对所述待处理文件执行匹配的文件恢复操作,并将恢复后的所述待处理文件更新至本地文件系统中。
6.根据权利要求5所述的云打印机数据恢复方法,其特征在于,所述损坏模式分析模型至少包括:特征编码层、特征解码层、损坏模式分析层;
所述采用损坏模式分析模型,对所述待处理文件进行损坏情况分析,以得到所述待处理文件的损坏情况分析结果,包括:
通过所述特征编码层,从所述待处理文件中提取原始损坏特征,并对所述原始损坏特征进行特征编码处理,以获得损坏编码特征;
通过所述特征解码层,将所述损坏编码特征进行特征解码处理,以获得重构解码特征;
通过所述损坏模式分析层,以所述重构解码特征与所述原始损坏特征之间的差异信息作为所述待处理文件对应的重构损失;基于所述重构损失计算所述待处理文件中的损坏程度分析结果。
7.根据权利要求1所述的云打印机数据恢复方法,其特征在于,若所述实时活动日志中包含所述异常行为,并且所述异常行为导致本地文件系统中存储的所述待处理文件丢失,则所述方法还包括:
从云打印机关联的冗余备份系统中,查询与所述异常行为关联的备份文件,并将查询到的备份文件重新载入到本地文件系统中;
其中,冗余备份系统至少包括:多个云存储节点、冗余备份服务器。
8.根据权利要求7所述的云打印机数据恢复方法,其特征在于,从云打印机关联的冗余备份系统中,查询与所述异常行为关联的备份文件之前,还包括:
检测本地文件系统中是否载入新增的本地文件;
若检测到新增的本地文件,则生成所述新增的本地文件对应的备份标识;
将所述新增的本地文件上传至冗余备份系统中,并将所述新增的本地文件插入所述备份标识在冗余备份系统中对应的存储空间;
所述实时监测云打印机的本地数据状态和/或设备运行情况,以构成实时活动日志,包括:
获取与所述新增的本地文件关联的实时操作数据;
在构建所述实时活动日志的过程中,将所述新增的本地文件的实时操作数据关联至所述备份标识;
所述从云打印机关联的冗余备份系统中,查询与所述异常行为关联的备份文件,包括:
基于包含所述异常行为的实时操作数据、以及实时操作数据与备份标识的关联关系,获取与所述异常行为关联的备份标识;
通过获取到的备份标识,在云打印机关联的冗余备份系统中查询对应的备份文件。
9.一种云打印机数据恢复装置,其特征在于,所述装置包括:
获取单元,被配置为实时监测云打印机的本地数据状态和/或设备运行情况,以构成实时活动日志;所述实时活动日志至少包括:每个本地文件的操作内容、操作时间、操作类型、操作者信息;
检测单元,被配置为通过异常检测模型,对所述实时活动日志进行实时分析,以识别所述实时活动日志中是否包含异常行为;所述异常行为包括以下之一:设备硬件故障、网络故障、存储介质损坏、传输错误、文件损坏、文件格式错误、人为误操作;
修复单元,被配置为若所述实时活动日志中包含所述异常行为,则对与所述异常行为关联的待处理文件进行文件修复处理,以实现云打印机中损坏数据的无感知修复;
所述异常检测模型至少包括:特征提取层、分布模式学习层、异常行为预测层、行为预警层;所述检测单元,具体被配置为:
通过所述特征提取层,从所述实时活动日志中提取实时日志特征;所述实时日志特征至少包括时间窗特征、日志级别分布特征、行为类型特征、日志噪声统计特征;
通过所述分布模式学习层,对所述实时日志特征进行潜在行为分析,并基于分析得到的潜在行为分布模式,重构所述实时日志特征,以获得实时日志重构编码特征;
通过所述异常行为预测层,基于所述实时日志特征与所述实时日志重构编码特征,判断所述实时活动日志中是否包含异常行为。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410270282.0A CN117873408B (zh) | 2024-03-11 | 2024-03-11 | 一种云打印机数据恢复方法以及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410270282.0A CN117873408B (zh) | 2024-03-11 | 2024-03-11 | 一种云打印机数据恢复方法以及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117873408A true CN117873408A (zh) | 2024-04-12 |
CN117873408B CN117873408B (zh) | 2024-05-31 |
Family
ID=90584859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410270282.0A Active CN117873408B (zh) | 2024-03-11 | 2024-03-11 | 一种云打印机数据恢复方法以及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117873408B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5875044A (en) * | 1993-06-04 | 1999-02-23 | Canon Kabushiki Kaisha | Image forming apparatus and method |
US20180173467A1 (en) * | 2016-12-20 | 2018-06-21 | Océ Holding B.V. | Method for operating a print server for digital high-capacity printing systems |
CN109840178A (zh) * | 2017-11-28 | 2019-06-04 | 合肥杰发科技有限公司 | 一种监测日志信息的方法、移动终端以及装置 |
CN112579327A (zh) * | 2019-09-27 | 2021-03-30 | 阿里巴巴集团控股有限公司 | 一种故障检测方法、装置及设备 |
CN114968627A (zh) * | 2021-02-26 | 2022-08-30 | 深圳市万普拉斯科技有限公司 | 一种系统异常检测方法、装置及电子设备 |
US20220284071A1 (en) * | 2020-03-04 | 2022-09-08 | Karl Louis Denninghoff | Transitory salient attention capture to draw attention to digital document parts |
CN116414783A (zh) * | 2022-01-05 | 2023-07-11 | 中国移动通信有限公司研究院 | 一种日志检测方法、装置、电子设备和存储介质 |
CN116701033A (zh) * | 2023-06-07 | 2023-09-05 | 中国工商银行股份有限公司 | 主机切换异常检测方法、装置、计算机设备和存储介质 |
CN116980162A (zh) * | 2022-11-23 | 2023-10-31 | 腾讯科技(深圳)有限公司 | 云审计的数据检测方法、装置、设备、介质及程序产品 |
CN117560712A (zh) * | 2023-11-29 | 2024-02-13 | 广东虹勤通讯技术有限公司 | 一种测试系统、无线日志抓取及分析装置和方法 |
-
2024
- 2024-03-11 CN CN202410270282.0A patent/CN117873408B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5875044A (en) * | 1993-06-04 | 1999-02-23 | Canon Kabushiki Kaisha | Image forming apparatus and method |
US20180173467A1 (en) * | 2016-12-20 | 2018-06-21 | Océ Holding B.V. | Method for operating a print server for digital high-capacity printing systems |
CN109840178A (zh) * | 2017-11-28 | 2019-06-04 | 合肥杰发科技有限公司 | 一种监测日志信息的方法、移动终端以及装置 |
CN112579327A (zh) * | 2019-09-27 | 2021-03-30 | 阿里巴巴集团控股有限公司 | 一种故障检测方法、装置及设备 |
US20220284071A1 (en) * | 2020-03-04 | 2022-09-08 | Karl Louis Denninghoff | Transitory salient attention capture to draw attention to digital document parts |
CN114968627A (zh) * | 2021-02-26 | 2022-08-30 | 深圳市万普拉斯科技有限公司 | 一种系统异常检测方法、装置及电子设备 |
CN116414783A (zh) * | 2022-01-05 | 2023-07-11 | 中国移动通信有限公司研究院 | 一种日志检测方法、装置、电子设备和存储介质 |
CN116980162A (zh) * | 2022-11-23 | 2023-10-31 | 腾讯科技(深圳)有限公司 | 云审计的数据检测方法、装置、设备、介质及程序产品 |
CN116701033A (zh) * | 2023-06-07 | 2023-09-05 | 中国工商银行股份有限公司 | 主机切换异常检测方法、装置、计算机设备和存储介质 |
CN117560712A (zh) * | 2023-11-29 | 2024-02-13 | 广东虹勤通讯技术有限公司 | 一种测试系统、无线日志抓取及分析装置和方法 |
Non-Patent Citations (1)
Title |
---|
任明;宋云奎;: "基于深度学习的云计算系统异常检测方法", 计算机技术与发展, no. 05, 21 December 2018 (2018-12-21) * |
Also Published As
Publication number | Publication date |
---|---|
CN117873408B (zh) | 2024-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | How incidental are the incidents? characterizing and prioritizing incidents for large-scale online service systems | |
US5253184A (en) | Failure and performance tracking system | |
US7805630B2 (en) | Detection and mitigation of disk failures | |
US20060174167A1 (en) | Self-creating maintenance database | |
CN109491819A (zh) | 一种诊断服务器故障的方法和系统 | |
CN108573007A (zh) | 检测数据一致性的方法、装置、电子设备及存储介质 | |
CN105607973B (zh) | 一种虚拟机系统中设备故障处理的方法、装置及系统 | |
CN112416891A (zh) | 数据检测方法、装置、电子设备及可读存储介质 | |
Jia et al. | Augmenting log-based anomaly detection models to reduce false anomalies with human feedback | |
CN111309584B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN114860487A (zh) | 一种内存故障识别方法及一种内存故障隔离方法 | |
CN117389692B (zh) | 虚拟机容灾保护方法、装置、电子设备及存储介质 | |
CN112084097B (zh) | 一种磁盘告警方法及装置 | |
CN117234791B (zh) | 存储芯片的数据丢失检测方法及装置 | |
CN117873408B (zh) | 一种云打印机数据恢复方法以及相关装置 | |
CN116737462A (zh) | 一种数据处理方法、系统、装置及介质 | |
CN114415970B (zh) | 分布式存储系统的磁盘故障处理方法、装置及服务器 | |
Pham | Reliability modeling, analysis and optimization | |
WO2021100140A1 (ja) | ネットワーク監視装置、方法およびプログラム | |
CN111694715A (zh) | 一种异常告警方法、装置、设备及机器可读存储介质 | |
CN111610778B (zh) | 一种提高工控系统稳定性的自适应监测系统 | |
CN117407207B (zh) | 一种内存故障处理方法、装置、电子设备及存储介质 | |
Abidov | DIAGNOSTICS OF THE STATE AND RECOVERY OF REAL TIME SYSTEMS PERFORMANCE | |
CN112947995B (zh) | 一种Java项目的体系结构策略定位方法及系统 | |
CN117573428B (zh) | 容灾备份方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |