WO2021017288A1 - 对系统错误进行重复识别的方法、装置、电子设备和计算机可读存储介质 - Google Patents

对系统错误进行重复识别的方法、装置、电子设备和计算机可读存储介质 Download PDF

Info

Publication number
WO2021017288A1
WO2021017288A1 PCT/CN2019/117684 CN2019117684W WO2021017288A1 WO 2021017288 A1 WO2021017288 A1 WO 2021017288A1 CN 2019117684 W CN2019117684 W CN 2019117684W WO 2021017288 A1 WO2021017288 A1 WO 2021017288A1
Authority
WO
WIPO (PCT)
Prior art keywords
context information
similarity score
information corresponding
similarity
system problems
Prior art date
Application number
PCT/CN2019/117684
Other languages
English (en)
French (fr)
Inventor
熊星
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2021017288A1 publication Critical patent/WO2021017288A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0745Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an input/output transactions management context

Definitions

  • This application relates to the technical field of data processing, and in particular to methods, devices, electronic equipment, and computer-readable storage media for repetitive recognition of system errors.
  • the tester will submit the system problem that contains the related information of the system error to the management system based on the found BUG (system error), and the system maintainer will solve it according to the system problem submitted by the tester The system is wrong. Because different testers may submit similar system problems to the management system for the same system error, and these similar system problems need to be identified repeatedly to avoid repeated processing of the same system error.
  • the inventor of the present application realizes that the maintenance personnel will repeatedly identify the submitted similar system problems and classify them as the system problems corresponding to the same system error based on the maintenance personnel’s subjective experience. This process depends entirely on maintenance. The subjective experience of personnel, its accuracy is not high.
  • this application provides a method for repeating system errors Recognition method, device, electronic equipment and computer-readable storage medium.
  • a method for repeatedly identifying system errors including:
  • the context information corresponding to the two system problems is acquired, where the context information includes the text of the cause of the system problem, the screenshot of the cause of the system problem, and the system problem
  • a device for repeatedly identifying system errors including:
  • the acquiring unit is configured to acquire context information corresponding to the two system problems based on the two system problems used for comparison, wherein the context information includes the text of the cause of the system problem, and the text of the cause of the system problem. Screenshots, information about the functional modules that caused the system problems, and information about the equipment that caused the system problems;
  • the first execution unit is configured to determine the similarity between the context information corresponding to the two system problems
  • a comparison unit configured to compare the similarity between the context information corresponding to the two system questions with a predetermined threshold to obtain a comparison result
  • the second execution unit is configured to determine whether the two system problems are corresponding to the same system error based on the comparison result.
  • an electronic device including a processor; and a memory, configured to store a program of the processor for repetitive identification of system errors; wherein the processor is configured to execute as described in the first aspect of the present application Or the method in any possible implementation of the first aspect.
  • a computer-readable storage medium on which is stored a program for repetitive recognition of system errors.
  • a program for repetitive recognition of system errors is executed by a processor, a computer-readable storage medium is The method in any possible implementation of the first aspect.
  • a computer program product includes a non-transitory computer-readable storage medium storing a computer program, and the computer program is operable to cause a computer to execute as described in the first aspect of this application. Or any possible implementation of the first aspect.
  • Fig. 1 is a flowchart of an implementation of a method for repeatedly identifying system errors according to an embodiment of the application.
  • FIG. 2 is a specific implementation flowchart of step S120 in a method for repeatedly identifying system errors shown in an embodiment of the application.
  • Fig. 3 is a block diagram of a device for repeatedly identifying system errors according to an embodiment of the application.
  • Fig. 4 schematically shows an example block diagram of an electronic device for implementing the above-mentioned method for repeatedly identifying system errors.
  • Fig. 5 schematically shows a computer-readable storage medium for implementing the above-mentioned method for repeatedly identifying system errors.
  • the execution subject of the method for repeatedly identifying system errors in the embodiments of the present application is an electronic device, and the electronic device may specifically be a management system for managing system problems.
  • the following takes the management system as an example for description.
  • the method for repeatedly identifying system errors includes the following steps S110 to S140, which are described in detail as follows:
  • Step S110 based on the two system problems used for comparison, obtain context information corresponding to the two system problems, where the context information includes text information of the cause of the system problem, and the location of the system problem. Screenshot of the cause, information of the functional module that caused the system problem, and information of the device that caused the system problem.
  • Step S120 Determine the similarity between the context information corresponding to the two system questions.
  • step S130 the similarity between the context information corresponding to the two system questions is compared with a predetermined threshold to obtain a comparison result.
  • Step S140 Determine whether the two system problems are system problems corresponding to the same system error based on the comparison result.
  • the above-mentioned system problem refers to a certain business system in the process of R&D testing on the R&D test terminal, and the tester submits an explanation based on the BUG (system error) found in the business system.
  • the system error is related System issues with contextual information.
  • the context information corresponding to the system problem includes text information of the cause of the system problem, screenshots of the cause of the system problem, information of the function module that caused the system problem, and information of the device that caused the system problem.
  • the management system when the management system obtains the text of the cause of the system problem, it can obtain the text of the cause of the system problem from the system log when the system problem occurs.
  • the management system obtains a screenshot of the cause of the system problem, it can be realized by taking a screenshot of the reason prompt displayed on the R&D test terminal when the R&D test terminal has a system problem.
  • the management system When the management system obtains the function module information that caused the system problem, it can obtain it from the system log when the system problem occurs.
  • the management system When the management system obtains the device information that caused the system problem, it can retrieve it from the factory configuration module in the memory of the R&D test terminal that caused the system problem.
  • step S120 the management system is based on the text of the cause of the system problem contained in the context information corresponding to the two system problems, a screenshot of the cause of the system problem, information of the function module that caused the system problem, and information of the device that caused the system problem.
  • These four dimensions of information determine the similarity between the contextual information corresponding to two system problems. It should be noted that the higher the similarity of the context information corresponding to the two system problems, the greater the probability that the two system problems are system problems corresponding to the same system error.
  • FIG. 2 is a specific implementation flowchart of step S120 in a method for repetitive identification of system errors according to an embodiment of the application, in which one of the context information corresponding to the two system problems is determined
  • the step S120 of the similarity between the two includes:
  • Step S1201 Compare the text of the cause of the system problem in the context information corresponding to the two system problems, and determine a first similarity score.
  • Step S1202 Compare the screenshots of the cause of the system problem in the context information corresponding to the two system problems, and determine a second similarity score.
  • Step S1203 Compare the function module information that generates the system problem in the context information corresponding to the two system problems, and determine a third similarity score.
  • Step S1204 Compare the device information that generates the system problem in the context information corresponding to the two system problems, and determine a fourth similarity score.
  • Step S1205 based on the first similarity score, the second similarity score, the third similarity score, and the fourth similarity score, determine the similarity between the context information corresponding to the two system questions.
  • step S1201 the management system compares the texts of the cause of the system problem in the context information corresponding to the two system problems to determine the first similarity score between the texts of the cause of the system problem in the context information.
  • the first similarity score is determined based on the following method:
  • Word segmentation is performed on the title and content in the text of the cause of the system problem in the context information corresponding to the two system problems;
  • the first similarity score is obtained based on the number of keywords in the intersection of the keywords corresponding to the two system questions divided by the number of keywords in the union of the keywords corresponding to the two system questions.
  • the management system when determining the first similarity score, obtains the text of the cause of the system problem in the context information corresponding to the two system problems, and performs word segmentation on the title and content of the two texts to obtain multiple words .
  • the method of word segmentation can be used to stop the word segmentation.
  • the management system determines the number of occurrences of each word classified in all the separated words, and treats the words with the number of occurrences higher than the predetermined threshold of occurrences as keywords in the cause of the system problem in the context information corresponding to the system problem, and then Obtain key information that reflects the causes of system problems.
  • the management system determines the number of keywords in the intersection of the keywords corresponding to the two system problems, and determines the number of keywords in the union of the keywords corresponding to the two system problems, and sets the intersection of the keywords corresponding to the two system problems.
  • the number of keywords is divided by the number of keywords in the union of the keywords corresponding to the two system questions to obtain the first similarity score, and then according to the first similarity score, whether the text of the cause of the system problem in the context information corresponding to the two system problems is determined Consistent. It should be noted that when two system problems are the same system problem, the information in the text record of the cause of the system problem will be basically the same.
  • the corresponding keywords are more likely to be the same, the higher the first similarity score ; Conversely, when the two system problems are not the same system problem, the information recorded in the text record of the cause of the system problem will be inconsistent, so the probability that the corresponding keywords are the same is smaller, and the first similarity score is lower.
  • step S1202 the management system compares the screenshots of the cause of the system problem in the context information corresponding to the two system problems to determine the second similarity score between the text of the cause of the system problem in the context information.
  • the second similarity score is determined based on the following method:
  • the second similarity score is obtained based on dividing the number of overlapping characters in the characters recognized for the two system questions by the sum of the number of characters recognized for the two system questions.
  • the management system when determining the second similarity score, obtains a screenshot of the cause of the system problem in the context information corresponding to the two system problems.
  • optical character recognition is used to obtain the characters recognized from the screenshots.
  • the management system determines the number of characters identified in the screenshot of the cause of the system problem in the context information corresponding to the two system problems, and the number of characters identified in the screenshot of the cause of the system problem in the context information corresponding to the two system problems.
  • the sum of the number of characters, the number of overlapping characters recognized by the two system problems is divided by the sum of the number of characters recognized by the two system problems to get the second similarity score, and then the second similarity score is used to determine the corresponding to the two system problems Whether the screenshots of the causes of system problems in the context information are consistent. It should be noted that when two system problems are the same system problem, the screenshots of the cause of the system problem will be basically the same.
  • the probability that the corresponding characters are the same is higher, and the second similarity score is higher; on the contrary, when When the two system problems are not the same system problem, the screenshots of the cause of the system problem will be inconsistent. Therefore, the probability that the corresponding characters are the same is smaller, and the second similarity score is lower.
  • step S1203 the function module information that generated the system problem in the context information corresponding to the two system problems is compared to determine a third similarity score.
  • step S1204 the device information that generated the system problem in the context information corresponding to the two system problems is compared to determine a fourth similarity score.
  • the third similarity score is determined based on the following method:
  • the fourth similarity score is determined based on the following method:
  • the fourth similarity score is zero.
  • the management system compares the function module information that generates the system problem in the context information corresponding to the two system problems. If the context information corresponding to the two system problems generates the system If the functional module information of the question is consistent, the preset first score is obtained as the third similarity score. In this embodiment, when the information of the functional module that caused the system problem is the same, the two system problems may be caused by the same system error.
  • the third similarity score is 1, when the context information corresponding to the two system problems is generated If the function module information of the system problem is inconsistent, the third similarity score can be set to zero.
  • the management system compares the device information that generated the system problem in the context information corresponding to the two system problems, and if the device information that generated the system problem in the context information corresponding to the two system problems is consistent, then obtain The preset second score serves as the fourth similarity score.
  • the device information that caused the system problem is the same, the two system problems may be caused by the same system error.
  • the device information that caused the system problem is inconsistent, the two system problems cannot be the same system.
  • the second score can be set to 1, and the fourth similarity score is 1; when the context information corresponding to the two system problems causes the system problem If the device information is not consistent, the fourth similarity score can be set to zero.
  • step S1205 when the management system compares the similarity between the context information corresponding to the two system problems, it will specifically use the text of the cause of the system problem in the context information, the screenshot of the cause of the system problem, and the generation of the system.
  • the information of the four dimensions of the device information of the problem and the device information that generated the system problem respectively determine the corresponding first similarity score, second similarity score, third similarity score, and fourth similarity score.
  • the second similarity score, the third similarity score, and the fourth similarity score determine the similarity between the context information corresponding to the two system questions.
  • the similarity step S1205 includes:
  • ⁇ and ⁇ are normal numbers greater than 1
  • A is the first similarity score
  • B is the second similarity score
  • C is the third similarity score
  • D is the fourth similarity score
  • S is The similarity between two system problems
  • e is the natural constant.
  • the function module information of the system problem or the device information of the system problem can be two dimensions.
  • the third similarity score and the fourth similarity score have a greater influence in the calculation of the similarity between context information, so the corresponding weights are larger.
  • step S130 the management system compares the similarity between the context information corresponding to the system problem with a predetermined threshold to obtain a comparison result, where the comparison result is between the context information corresponding to the system problem
  • the similarity of is less than a predetermined threshold, the similarity between the context information corresponding to the system problem is equal to the predetermined threshold and the similarity between the context information corresponding to the system problem is greater than the predetermined threshold.
  • step S140 the management system determines, based on the comparison result, whether the two system problems are system problems corresponding to the same system error.
  • the step S140 of determining whether the two system problems are corresponding to the same system error based on the comparison result includes the following steps:
  • the comparison result is that the similarity between the context information corresponding to the two system problems is greater than or equal to a predetermined threshold, it is determined that the two system problems are system problems corresponding to the same system error.
  • the comparison result is that the similarity between the context information corresponding to the two system problems is less than a predetermined threshold, it is determined that the two system problems are not system problems corresponding to the same system error.
  • the management system determines whether two system problems are the system problems corresponding to the same system error based on the comparison results, when the similarity between the context information corresponding to the two system problems is greater than or equal to the predetermined threshold, the two systems The information contained in the context information corresponding to the problem is basically the same, then the system problem corresponding to the same system error is more likely to be, and then the two system problems are determined to be the system problem corresponding to the same system error; when two system problems The similarity between the corresponding context information is less than the predetermined threshold, it means that there is a big difference in the information included in the context information corresponding to the two system problems, so the system problem corresponding to the same system error is less likely to be determined. The two system problems are not corresponding to the same system error.
  • FIG. 3 is an apparatus for repeatedly identifying system errors provided by an embodiment of the present application.
  • the apparatus for repeatedly identifying system errors may be integrated in the above-mentioned electronic equipment, and may specifically include an acquiring unit 110 , The first execution unit 120, the comparison unit 130, and the second execution unit 140.
  • the acquiring unit 110 is configured to acquire context information corresponding to the two system problems based on the two system problems for comparison, where the context information includes the text of the cause of the system problem and the cause of the system problem Screenshots of, the function module information that caused the system problem and the equipment information that caused the system problem;
  • the first execution unit 120 is configured to determine the similarity between the context information corresponding to the two system problems.
  • the comparison unit 130 is configured to compare the similarity between the context information corresponding to the two system questions with a predetermined threshold to obtain a comparison result.
  • the second execution unit 140 is configured to determine, based on the comparison result, whether the two system problems are system problems corresponding to the same system error.
  • the first execution unit 120 is configured to:
  • the similarity between the context information corresponding to the two system questions is determined.
  • the first execution unit 120 is configured to:
  • ⁇ and ⁇ are normal numbers greater than 1
  • A is the first similarity score
  • B is the second similarity score
  • C is the third similarity score
  • D is the fourth similarity score
  • S is The similarity between the context information corresponding to the two system problems
  • e is a natural constant.
  • the first execution unit 120 is configured to:
  • Word segmentation is performed on the title and content in the text of the cause of the system problem in the context information corresponding to the two system problems;
  • the first similarity score is obtained based on the number of keywords in the intersection of the keywords corresponding to the two system questions divided by the number of keywords in the union of the keywords corresponding to the two system questions.
  • the first execution unit 120 is configured to:
  • the second similarity score is obtained based on dividing the number of overlapping characters in the characters recognized for the two system questions by the sum of the number of characters recognized for the two system questions.
  • the first execution unit 120 is configured to:
  • the fourth similarity score is zero.
  • the second execution unit 140 is configured to:
  • the comparison result is that the similarity between the context information corresponding to the two system problems is greater than or equal to a predetermined threshold, it is determined that the two system problems are system problems corresponding to the same system error;
  • the comparison result is that the similarity between the context information corresponding to the two system problems is less than a preset threshold, it is determined that the two system problems are not system problems corresponding to the same system error.
  • modules or units of the device for action execution are mentioned in the above detailed description, this division is not mandatory.
  • the features and functions of two or more modules or units described above may be embodied in one module or unit.
  • the features and functions of a module or unit described above can be further divided into multiple modules or units to be embodied.
  • the exemplary embodiments described herein can be implemented by software, or can be implemented by combining software with necessary hardware. Therefore, the technical solution according to the embodiments of the present application can be embodied in the form of a software product, which can be stored in a non-volatile storage medium (can be a CD-ROM, U disk, mobile hard disk, etc.) or on the network , Including several instructions to make a computing device (which may be a personal computer, server, mobile terminal, or network device, etc.) execute the method according to the embodiment of the present application.
  • a non-volatile storage medium can be a CD-ROM, U disk, mobile hard disk, etc.
  • Including several instructions to make a computing device which may be a personal computer, server, mobile terminal, or network device, etc.
  • a computer device capable of implementing the above method is also provided.
  • FIG. 4 is an electronic device 400 according to this embodiment of the present application.
  • the device 400 shown in FIG. 4 is only an example, and should not bring any limitation to the function and scope of use of the embodiments of the present application.
  • the electronic device 400 is represented in the form of a general-purpose computing device.
  • the components of the device 400 may include, but are not limited to: the aforementioned at least one processor 410, the aforementioned at least one memory 420, and a bus 430 connecting different system components (including the memory 420 and the processor 410).
  • the memory stores program code
  • the program code can be executed by the processor 410, so that the processor 410 executes the various exemplary implementations described in the "exemplary method" section of this specification. Way steps.
  • the processor 410 may perform step S110 as shown in FIG.
  • Step S120 Determine the similarity between the context information corresponding to the two system problems
  • Step S130 Compare the similarity between the context information corresponding to the two system questions with a predetermined threshold to obtain a comparison result
  • Step S140 Determine whether the two system problems are the same based on the comparison result A system problem corresponding to a system error.
  • the memory 420 may include a readable medium in the form of a volatile storage unit, such as a random access storage unit (RAM) 4201 and/or a cache storage unit 4202, and may also include a read-only storage unit (ROM) 4203.
  • RAM random access storage unit
  • ROM read-only storage unit
  • the memory 420 may also include a program/utility tool 4204 having a set (at least one) of program modules 4205.
  • program modules 4205 include but are not limited to: an operating system, one or more application programs, other program modules, and program data. Each of the examples or some combination may include the realization of a network environment.
  • the bus 430 may represent one or more of several types of bus structures, including a storage unit bus or a storage unit controller, a peripheral bus, a graphics acceleration port, a processing unit, or a local area using any bus structure among multiple bus structures. bus.
  • the electronic device 400 may also communicate with one or more external devices 600 (such as keyboards, pointing devices, Bluetooth devices, etc.), and may also communicate with one or more devices that enable a user to interact with the electronic device 400, and/or communicate with Any device (such as a router, modem, etc.) that enables the electronic device 400 to communicate with one or more other computing devices. Such communication may be performed through an input/output (I/O) interface 440.
  • the electronic device 400 may also communicate with one or more networks (for example, a local area network (LAN), a wide area network (WAN), and/or a public network, such as the Internet) through the network adapter 460.
  • networks for example, a local area network (LAN), a wide area network (WAN), and/or a public network, such as the Internet
  • the network adapter 460 communicates with other modules of the electronic device 400 through the bus 430. It should be understood that although not shown in the figure, other hardware and/or software modules can be used in conjunction with the electronic device 400, including but not limited to: microcode, device drivers, redundant processing units, external disk drive arrays, RAID systems, tape drives And data backup storage system, etc.
  • the exemplary embodiments described herein can be implemented by software, or can be implemented by combining software with necessary hardware. Therefore, the technical solution according to the embodiments of the present application can be embodied in the form of a software product, which can be stored in a non-volatile storage medium (can be a CD-ROM, U disk, mobile hard disk, etc.) or on the network , Including several instructions to make a computing device (which may be a personal computer, server, terminal device, or network device, etc.) execute the method according to the embodiment of the present application.
  • a non-volatile storage medium can be a CD-ROM, U disk, mobile hard disk, etc.
  • Including several instructions to make a computing device which may be a personal computer, server, terminal device, or network device, etc.
  • a computer-readable storage medium is also provided, on which is stored a program product capable of implementing the foregoing method of this specification.
  • various aspects of the present application can also be implemented in the form of a program product, which includes program code.
  • the program product runs on a terminal device, the program code is used to enable the The terminal device executes the steps according to various exemplary embodiments of the present application described in the above-mentioned "Exemplary Method" section of this specification.
  • a program product 500 for implementing the above method according to an embodiment of the present application is described. It can adopt a portable compact disk read-only memory (CD-ROM) and include program code, and can be used in an electronic device, For example, running on a personal computer.
  • CD-ROM compact disk read-only memory
  • the program product of this application is not limited to this.
  • the readable storage medium can be any tangible medium that contains or stores a program, and the program can be used by or combined with an instruction execution system, device, or device.
  • the program product can use any combination of one or more readable media.
  • the readable medium may be a readable signal medium or a readable storage medium.
  • the readable storage medium may be, for example, but not limited to, an electrical, magnetic, optical, electromagnetic, infrared, or semiconductor system, device, or device, or a combination of any of the above.
  • the above-mentioned computer-readable storage medium may be a non-volatile readable storage medium, such as a non-volatile readable storage medium stored in a CD-ROM, U disk, or mobile hard disk, and may include several instructions to make a
  • a computing device (which may be a personal computer, a server, a terminal device, or a network device, etc.) executes the method according to the embodiment of the present application.
  • readable storage media include: electrical connections with one or more wires, portable disks, hard disks, random access memory (RAM), read only memory (ROM), erasable Type programmable read only memory (EPROM or flash memory), optical fiber, portable compact disk read only memory (CD-ROM), optical storage device, magnetic storage device, or any suitable combination of the above.
  • RAM random access memory
  • ROM read only memory
  • EPROM or flash memory erasable Type programmable read only memory
  • CD-ROM compact disk read only memory
  • magnetic storage device or any suitable combination of the above.
  • the computer-readable signal medium may include a data signal propagated in baseband or as a part of a carrier wave, and readable program code is carried therein. This propagated data signal can take many forms, including but not limited to electromagnetic signals, optical signals, or any suitable combination of the above.
  • the readable signal medium may also be any readable medium other than a readable storage medium, and the readable medium may send, propagate, or transmit a program for use by or in combination with the instruction execution system, apparatus, or device.
  • the program code contained on the readable medium can be transmitted by any suitable medium, including but not limited to wireless, wired, optical cable, RF, etc., or any suitable combination of the foregoing.
  • the program code used to perform the operations of this application can be written in any combination of one or more programming languages.
  • the programming languages include object-oriented programming languages—such as Java, C++, etc., as well as conventional procedural Programming language-such as "C" language or similar programming language.
  • the program code can be executed entirely on the user's computing device, partly on the user's device, executed as an independent software package, partly on the user's computing device and partly executed on the remote computing device, or entirely on the remote computing device or server Executed on.
  • the remote computing device can be connected to a user computing device through any kind of network, including a local area network (LAN) or a wide area network (WAN), or can be connected to an external computing device (for example, using Internet service providers) Business to connect via the Internet).
  • LAN local area network
  • WAN wide area network
  • Internet service providers Internet service providers
  • An embodiment of the present application provides a computer program product.
  • the above-mentioned computer program product includes a non-transitory computer-readable storage medium storing a computer program.
  • the computer program is operable to cause a computer to execute the operations described in the foregoing various embodiments of the present application.
  • the method of repeated identification of system errors is described in the foregoing various embodiments of the present application.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请揭示了一种对系统错误进行重复识别的方法、装置、电子设备及计算机可读存储介质,属于数据处理的技术领域,其中所述方法包括:基于用于进行比对的两个系统问题,获取两个所述系统问题对应的上下文信息,其中,所述上下文信息包括系统问题所产生原因的文本、系统问题所产生原因的截图、产生系统问题的功能模块信息以及产生系统问题的设备信息;确定两个所述系统问题对应的上下文信息之间的相似度;将两个所述系统问题对应的上下文信息之间的相似度与预定阈值进行比对得到比对结果。本申请提出的方法不再依赖开发人员的主观经验去识别两个系统问题是否为一个系统错误所产生系统,由此提高了相同系统问题识别的准确性。

Description

对系统错误进行重复识别的方法、装置、电子设备和计算机可读存储介质
本申请要求引用2019年08月01日递交、发明名称为“对系统错误进行重复识别的方法和相关装置”的中国专利申请201910708623.7的优先权,在此通过引用将其全部内容合并于此。
技术领域
本申请涉及数据处理的技术领域,特别是涉及对系统错误进行重复识别的方法、装置、电子设备和计算机可读存储介质。
背景技术
在系统研发测试过程中,测试人员会根据所发现的BUG(系统错误)提交说明包含该系统错误的相关信息的系统问题至管理系统中,系统的维护人员根据测试人员所提交的系统问题去解决该系统错误。由于不同的测试人员可能会就同一个系统错误提交相似的系统问题至管理系统中,而这些相似的系统问题,则需要进行重复识别,从而避免对同一个系统错误进行重复处理。
本申请的发明人意识到,通过维护人员去对所提交的相似的系统问题进行重复识别,并基于维护人员主观经验将其归类为同一个系统错误所对应的系统问题,该过程全靠维护人员的主观经验,其准确度不高。
技术问题
基于此,为解决现有技术中避免依靠维护人员的主观经验对所提交的相似的系统问题进行重复识别,且识别的准确度不高的技术问题,本申请提供了一种对系统错误进行重复识别的方法、装置、电子设备及计算机可读存储介质。
发明解决方案
第一方面,提供了一种对系统错误进行重复识别的方法,包括:
基于用于进行比对的两个系统问题,获取两个所述系统问题对应的上下文信息,其中,所述上下文信息包括系统问题所产生原因的文本、系统问题所产生原因的截图、产生系统问题的功能模块信息以及产生系统问题的设备信息;
确定两个所述系统问题对应的上下文信息之间的相似度;
将两个所述系统问题对应的上下文信息之间的相似度与预定阈值进行比对得到比对 结果;
基于所述比对结果确定两个所述系统问题是否为同一个系统错误所对应的系统问题。
第二方面,提供了一种对系统错误进行重复识别的装置,包括:
获取单元,用于基于用于进行比对的两个系统问题,获取两个所述系统问题对应的上下文信息,其中,所述上下文信息包括系统问题所产生原因的文本、系统问题所产生原因的截图、产生系统问题的功能模块信息以及产生系统问题的设备信息;
第一执行单元,用于确定两个所述系统问题对应的上下文信息之间的相似度;
比对单元,用于将两个所述系统问题对应的上下文信息之间的相似度与预定阈值进行比对得到比对结果;
第二执行单元,用于基于所述比对结果确定两个所述系统问题是否为同一个系统错误所对应的系统问题。
第三方面,提供了一种电子设备,包括处理器;以及存储器,用于存储所述处理器的对系统错误进行重复识别的程序;其中,所述处理器配置为执行如本申请第一方面或第一方面任意可能实现方式中的方法。
第四方面,提供了一种计算机可读存储介质,其上存储有对系统错误进行重复识别的程序,所述对系统错误进行重复识别的程序被处理器执行时实现如本申请第一方面或第一方面任意可能实现方式中的方法。
第五方面,提供了一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如本申请第一方面所述的方法或第一方面任意可能实现方式中的方法。
有益效果
本申请的实施例提供的技术方案可以包括以下有益效果:
可以实现自动判定两个系统问题是否为同一个系统错误对应的系统问题,不再依赖开发人员的主观经验去识别两个系统问题是否为一个系统错误所产生系统,提高了相同系统问题识别的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
图1为本申请一个实施例示出的一种对系统错误进行重复识别的方法的实现流程图。
图2为本申请一个实施例示出的一种对系统错误进行重复识别的方法中的步骤S120 的具体实现流程图。
图3为本申请一个实施例示出的一种对系统错误进行重复识别的装置的框图。
图4示意性示出一种用于实现上述对系统错误进行重复识别的方法的电子设备示例框图。
图5示意性示出一种用于实现上述对系统错误进行重复识别的方法的计算机可读存储介质。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例中的对系统错误进行重复识别的方法的执行主体为电子设备,该电子设备具体可以为对系统问题进行管理的管理系统,以下以管理系统为例来进行说明。
参考图1所示,根据本申请的一个实施例的对系统错误进行重复识别的方法,包括以下步骤S110至步骤S140,详细说明如下:
步骤S110,基于用于进行比对的两个系统问题,获取两个所述系统问题对应的上下文信息,其中,所述上下文信息包括所述系统问题所产生原因的文本信息、所述系统问题所产生原因的截图、产生所述系统问题的功能模块信息以及产生所述系统问题的设备信息。
步骤S120,确定两个所述系统问题对应的上下文信息之间的相似度。
步骤S130,将两个所述系统问题对应的上下文信息之间的相似度与预定阈值进行比对得到比对结果。
步骤S140,基于所述比对结果确定两个所述系统问题是否为同一个系统错误所对应的系统问题。
在步骤S110中,上述系统问题指的是某个业务系统在研发测试终端上进行研发测试的过程中,测试人员基于在业务系统中所发现的BUG(系统错误)所提交的说明该系统错误相关的上下文信息的系统问题。其中,该系统问题对应的上下文信息包括系统问题所产生原因的文本信息、系统问题所产生原因的截图、产生系统问题的功能模块信息以及产生系统问题的设备信息。
需要说明的是,管理系统获取系统问题所产生原因的文本时,可以从系统问题产生时的系统日志中获取系统问题所产生原因的文本。
管理系统获取系统问题所产生原因的截图时,可以通过在研发测试终端出现系统问题的情况下,对研发测试终端显示的原因提示进行截图来实现。
管理系统获取产生系统问题的功能模块信息时,可以从系统问题产生时的系统日志中获取。
管理系统获取产生系统问题的设备信息时,可以通过从产生系统问题的研发测试终端的内存中的出厂配置模块中调取。
在步骤S120中,管理系统基于两个系统问题对应的上下文信息中所包含的系统问题所产生原因的文本、系统问题所产生原因的截图、产生系统问题的功能模块信息以及产生系统问题的设备信息这四个维度的信息确定两个系统问题对应的上下文信息之间的相似度。需要说明的是,两个系统问题对应的上下文信息的相似度越高,则说明两个系统问题为同一个系统错误所对应的系统问题的可能性越大。
参考图2,图2为本申请一个实施例示出的一种对系统错误进行重复识别的方法中的步骤S120的具体实现流程图,其中,所述确定两个所述系统问题对应的上下文信息之间的相似度的步骤S120,包括:
步骤S1201,比对两个所述系统问题对应的上下文信息中系统问题所产生原因的文本,确定第一相似分数。
步骤S1202,比对两个所述系统问题对应的上下文信息中系统问题所产生原因的截图,确定第二相似分数。
步骤S1203,比对两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息,确定第三相似分数。
步骤S1204,比对两个所述系统问题对应的上下文信息中产生系统问题的设备信息,确定第四相似分数。
步骤S1205,基于所述第一相似分数、所述第二相似分数、所述第三相似分数以及所述第四相似分数,确定两个所述系统问题对应的上下文信息之间的相似度。
在步骤S1201中,管理系统将两个系统问题对应的上下文信息中系统问题所产生原因的文本进行比对,来确定上下文信息中系统问题所产生原因的文本之间的第一相似分数。
在一个实施例中,第一相似分数基于以下方法确定:
将两个所述系统问题对应的上下文信息中系统问题所产生原因的文本中的标题和内容分别进行分词;
针对每个所述系统问题对应的上下文信息中系统问题所产生原因的文本中的标题和内容,确定分出的每个词在分出的词中的出现次数,将出现次数高于预定出现次数阈值的词作为所述系统问题对应的上下文信息中系统问题所产生原因中的关键词;
基于两个所述系统问题对应的关键词的交集中的关键词数除以两个所述系统问题对应的关键词的并集中的关键词数,得到第一相似分数。
在本实施例中,在确定第一相似分数时,管理系统获取得到两个系统问题对应的上下文信息中系统问题所产生原因的文本,对两个文本中的标题和内容进行分词得到多个词,其中分词的方法可以采用结巴分词。
管理系统确定分出的每个词在所有分出的词中的出现次数,将出现次数高于预定出现次数阈值的词作为系统问题对应的上下文信息中系统问题所产生原因中的关键词,进而获 取得到反映系统问题所产生原因的关键信息。
管理系统确定两个系统问题对应的关键词的交集中的关键词数,以及确定两个系统问题对应的关键词的并集中的关键词数,将两个系统问题对应的关键词的交集中的关键词数除以两个系统问题对应的关键词的并集中的关键词数得到第一相似分数,进而根据第一相似分数确定两个系统问题对应的上下文信息中系统问题所产生原因的文本是否一致。需要说明的是,当两个系统问题为同一个系统问题时,系统问题所产生原因的文本记录的信息将基本一致,由此对应的关键词相同的概率较大,则第一相似分数越高;反之,当两个系统问题不是同一个系统问题时,系统问题所产生原因的文本记录的信息将不一致,由此对应的关键词相同的概率较小,则第一相似分数越低。
在步骤S1202中,管理系统将两个系统问题对应的上下文信息中系统问题所产生原因的截图进行比对,来确定上下文信息中系统问题所产生原因的文本之间的第二相似分数。
在一个实施例中,所述第二相似分数基于以下方法确定:
对两个所述系统问题对应的上下文信息中系统问题所产生原因的截图进行光学字符识别,获得从所述截图中识别出的字符;
基于对两个所述系统问题识别出的字符中重合的字符数除以对两个所述系统问题识别出的字符数之和,得到第二相似分数。
在本实施例中,在确定第二相似分数时,管理系统获取两个系统问题对应的上下文信息中系统问题所产生原因的截图。
对于获取的系统问题所产生原因的截图,分别通过光学字符识别,获得从截图中识别出的字符。
管理系统确定两个系统问题对应的上下文信息中系统问题所产生原因的截图中识别出的字符重合的字符数,以及两个系统问题对应的上下文信息中系统问题所产生原因的截图中识别出的字符数之和,将两个系统问题识别出的字符重合的字符数除以两个系统问题识别出的字符数之和得到第二相似分数,进而根据第二相似分数确定两个系统问题对应的上下文信息中系统问题所产生原因的截图是否一致。需要说明的是,当两个系统问题为同一个系统问题时,系统问题所产生原因的截图将基本一致,由此对应的字符相同的概率较大,则第二相似分数越高;反之,当两个系统问题不是同一个系统问题时,系统问题所产生原因的截图将不一致,由此对应的字符相同的概率较小,则第二相似分数越低。
在步骤S1203中,比对两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息,确定第三相似分数。
在步骤S1204,比对两个所述系统问题对应的上下文信息中产生系统问题的设备信息,确定第四相似分数。
在一个实施例中,所述第三相似分数基于以下方法确定:
将两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息进行比对;
若两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息一致,则获取 预设的第一分数作为第三相似分数;
若两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息不一致,则确定所述第三相似分数为零;
所述第四相似分数基于以下方法确定:
将两个所述系统问题对应的上下文信息中产生系统问题的设备信息进行比对;
若两个所述系统问题对应的上下文信息中产生系统问题的设备信息一致,则获取预设的第二分数作为第四相似分数;
若两个所述系统问题对应的上下文信息中产生系统问题的设备信息不一致,则确定所述第四相似分数为零。
在本实施例中,在确定第三相似分数时,管理系统在将两个系统问题对应的上下文信息中产生系统问题的功能模块信息进行比对,若两个系统问题对应的上下文信息中产生系统问题的功能模块信息一致,则获取预设的第一分数作为第三相似分数。在本实施例中,当产生系统问题的功能模块信息一致时,则两个系统问题才可能是同一系统错误所产生,当产生系统问题的功能模块信息不一致时,则两个系统问题不可能是同一系统错误所产生;由此,当产生系统问题的功能模块信息一致时,可以将第一分数设置为1,则第三相似分数为1;当两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息不一致,则可以将第三相似分数设置为零。
在确定第四相似分数时,管理系统将两个系统问题对应的上下文信息中产生系统问题的设备信息进行比对,若两个系统问题对应的上下文信息中产生系统问题的设备信息一致,则获取预设的第二分数作为第四相似分数。在本实施例中,当产生系统问题的设备信息一致时,则两个系统问题才可能是同一系统错误所产生,当产生系统问题的设备信息不一致时,则两个系统问题不可能是同一系统错误所产生;由此,当产生系统问题的设备信息一致时,可以将第二分数设置为1,则第四相似分数为1;当两个所述系统问题对应的上下文信息中产生系统问题的设备信息不一致,则可以将第四相似分数设置为零。
在步骤S1205中,在管理系统比对两个系统问题对应的上下文信息之间的相似度时,具体将通过上下文信息中的系统问题所产生原因的文本、系统问题所产生原因的截图、产生系统问题的设备信息以及产生系统问题的设备信息四个维度的信息分别确定相应的第一相似分数、第二相似分数、第三相似分数以及第四相似分数,由所确定的第一相似分数、第二相似分数、第三相似分数以及第四相似分数确定两个系统问题对应的上下文信息之间的相似度。
在一个实施例中,所述基于所述第一相似分数、所述第二相似分数、所述第三相似分数以及所述第四相似分数,确定两个所述系统问题对应的上下文信息之间的相似度步骤S1205,包括:
基于以下公式确定两个系统问题之间的相似度:
Figure PCTCN2019117684-appb-000001
其中,α和β为大于1的正常数,A为所述第一相似分数,B为所述第二相似分数,C为所述第三相似分数,D为所述第四相似分数,S为两个系统问题之间的相似度,e为自然常数。
在本实施例中,根据两个系统问题的上下文信息之间的相似度来确定两个系统问题是否为同一个系统错误对应的系统问题的过程中,当两者上下文信息中产生系统问题的功能模块信息或系统问题的设备信息不一致时,说明两个系统问题可以为同一个系统错误对应的系统问题的可能性较小,因此系统问题的功能模块信息或系统问题的设备信息这两个维度可以作为两个系统问题可以为同一个系统错误对应的系统问题的前提,因此第三相似分数、第四相似分数在上下文信息之间的相似度的计算中影响较大,所以对应的权重较大。需要说明的是,由于产生系统问题的功能模块信息或系统问题的设备信息一致时,由此也不能准确地判断两个系统问题一定为同一个系统错误对应的系统问题,因此基于所产生原因的文本以及所产生原因的截图确定两个系统问题可以为同一个系统错误对应的系统问题作为可选方案,由此第一相似分数、第二相似分数在上下文信息之间的相似度的计算中影响较小,所以对应的权重较小。
还请继续参考图1,在步骤S130中,管理系统将系统问题对应的上下文信息之间的相似度与预定阈值进行比对得到比对结果,其中比对结果为系统问题对应的上下文信息之间的相似度小于预定阈值、系统问题对应的上下文信息之间的相似度等于预定阈值和系统问题对应的上下文信息之间的相似度大于预定阈值的一种。
在步骤S140中,管理系统基于上述比对结果确定两个上述系统问题是否为同一个系统错误所对应的系统问题。
可选地,在本申请的一个实施例中,所述基于所述比对结果确定两个所述系统问题是否为同一个系统错误所对应的系统问题的步骤S140,包括如下步骤:
若所述比对结果为两个所述系统问题对应的上下文信息之间的相似度大于或者等于预定阈值,则确定两个所述系统问题为同一个系统错误所对应的系统问题。
若所述比对结果为两个所述系统问题对应的上下文信息之间的相似度小于预定阈值,则确定两个所述系统问题不是同一个系统错误所对应的系统问题。
管理系统在基于比对结果确定两个系统问题是否为同一个系统错误所对应的系统问题时,当两个系统问题对应的上下文信息之间的相似度大于或者等于预定阈值,则说明两个系统问题对应的上下文信息中所包括信息基本一致,那么为同一个系统错误对应的系统问题的可能性较大,进而确定两个系统问题为同一个系统错误所对应的系统问题;当两个系统问题对应的上下文信息之间的相似度小于预定阈值,则说明两个系统问题对应的上下文信息中所包括信息存在较大差异,那么为同一个系统错误对应的系统问题的可能性较小,则确定两个系统问题不是同一个系统错误所对应的系统问题。
以上可以看出,在两个系统问题是否为同一个系统错误所对应的系统问题时,根据两个系统问题对应的上下文信息中用于反映系统问题所产生原因的文本、系统问题所产生原 因的截图、产生系统问题的功能模块信息以及产生系统问题的设备信息等多个维度的信息确定两个系统问题对应的上下文之间的相似度,由此可以准确地确定两个系统问题是否为同一个系统错误所对应的系统问题,进而可以实现自动判定两个系统问题是否为同一个系统错误对应的系统问题,不再依赖开发人员的主观经验去识别两个系统问题是否为一个系统错误所产生系统,由此提高了相同系统问题识别的准确性。
参考图3,图3是本申请一个实施例提供的一种对系统错误进行重复识别的装置,所述对系统错误进行重复识别的装置可以集成于上述的电子设备中,具体可以包括获取单元110、第一执行单元120、比对单元130以及第二执行单元140。
获取单元110,用于基于用于进行比对的两个系统问题,获取两个所述系统问题对应的上下文信息,其中,所述上下文信息包括系统问题所产生原因的文本、系统问题所产生原因的截图、产生系统问题的功能模块信息以及产生系统问题的设备信息;
第一执行单元120,用于确定两个所述系统问题对应的上下文信息之间的相似度。
比对单元130,用于将两个所述系统问题对应的上下文信息之间的相似度与预定阈值进行比对得到比对结果。
第二执行单元140,用于基于所述比对结果确定两个所述系统问题是否为同一个系统错误所对应的系统问题。
可选地,所述第一执行单元120被配置为:
比对两个所述系统问题对应的上下文信息中系统问题所产生原因的文本,确定第一相似分数;
比对两个所述系统问题对应的上下文信息中系统问题所产生原因的截图,确定第二相似分数;
比对两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息,确定第三相似分数;
比对两个所述系统问题对应的上下文信息中产生系统问题的设备信息,确定第四相似分数;
基于所述第一相似分数、所述第二相似分数、所述第三相似分数以及所述第四相似分数,确定两个所述系统问题对应的上下文信息之间的相似度。
可选地,所述第一执行单元120被配置为:
基于以下公式确定两个系统问题之间的相似度:
Figure PCTCN2019117684-appb-000002
其中,α和β为大于1的正常数,A为所述第一相似分数,B为所述第二相似分数,C为所述第三相似分数,D为所述第四相似分数,S为两个系统问题对应的上下文信息之间的相似度,e为自然常数。
可选地,所述第一执行单元120被配置为:
将两个所述系统问题对应的上下文信息中系统问题所产生原因的文本中的标题和内容分别进行分词;
针对每个所述系统问题对应的上下文信息中系统问题所产生原因的文本中的标题和内容,确定分出的每个词在分出的词中的出现次数,将出现次数高于预定出现次数阈值的词作为所述系统问题对应的上下文信息中系统问题所产生原因中的关键词;
基于两个所述系统问题对应的关键词的交集中的关键词数除以两个所述系统问题对应的关键词的并集中的关键词数,得到第一相似分数。
可选地,所述第一执行单元120被配置为:
对两个所述系统问题对应的上下文信息中系统问题所产生原因的截图进行光学字符识别,获得从所述截图中识别出的字符;
基于对两个所述系统问题识别出的字符中重合的字符数除以对两个所述系统问题识别出的字符数之和,得到第二相似分数。
可选地,所述第一执行单元120被配置为:
将两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息进行比对;
若两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息一致,则获取预设的第一分数作为第三相似分数;
若两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息不一致,则确定所述第三相似分数为零;
将两个所述系统问题对应的上下文信息中产生系统问题的设备信息进行比对;
若两个所述系统问题对应的上下文信息中产生系统问题的设备信息一致,则获取预设的第二分数作为第四相似分数;
若两个所述系统问题对应的上下文信息中产生系统问题的设备信息不一致,则确定所述第四相似分数为零。
可选地,所述第二执行单元140被配置为:
若所述比对结果为两个所述系统问题对应的上下文信息之间的相似度大于或者等于预定阈值,则确定两个所述系统问题为同一个系统错误所对应的系统问题;
若所述比对结果为两个所述系统问题对应的上下文信息之间的相似度小于预设阈值,则确定两个所述系统问题不是同一个系统错误所对应的系统问题。
上述装置中各个模块的功能和作用的实现过程具体详见上述对系统错误进行重复识别的方法中对应步骤的实现过程,在此不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本申请中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及 /或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本申请实施方式的方法。
在本申请的示例性实施例中,还提供了一种能够实现上述方法的计算机设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
参考图4,图4是根据本申请的这种实施方式的电子设备400。图4显示的设备400仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400以通用计算设备的形式表现。设备400的组件可以包括但不限于:上述至少一个处理器410、上述至少一个存储器420、连接不同系统组件(包括存储器420和处理器410)的总线430。
其中,所述存储器存储有程序代码,所述程序代码可以被所述处理器410执行,使得所述处理器410执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。例如,所述处理器410可以执行如图1中所示的步骤S110:基于用于进行比对的两个系统问题,获取两个所述系统问题对应的上下文信息,其中,所述上下文信息包括系统问题所产生原因的文本、系统问题所产生原因的截图、产生系统问题的功能模块信息以及产生系统问题的设备信息;步骤S120:确定两个所述系统问题对应的上下文信息之间的相似度;步骤S130:将两个所述系统问题对应的上下文信息之间的相似度与预定阈值进行比对得到比对结果;步骤S140:基于所述比对结果确定两个所述系统问题是否为同一个系统错误所对应的系统问题。
存储器420可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)4201和/或高速缓存存储单元4202,还可以包括只读存储单元(ROM)4203。
存储器420还可以包括具有一组(至少一个)程序模块4205的程序/实用工具4204,这样的程序模块4205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线430可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备400也可以与一个或多个外部设备600(例如键盘、指向设备、蓝牙设备等) 通信,还可与一个或者多个使得用户能与该电子设备400交互的设备通信,和/或与使得该电子设备400能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口440进行。并且,电子设备400还可以通过网络适配器460与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器460通过总线430与电子设备400的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本申请实施方式的方法。
在本申请的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本申请的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。
参考图5所示,描述了根据本申请的实施方式的用于实现上述方法的程序产品500,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在电子设备,例如个人电脑上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。上述计算机可读存储介质可以为非易失性可读存储介质,例如存储于CD-ROM、U盘或移动硬盘等设备中的非易失性可读存储介质,可以包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本申请实施方式的方法。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光 信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本申请一实施例提供了一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机程序可操作来使计算机执行如本申请前述各个实施例中的对系统错误进行重复识别的方法。
此外,上述附图仅是根据本申请示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的申请后,将容易想到本申请的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由权利要求指出。

Claims (20)

  1. 一种对系统错误进行重复识别的方法,所述方法包括:
    基于用于进行比对的两个系统问题,获取两个所述系统问题对应的上下文信息,其中,所述上下文信息包括系统问题所产生原因的文本、系统问题所产生原因的截图、产生系统问题的功能模块信息以及产生系统问题的设备信息;
    确定两个所述系统问题对应的上下文信息之间的相似度;
    将两个所述系统问题对应的上下文信息之间的相似度与预定阈值进行比对得到比对结果;
    基于所述比对结果确定两个所述系统问题是否为同一个系统错误所对应的系统问题。
  2. 根据权利要求1所述的方法,其中,所述确定两个所述系统问题对应的上下文信息之间的相似度的步骤,包括:
    比对两个所述系统问题对应的上下文信息中系统问题所产生原因的文本,确定第一相似分数;
    比对两个所述系统问题对应的上下文信息中系统问题所产生原因的截图,确定第二相似分数;
    比对两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息,确定第三相似分数;
    比对两个所述系统问题对应的上下文信息中产生系统问题的设备信息,确定第四相似分数;
    基于所述第一相似分数、所述第二相似分数、所述第三相似分数以及所述第四相似分数,确定两个所述系统问题对应的上下文信息之间的相似度。
  3. 根据权利要求2所述的方法,其中,所述基于所述第一相似分数、所述第二相似分数、所述第三相似分数以及所述第四相似分数,确定两个所述系统问题对应的上下文信息之间的相似度,包括:
    基于以下公式确定两个系统问题之间的相似度:
    Figure PCTCN2019117684-appb-100001
    其中,α和β为大于1的正常数,A为所述第一相似分数,B为所述第二相似分数,C为所述第三相似分数,D为所述第四相似分数,S为两个系统问题对应的上下文信息之间的相似度,e为自然常数。
  4. 根据权利要求2所述的方法,其中,所述第一相似分数基于以下方法确定:
    将两个所述系统问题对应的上下文信息中系统问题所产生原因的文本中的标题和内容分别进行分词;
    针对每个所述系统问题对应的上下文信息中系统问题所产生原因的文本中的标题和内容,确定分出的每个词在分出的词中的出现次数,将出现次数高于预定出现次数阈值的词作为所述系统问题对应的上下文信息中系统问题所产生原因中的关键词;
    基于两个所述系统问题对应的关键词的交集中的关键词数除以两个所述系统问题对应的关键词的并集中的关键词数,得到第一相似分数。
  5. 根据权利要求2所述的方法,其特征在于,所述第二相似分数基于以下方法确定:
    对两个所述系统问题对应的上下文信息中系统问题所产生原因的截图进行光学字符识别,获得从所述截图中识别出的字符;
    基于对两个所述系统问题识别出的字符中重合的字符数除以对两个所述系统问题识别出的字符数之和,得到第二相似分数。
  6. 根据权利要求2所述的方法,其特征在于,所述第三相似分数基于以下方法确定:
    将两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息进行比对;
    若两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息一致,则获取预设的第一分数作为第三相似分数;
    若两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息不一致,则确定所述第三相似分数为零;
    所述第四相似分数基于以下方法确定:
    将两个所述系统问题对应的上下文信息中产生系统问题的设备信息进行比对;
    若两个所述系统问题对应的上下文信息中产生系统问题的设备信息一致,则获取预设的第二分数作为第四相似分数;
    若两个所述系统问题对应的上下文信息中产生系统问题的设备信息不一致,则确定所述第四相似分数为零。
  7. 根据权利要求1所述的方法,其特征在于,所述基于所述比对结果确定两个所述系统问题是否为同一个系统错误所对应的系统问题的步骤,包括:
    若所述比对结果为两个所述系统问题对应的上下文信息之间的相似度大于或者等于预定阈值,则确定两个所述系统问题为同一个系统错误所对应的系统问题;
    若所述比对结果为两个所述系统问题对应的上下文信息之间的相似度小于预定阈值,则确定两个所述系统问题不是同一个系统错误所对应的系统问题。
  8. 一种对系统错误进行重复识别的装置,所述装置包括:
    获取单元,用于基于用于进行比对的两个系统问题,获取两个所述系统问题对应的上下文信息,其中,所述上下文信息包括系统问题所产生原因的文本、系统问题所产生原因的截图、产生系统问题的功能模块信息以及产生系统问题的设备信息;
    第一执行单元,用于确定两个所述系统问题对应的上下文信息之间的相似度;
    比对单元,用于将两个所述系统问题对应的上下文信息之间的相似度与预定阈值进行比对得到比对结果;
    第二执行单元,用于基于所述比对结果确定两个所述系统问题是否为同一个系统错误所对应的系统问题。
  9. 根据权利要求8所述的对系统错误进行重复识别的装置,其中,所述第一执行单 元被配置为:
    比对两个所述系统问题对应的上下文信息中系统问题所产生原因的文本,确定第一相似分数;
    比对两个所述系统问题对应的上下文信息中系统问题所产生原因的截图,确定第二相似分数;
    比对两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息,确定第三相似分数;
    比对两个所述系统问题对应的上下文信息中产生系统问题的设备信息,确定第四相似分数;
    基于所述第一相似分数、所述第二相似分数、所述第三相似分数以及所述第四相似分数,确定两个所述系统问题对应的上下文信息之间的相似度。
  10. 根据权利要求9所述的对系统错误进行重复识别的装置,其中,所述第一执行单元120被配置为:
    基于以下公式确定两个系统问题之间的相似度:
    Figure PCTCN2019117684-appb-100002
    其中,α和β为大于1的正常数,A为所述第一相似分数,B为所述第二相似分数,C为所述第三相似分数,D为所述第四相似分数,S为两个系统问题对应的上下文信息之间的相似度,e为自然常数。
  11. 根据权利要求9所述的对系统错误进行重复识别的装置,其中,所述第一执行单元被配置为:
    将两个所述系统问题对应的上下文信息中系统问题所产生原因的文本中的标题和内容分别进行分词;
    针对每个所述系统问题对应的上下文信息中系统问题所产生原因的文本中的标题和内容,确定分出的每个词在分出的词中的出现次数,将出现次数高于预定出现次数阈值的词作为所述系统问题对应的上下文信息中系统问题所产生原因中的关键词;
    基于两个所述系统问题对应的关键词的交集中的关键词数除以两个所述系统问题对应的关键词的并集中的关键词数,得到第一相似分数。
  12. 根据权利要求9所述的对系统错误进行重复识别的装置,其中,所述第一执行单元被配置为:
    对两个所述系统问题对应的上下文信息中系统问题所产生原因的截图进行光学字符识别,获得从所述截图中识别出的字符;
    基于对两个所述系统问题识别出的字符中重合的字符数除以对两个所述系统问题识别出的字符数之和,得到第二相似分数。
  13. 根据权利要求9所述的对系统错误进行重复识别的装置,其中,所述第一执行单元被配置为:
    将两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息进行比对;
    若两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息一致,则获取预设的第一分数作为第三相似分数;
    若两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息不一致,则确定所述第三相似分数为零;
    将两个所述系统问题对应的上下文信息中产生系统问题的设备信息进行比对;
    若两个所述系统问题对应的上下文信息中产生系统问题的设备信息一致,则获取预设的第二分数作为第四相似分数;
    若两个所述系统问题对应的上下文信息中产生系统问题的设备信息不一致,则确定所述第四相似分数为零。
  14. 根据权利要求8所述的对系统错误进行重复识别的装置,其中,所述第二执行单元被配置为:
    若所述比对结果为两个所述系统问题对应的上下文信息之间的相似度大于或者等于预定阈值,则确定两个所述系统问题为同一个系统错误所对应的系统问题;
    若所述比对结果为两个所述系统问题对应的上下文信息之间的相似度小于预设阈值,则确定两个所述系统问题不是同一个系统错误所对应的系统问题。
  15. 一种电子设备,包括处理器;以及存储器,用于存储所述处理器的对系统错误进行重复识别的程序;其中,所述处理器配置为经由执行所述对系统错误进行重复识别的程序来执行以下处理方法:
    基于用于进行比对的两个系统问题,获取两个所述系统问题对应的上下文信息,其中,所述上下文信息包括系统问题所产生原因的文本、系统问题所产生原因的截图、产生系统问题的功能模块信息以及产生系统问题的设备信息;
    确定两个所述系统问题对应的上下文信息之间的相似度;
    将两个所述系统问题对应的上下文信息之间的相似度与预定阈值进行比对得到比对结果;
    基于所述比对结果确定两个所述系统问题是否为同一个系统错误所对应的系统问题。
  16. 根据权利要求15所述的电子设备,其中,所述确定两个所述系统问题对应的上下文信息之间的相似度,包括:
    比对两个所述系统问题对应的上下文信息中系统问题所产生原因的文本,确定第一相似分数;
    比对两个所述系统问题对应的上下文信息中系统问题所产生原因的截图,确定第二相似分数;
    比对两个所述系统问题对应的上下文信息中产生系统问题的功能模块信息,确定第三相似分数;
    比对两个所述系统问题对应的上下文信息中产生系统问题的设备信息,确定第四相似分数;
    基于所述第一相似分数、所述第二相似分数、所述第三相似分数以及所述第四相似分数,确定两个所述系统问题对应的上下文信息之间的相似度。
  17. 根据权利要求16所述的电子设备,其中,所述基于所述第一相似分数、所述第二相似分数、所述第三相似分数以及所述第四相似分数,确定两个所述系统问题对应的上下文信息之间的相似度,包括:
    基于以下公式确定两个系统问题之间的相似度:
    Figure PCTCN2019117684-appb-100003
    其中,α和β为大于1的正常数,A为所述第一相似分数,B为所述第二相似分数,C为所述第三相似分数,D为所述第四相似分数,S为两个系统问题对应的上下文信息之间的相似度,e为自然常数。
  18. 根据权利要求16所述的电子设备,其中,所述第一相似分数基于以下方法确定:
    将两个所述系统问题对应的上下文信息中系统问题所产生原因的文本中的标题和内容分别进行分词;
    针对每个所述系统问题对应的上下文信息中系统问题所产生原因的文本中的标题和内容,确定分出的每个词在分出的词中的出现次数,将出现次数高于预定出现次数阈值的词作为所述系统问题对应的上下文信息中系统问题所产生原因中的关键词;
    基于两个所述系统问题对应的关键词的交集中的关键词数除以两个所述系统问题对应的关键词的并集中的关键词数,得到第一相似分数。
  19. 根据权利要求16所述的电子设备,其中,所述第二相似分数基于以下方法确定:
    对两个所述系统问题对应的上下文信息中系统问题所产生原因的截图进行光学字符识别,获得从所述截图中识别出的字符;
    基于对两个所述系统问题识别出的字符中重合的字符数除以对两个所述系统问题识别出的字符数之和,得到第二相似分数。
  20. 一种计算机可读存储介质,其上存储有对系统错误进行重复识别的程序,其特征在于,所述对系统错误进行重复识别的程序被处理器执行时实现权利要求1至7任一项所述的方法。
PCT/CN2019/117684 2019-08-01 2019-11-12 对系统错误进行重复识别的方法、装置、电子设备和计算机可读存储介质 WO2021017288A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910708623.7 2019-08-01
CN201910708623.7A CN110618888A (zh) 2019-08-01 2019-08-01 对系统错误进行重复识别的方法和相关装置

Publications (1)

Publication Number Publication Date
WO2021017288A1 true WO2021017288A1 (zh) 2021-02-04

Family

ID=68921392

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2019/117684 WO2021017288A1 (zh) 2019-08-01 2019-11-12 对系统错误进行重复识别的方法、装置、电子设备和计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN110618888A (zh)
WO (1) WO2021017288A1 (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107085744A (zh) * 2016-02-12 2017-08-22 波音公司 利用数据分析增强的飞机维护和检查
CN107167497A (zh) * 2017-06-27 2017-09-15 北京必可测科技股份有限公司 一种设备故障检测方法及系统
US20170278067A1 (en) * 2016-03-25 2017-09-28 International Business Machines Corporation Monitoring activity to detect potential user actions

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106201757B (zh) * 2016-07-12 2020-05-26 网易(杭州)网络有限公司 一种异常处理方法和装置
CN106708704B (zh) * 2016-12-23 2021-01-12 北京奇虎科技有限公司 一种对崩溃日志进行分类的方法和装置
CN107241212A (zh) * 2017-04-20 2017-10-10 努比亚技术有限公司 一种日志处理方法及装置、设备
CN108460098B (zh) * 2018-02-01 2023-04-07 北京百度网讯科技有限公司 信息推荐方法、装置和计算机设备
CN108427714A (zh) * 2018-02-02 2018-08-21 北京邮电大学 基于机器学习的房源重复记录识别方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107085744A (zh) * 2016-02-12 2017-08-22 波音公司 利用数据分析增强的飞机维护和检查
US20170278067A1 (en) * 2016-03-25 2017-09-28 International Business Machines Corporation Monitoring activity to detect potential user actions
CN107167497A (zh) * 2017-06-27 2017-09-15 北京必可测科技股份有限公司 一种设备故障检测方法及系统

Also Published As

Publication number Publication date
CN110618888A (zh) 2019-12-27

Similar Documents

Publication Publication Date Title
US10095610B2 (en) Testing applications with a defined input format
WO2018157840A1 (zh) 语音识别测试方法及测试终端、计算设备及存储介质
EP4006909B1 (en) Method, apparatus and device for quality control and storage medium
JP7153004B2 (ja) コミュニティ質問応答データの検証方法、装置、コンピュータ機器、及び記憶媒体
US10621507B2 (en) System and method for generating an optimized result set using vector based relative importance measure
US20180068222A1 (en) System and Method of Advising Human Verification of Machine-Annotated Ground Truth - Low Entropy Focus
WO2021174812A1 (zh) 用于画像的数据的清洗方法、装置、介质及电子设备
CN110704390B (zh) 获取服务器维护脚本的方法、装置、电子设备及介质
WO2020140619A1 (zh) 基于机器学习的系统升级失败的诊断方法、装置、计算机设备及计算机可读存储介质
WO2021196935A1 (zh) 数据校验方法、装置、电子设备和存储介质
CN110348471B (zh) 异常对象识别方法、装置、介质及电子设备
US20140122069A1 (en) Automatic Speech Recognition Accuracy Improvement Through Utilization of Context Analysis
KR20210098397A (ko) 차량용 기기의 응답 속도 테스트 방법, 장치, 기기 및 저장매체
CN112148766A (zh) 利用人工神经网络模型进行数据抽样的方法和系统
CN110874364B (zh) 一种查询语句处理方法、装置、设备及存储介质
WO2020052060A1 (zh) 用于生成修正语句的方法和装置
WO2021174814A1 (zh) 众包任务的答案验证方法、装置、计算机设备及存储介质
CN113656391A (zh) 数据检测方法及装置、存储介质及电子设备
CN113553309A (zh) 一种日志模板的确定方法、装置、电子设备及存储介质
US20230070966A1 (en) Method for processing question, electronic device and storage medium
JP2019036210A (ja) 機械学習を利用したfaq登録支援方法、及びコンピュータシステム
WO2023060954A1 (zh) 数据处理与数据质检方法、装置及可读存储介质
CN109766260B (zh) 配置测试动作的方法、装置、电子设备和存储介质
WO2020252880A1 (zh) 反向图灵验证方法及装置、存储介质、电子设备
CN109684207B (zh) 操作序列封装的方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19939241

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19939241

Country of ref document: EP

Kind code of ref document: A1