CN112861478B - 面向云服务事件联系的时变状态空间向量的构造方法 - Google Patents

面向云服务事件联系的时变状态空间向量的构造方法 Download PDF

Info

Publication number
CN112861478B
CN112861478B CN202110145205.9A CN202110145205A CN112861478B CN 112861478 B CN112861478 B CN 112861478B CN 202110145205 A CN202110145205 A CN 202110145205A CN 112861478 B CN112861478 B CN 112861478B
Authority
CN
China
Prior art keywords
log
cloud service
attribute
event
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110145205.9A
Other languages
English (en)
Other versions
CN112861478A (zh
Inventor
李肖坚
蒋以义
夏春和
胡航平
张振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi Normal University
Original Assignee
Guangxi Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi Normal University filed Critical Guangxi Normal University
Priority to CN202110145205.9A priority Critical patent/CN112861478B/zh
Publication of CN112861478A publication Critical patent/CN112861478A/zh
Application granted granted Critical
Publication of CN112861478B publication Critical patent/CN112861478B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种面向云服务事件联系的时变状态空间向量的构造方法,用于揭示云服务事件之间的联系,以方便溯源云服务事件的安全判断。本发明方法包括有:句法化云服务日志;构建云服务事件本体;依据字段含义、巴克斯范式(BNF)和标准分(Z分)设立映射规则;构造并生成云服务事件的状态空间向量。本发明方法相较于已有的构造向量的技术具有使用资源较少,复杂性较低,可操作性强的优点。本发明方法具有既不依赖词库,也不依赖词频,可处理字符串,可处理无结构化的日志,尤其是不确定性的云服务日志的优点。

Description

面向云服务事件联系的时变状态空间向量的构造方法
技术领域
本发明涉及云服务器的网络安全的技术领域,更特别地说,是指一种面向云服务事件联系的时变状态空间向量构造方法。
背景技术
云服务器(Elastic Compute Service,ECS)是一种简单高效、安全可靠、处理能力可弹性伸缩的计算服务。其管理方式比物理服务器更简单高效。用户无需提前购买硬件,即可迅速创建或释放任意多台云服务器。云服务器帮助用户快速构建更稳定、安全的应用,降低开发运维的难度和整体IT(Internet Technology)成本,使您能够更专注于核心业务的创新。云服务日志是指ECS运行时产生的一个过程和经历的记录。
网络安全是指通过采用各种技术和管理措施,使网络系统的硬件、软件及其系统中的数据受到保护,不因偶然的或者恶意的原因而遭受到破坏、更改、泄露,网络系统连续可靠正常地运行,网络服务不中断。从而确保网络数据的保密性、完整性、可用性、可控性、可审查性的特性。
大数据计算服务(MaxCompute)是阿里巴巴内部发展的一个高效能、低成本,高可用的EB级大数据计算服务,在集团内部每天处理超过EB级的数据量。MaxCompute是面向大数据处理的分布式系统,主要提供结构化数据的存储和计算,是阿里巴巴云计算整体解决方案中最核心的主力产品之一。
云服务具有时变特性。云服务安全事件发生之前可能已经有前兆,其中,云服务事件之间的异常交互是导致云服务安全事件发生的重要因素,揭示云服务事件之间的联系可为安全溯源提供机遇。一些学者希望通过仅有的残片数据,发现这些云服务事件之间的联系。现已有可通过输入序列数据,采用神经网络等,抽取联系。而云服务事件具有时变特性,以日志的形式呈现,数据量大,包含大量字符串,并非序列数据,且为无结构化数据,尚不能直接参与运算,更不能利用不确定性的神经网络发现云服务事件之间的联系。
目前已有构造空间向量的方法,在处理无结构化的云服务日志存在几点不足:
第一是需要建立在词库的基础上,因词库的有限性,只能表示有限的符号为向量,这类方法即无法处理任意字符串,更不能处理无结构的云服务日志。
第二是建立在词频的基础上,因大数据离散性高,词频不足以区分云服务日志的每一个词。
第三是建立在编码的基础上,因云服务日志的稀疏特性,导致表示出的向量有了大量无意义的值,给存储以及计算造成了巨大的负担。
由此可见,现有的构造向量技术尚不能处理非句法结构的云服务日志,缺乏从数据语义转联系语义的途径,这些不足制约了将云服务日志转换为状态向量。
发明内容
为了解决现有技术中不能从云服务日志到联系的时变状态空间向量的技术问题,本发明提出了一种面向云服务事件联系的时变状态空间向量的构造方法。本发明方法首先依据云服务日志各字段的含义,以及汉语的句法化结构,调整云服务日志记录的各个字段位置,使无结构化的云服务日志记录符合汉语的常式句式,并抽取出句子使之能够成为一个云服务事件。句法化云服务日志记录可确定云服务记录的各个字段之间的关系;构造云服务事件的语义本体,依据云服务事件的各个维以及各个维之间的关系,给出语义本体,使之成为一个整体;类比处理自然语言的word2vec方法,抽象word2vec方法,给出变换函数;将该思想应用于云服务事件,设立映射规则,映射云服务事件为状态空间向量。应用笛卡尔积的方法,面向联系构造云服务事件的联系样本。
本发明的一种面向云服务事件联系的时变状态空间向量的构造方法,其特征在于有下列步骤:
步骤一,解读云服务日志,明确云服务日志的每一条记录的各字段含义;
步骤101,收集一段时间里的云服务日志记录,采用集合形式表示为云服务日志集
Figure BDA0002929781300000021
步骤102,设置字段内容格式,记为FCF;
Figure BDA0002929781300000022
步骤103,采用字段内容格式FCF对云服务日志集
Figure BDA0002929781300000023
中的各个云服务日志进行字段含义的提取,得到字段含义表征的日志集,记为CSLFCF,且
Figure BDA0002929781300000024
其中:
步骤二,句法化处理,构建句法化-日志集;
步骤201,设置句法化结构集,记为SSY;
Figure BDA0002929781300000025
步骤202,将字段含义表征的日志集CSLFCF中的各个日志分别与句法化结构集SSY中的句法化结构进行自然语言的汉语句法化描述匹配,得到句法化结构的句法化-日志集,记为CSL_SSY;
Figure BDA0002929781300000026
步骤四,依据云服务事件的语义本体判断日志-事件的属性;
步骤401,设置云服务事件的语义本体,记为CSE;
所述CSE=<ID,DEP,time,status,RETRY,LOAD,SR>;
步骤402,日志-事件的属性判断;
采用CSE=<ID,DEP,time,status,RETRY,LOAD,SR>对
Figure BDA0002929781300000027
中的各个日志-事件进行属性判断,得到日志-属性集,记为CSL_CSE;
所述
Figure BDA0002929781300000031
步骤六,构造时变状态空间向量;
步骤601,依据日志-属性匹配日志-映射规则,得到规则匹配后的标记日志;
对日志-属性集
Figure BDA0002929781300000032
中的各个日志-属性与日志-映射规则集
Figure BDA0002929781300000033
中的各个规则进行映射处理,得到规则匹配后的标记日志集,记为CSL_LLNLP;
在本发明中,所述规则匹配后的标记日志集
Figure BDA0002929781300000034
中:
读入日志-事件集
Figure BDA0002929781300000035
读入日志-映射规则集
Figure BDA0002929781300000036
如果任意一条日志-事件中记录的字段属于云服务事件的语义本体CSE=<ID,DEP,time,status,RETRY,LOAD,SR>中的标识属性ID,则应用BNF(巴克斯范式)映射规则,映射该字段为标识维向量,并赋值给IDvalues(标识集合);
如果该日志-事件中记录的字段属于状态属性status,则应用映射状态的规则,映射该字段为状态维的向量,并赋值给Svalues(状态集合);
如果日志-事件中记录的字段属于重试属性RETRY或载荷属性LOAD,则应用Z分的映射规则,映射该字段为重试维或载荷维的向量,并赋值给Zvalues(标准分集合);
如果日志-事件中记录的字段属于时间属性time,则直接赋值给Tvalues(时刻集合);
最后,应用日志-映射规则集
Figure BDA0002929781300000041
调整各个维度值的位置,构造得到一条日志-事件的规则匹配后的标记日志,再将所述的规则匹配后的标记日志添加至Cloud-Log2vec(云服务日志向量集合)中;
遍历完成所有日志-事件和日志-映射规则,从而构造得到云服务日志的状态空间向量;
步骤七,面向时变空间向量-日志之间的联系,构造云服务的事件-关联向量;
对时变空间向量-日志集
Figure BDA0002929781300000042
中的两两时变空间向量-日志做笛卡尔积,构造并生成事件-关联向量对Pairi,j;然后将每一个所述的事件-关联向量对作为一个联系样本,每一个样本是62维的向量;
事件-关联向量对的数目为z(z-1)对,z表示云服务日志的总条数。
本发明面向云服务事件联系的时变状态空间向量的构造方法的优点在于:
①采用汉语句式,句法化云服务日志记录,使之成为一个事件,处理无结构化的记录为结构化的事件,给出一个从数据语义转联系语义的途径。
②应用BNF、标准分等设立映射规则,向量化云服务事件,以较少的规则处理任意量的云服务日志,生成与服务事件向量。
③在难于建立词库、统计词频的情况下,可将云服务日志构造成向量;
④构建多层句法结构,可多层次匹配云服务日志;
⑤构建云服务事件的语义本体,可判断“日志-事件”的属性;
⑥构造云服务事件联系的向量对样本,设立筛选伪标签的规则,应用半监督SVM预测云服务事件之间的联系,可检验构造状态空间向量的有效性。
附图说明
图1是云服务日志。
图2是本发明的一种面向云服务事件联系的时变状态空间向量的构造方法的流程图。
图3是本发明的句法化结构图。
图4是本发明中进行映射规则匹配的流程图。
图5是本发明中时变状态空间向量的构造示意图。
具体实施方式
下面将结合附图和实施例对本发明做进一步的详细说明。
本发明处理的对象是云服务日志,参见图1所示的云服务日志记录,每一条云服务日志是来源于大数据计算服务(MaxCompute)的存储/计算层中的MR job模块、SQL job模块等。大数据计算服务(MaxCompute)为阿里云专有云企业版,在2020年11月18日发表的《大数据计算服务产品简介》的第11页中。产品版本:V3.12.0。
云服务日志,记为Log,多条云服务日志采用集合形式表示记为云服务日志集
Figure BDA0002929781300000051
其中:
Log1表示第一条云服务日志。
Log2表示第二条云服务日志。
Logi表示第i条云服务日志。
Logj表示第j条云服务日志。
Logy表示第y条云服务日志。
Logz表示最后一条云服务日志。下角标z表示云服务日志的总条数。
在本发明中,为了方便说明,Logi也称为任意一条云服务日志,下角标i表示云服务日志的标识号。
在本发明中,Logi、Logj和Logy为不同的云服务日志。
设置字段内容格式
在本发明中,设置的字段内容格式,记为FCF,且
Figure BDA0002929781300000052
表1字段内容中包含的中文语音和实现的功能
Figure BDA0002929781300000061
参见图3所示本发明设计的句法化结构图中,分为五层结构,从上至下的句法化包含的内容就越多。
句法化结构A
在本发明中,句法化结构A是指将云服务日志从自然语言的角度划分为主语和谓语结构。句法化结构A表示为SY_A=主语||谓语。
句法化结构B
在本发明中,句法化结构B是指是指将云服务日志从自然语言的角度划分为主语、谓语和补语结构。句法化结构B表示为SY_B=主语||谓语<补语>。
句法化结构C
在本发明中,句法化结构C是指是指将云服务日志从自然语言的角度划分为归属定语、主语、谓语和补语结构。句法化结构C表示为SY_C=(归属定语)主语||谓语<补语>。
句法化结构D
在本发明中,句法化结构D是指是指将云服务日志从自然语言的角度划分为时间状语、归属定语、主语、谓语和补语结构。句法化结构D表示为SY_D=[时间状语](归属定语)主语||谓语<补语>。
句法化结构E
在本发明中,句法化结构E是指是指将云服务日志从自然语言的角度划分为方式状语、时间状语、归属定语、主语、谓语和补语结构。句法化结构E表示为SY_E=[时间状语](归属定语)主语||[方式状语]谓语<补语>。
在本发明中,将上述的句法化结构采用集合形式表示为,句法化结构集SSY,且
Figure BDA0002929781300000071
在本发明中,依据类比NLP(Natural Language Processing)的word2vec方法,设定的日志-映射规则集LLNLP,所述日志-映射规则集LLNLP中包括有12个日志-映射规则,采用集合形式表示为
Figure BDA0002929781300000072
日志-映射规则一
日志-映射规则一,记为rule4job。rule4job是指应用BNF处理云服务日志中的“job_name”字段,取作业名的作业号。
rule4job描述为
Figure BDA0002929781300000073
日志-映射规则二
日志-映射规则二,记为rule4machine。rule4machine是指应用BNF处理云服务日志中的“machine_id”字段,取云服务器的机器号。
rule4machine描述为
Figure BDA0002929781300000081
日志-映射规则三
日志-映射规则三,记为rule4task。rule4task是指应用BNF处理云服务日志中的“task_name”字段,取任务名的任务号为无符号整数。
rule4task描述为
Figure BDA0002929781300000082
<M|R|J>中的M表示映射任务(Maptask),R表示规约任务(Reducetask),J表示连接任务(Jointask)。上角标“*”表示有0次或多次。
日志-映射规则四
日志-映射规则四,记为rule4dep。rule4dep是指取任务名中的依赖串作为任务关联维,在任务关联维(依赖串)中,令符号DEP表示任务依赖,且DEP={dep1,dep2,…,depδ,…,depn},dep1表示该任务的第一个依赖项,dep2表示该任务的第二个依赖项,depδ表示该任务的第δ个依赖项,depn表示该任务的第n个依赖项。
rule4dep描述为DEP={dep1,dep2,…,depδ,…,depn}。
日志-映射规则五
日志-映射规则五,记为rule4inst。rule4inst是指应用BNF处理云服务日志中的“inst_name”字段,取实例名的实例号。
rule4inst描述为
Figure BDA0002929781300000083
日志-映射规则六
日志-映射规则六,记为rule4time。rule4time是指开始时刻或结束时刻为数值,取其开始时刻或结束时刻为无符号整数即可。
rule4time描述为
Figure BDA0002929781300000084
日志-映射规则七
日志-映射规则七,记为rule4incident_status。rule4incident_status是指“Failed”或“Interrupted”状态,表示该实例为异常实例,映射为“-1”。
rule4incident_status描述为
Figure BDA0002929781300000085
{'Failed'∨'Interrupted'}→-1。
日志-映射规则八
日志-映射规则八,记为rule4unknown_status。rule4unknown_status是指“Ready”、“Running”或“Terminating”状态,表示该实例尚未输出结果,列为未知,映射为“0”。
rule4unknown_status描述为
Figure BDA0002929781300000086
{'Ready'∨'Running'∨'Terminating'}→0。
日志-映射规则九
日志-映射规则九,记为rule4normal_status。rule4normal_status是指“Terminated”状态表示该实例已经输出结果,列为正常情况,映射为“+1”。
rule4normal_status描述为
Figure BDA0002929781300000091
{'Terminated'}→+1。
日志-映射规则十
日志-映射规则十,记为rule4retry。rule4retry是指计算“seq_no”和“total_seq_no”两个字段值的Z分。蕴含着该实例是否发生重启。
rule4retry描述为
Figure BDA0002929781300000092
{seq_no∨total_seq_no}→Zvalues。
日志-映射规则十一
日志-映射规则十一,记为rule4load。rule4load是指计算“cpu_avg”、“cpu_max”、“mem_avg”和“mem_max”四个字段值的Z分。蕴含着该实例所需硬件资源的情况。
rule4load描述为
Figure BDA0002929781300000093
{cpu_avg∨cpu_max∨mem_avg∨mem_max}→Zvalues。
日志-映射规则十二
日志-映射规则十二,记为rule4null。rule4null是指将该字段的所有值求标准分。空值填“0”值。当实例出现某些状态时,“cpu_avg”、“cpu_max”、“mem_avg”和“mem_max”字段存在空值现象。
rule4null描述为:
Figure BDA0002929781300000094
在本发明中,针对云服务事件设置有6种状态属性,分别为Failed状态、Interrupted状态、Ready状态、Running状态、Terminating状态和Terminated状态,依据状态值的含义设定的日志-映射规则是规则七至规则九。
Failed为失败状态、Interrupted为中断状态、Ready为就绪状态、Running为运行状态、Terminating为准备终结状态和Terminated为终结状态。
在本发明中,云服务日志是来源于大数据计算服务(MaxCompute)的存储/计算层中的MR job模块、SQL job模块。
参见图2所示,本发明的一种面向云服务事件联系的时变状态空间向量的构造方法,包括有下列步骤:
步骤一,解读云服务日志,明确云服务日志的每一条记录的各字段含义;
步骤101,收集一段时间里的云服务日志记录,采用集合形式表示为云服务日志集
Figure BDA0002929781300000095
云服务日志的内容请参见图1所示。本发明运行的云服务日志记录来源于Alibabacluster trace v2018数据集。
步骤102,设置字段内容格式,记为FCF;
所述
Figure BDA0002929781300000096
步骤103,采用字段内容格式FCF对云服务日志集
Figure BDA0002929781300000101
中的各个云服务日志进行字段含义的提取,得到字段含义表征的日志集,记为CSLFCF,且
Figure BDA0002929781300000102
其中:
Figure BDA0002929781300000103
表示带有字段内容格式FCF的第一条云服务日志,简称为第一条字段格式日志。
Figure BDA0002929781300000104
表示带有字段内容格式FCF的第二条云服务日志,简称为第二条字段格式日志。
Figure BDA0002929781300000105
表示带有字段内容格式FCF的第i条云服务日志,简称为第i条字段格式日志。
Figure BDA0002929781300000106
表示带有字段内容格式FCF的第j条云服务日志,简称为第j条字段格式日志。
Figure BDA0002929781300000107
表示带有字段内容格式FCF的第y条云服务日志,简称为第y条字段格式日志。
Figure BDA0002929781300000108
表示带有字段内容格式FCF的最后一条云服务日志,简称为最后一条字段格式日志。
步骤二,句法化处理,构建句法化-日志集;
一般地,从自然语言的角度,用基础的句法化结构[状语],(定语)主语||(状语)谓语<补语>|(定语)宾语<补语>的句式能够描述任意一条字段含义表征的日志
Figure BDA0002929781300000109
记录。
在本发明中,采用句法化结构集SSY对字段含义表征的日志集
Figure BDA00029297813000001010
进行汉语语序的句法化描述,能够明确所述CSLFCF中各个字段之间的彼此联系,使无结构的日志转换为数据结构化的日志表征。
步骤201,设置句法化结构集,记为SSY;
所述
Figure BDA00029297813000001011
步骤202,将字段含义表征的日志集CSLFCF中的各个日志分别与句法化结构集SSY中的句法化结构进行自然语言的汉语句法化描述匹配,得到句法化结构的句法化-日志集,记为CSL_SSY。
所述
Figure BDA00029297813000001012
Figure BDA00029297813000001013
表示第一条句法化日志。
Figure BDA00029297813000001014
表示第二条句法化日志。
Figure BDA00029297813000001015
表示第i条句法化日志。
Figure BDA00029297813000001016
表示第j条句法化日志。
Figure BDA0002929781300000111
表示第y条句法化日志。
Figure BDA0002929781300000112
表示最后一条句法化日志。
例如,对
Figure BDA0002929781300000113
的句法化;
Figure BDA0002929781300000114
经汉语语序分析后,句法化结构SY_D=[时间状语](归属定语)主语||谓语<补语>与其适合,得到第一条字段格式日志的句法化-日志,记为
Figure BDA0002929781300000115
且:
Figure BDA0002929781300000116
例如,对
Figure BDA0002929781300000117
的句法化;
Figure BDA0002929781300000118
经汉语语序分析后,句法化结构SY_A=主语||谓语与其适合,得到第二条字段格式日志的句法化-日志,记为
Figure BDA0002929781300000119
且:
Figure BDA00029297813000001110
例如,对
Figure BDA00029297813000001111
的句法化;
Figure BDA00029297813000001112
经汉语语序分析后,句法化结构SY_B=主语||谓语<补语>与其适合,得到第i条字段格式日志的句法化-日志,记为
Figure BDA00029297813000001113
且:
Figure BDA00029297813000001114
例如,对
Figure BDA00029297813000001115
的句法化;
Figure BDA00029297813000001116
经汉语语序分析后,句法化结构SY_C=(归属定语)主语||谓语<补语>与其适合,得到第j条字段格式日志的句法化-日志,记为
Figure BDA00029297813000001117
且:
Figure BDA00029297813000001118
例如,对
Figure BDA00029297813000001119
的句法化;
Figure BDA00029297813000001120
经汉语语序分析后,句法化结构SY_D=[时间状语](归属定语)主语||谓语<补语>与其适合,得到第y条字段格式日志的句法化-日志,记为
Figure BDA00029297813000001121
且:
Figure BDA0002929781300000121
例如,对
Figure BDA0002929781300000122
的句法化;
Figure BDA0002929781300000123
经汉语语序分析后,句法化结构SY_E=[时间状语](归属定语)主语||[方式状语]谓语<补语>与其适合,得到最后一条字段格式日志的句法化-日志,记为
Figure BDA0002929781300000124
且:
Figure BDA0002929781300000125
记录下上述举例得到的不同句法化结构处理后的日志,得到:
Figure BDA0002929781300000126
步骤三,依据汉语习惯,构造日志-事件集;
在本发明中,依据汉语习惯,将句法化-日志集
Figure BDA0002929781300000127
中的各个句法化-日志描述为一个事件,记为日志-事件集EventCSL_SSY
所述
Figure BDA0002929781300000128
Figure BDA0002929781300000129
表示事件描述的第一条句法化日志。
Figure BDA00029297813000001210
表示事件描述的第二条句法化日志。
Figure BDA00029297813000001211
表示事件描述的第i条句法化日志。
Figure BDA00029297813000001212
表示事件描述的第j条句法化日志。
Figure BDA00029297813000001213
表示事件描述的第y条句法化日志。
Figure BDA00029297813000001214
表示事件描述的最后一条句法化日志。
例如,事件描述的
Figure BDA00029297813000001215
用事件描述第一条字段格式日志的句法化-日志
Figure BDA00029297813000001216
得到的日志-事件,记为
Figure BDA0002929781300000131
所述
Figure BDA0002929781300000132
体现为6句话,且:
Figure BDA0002929781300000133
例如,事件描述的
Figure BDA0002929781300000134
用事件描述第二条字段格式日志的句法化-日志
Figure BDA0002929781300000135
得到的日志-事件,记为
Figure BDA0002929781300000136
所述
Figure BDA0002929781300000137
体现为1句话,且:
Figure BDA0002929781300000138
例如,事件描述的
Figure BDA0002929781300000139
用事件描述第i条字段格式日志的句法化-日志
Figure BDA00029297813000001310
得到的日志-事件,记为
Figure BDA00029297813000001311
所述
Figure BDA00029297813000001312
体现为5句话,且:
Figure BDA00029297813000001313
例如,事件描述的
Figure BDA00029297813000001314
用事件描述第j条字段格式日志的句法化-日志
Figure BDA00029297813000001315
得到的日志-事件,记为
Figure BDA00029297813000001316
所述
Figure BDA00029297813000001317
体现为5句话,且:
Figure BDA00029297813000001318
例如,事件描述的
Figure BDA0002929781300000141
用事件描述第y条字段格式日志的句法化-日志
Figure BDA0002929781300000142
得到的日志-事件,记为
Figure BDA0002929781300000143
所述
Figure BDA0002929781300000144
体现为6句话,且:
Figure BDA0002929781300000145
例如,事件描述的
Figure BDA0002929781300000146
用事件描述最后一条字段格式日志的句法化-日志
Figure BDA0002929781300000147
得到的日志-事件,记为
Figure BDA0002929781300000148
所述
Figure BDA0002929781300000149
体现为6句话,且:
Figure BDA00029297813000001410
记录下上述举例得到的事件描述后的日志-事件,得到:
Figure BDA00029297813000001411
步骤四,依据云服务事件的语义本体判断日志-事件的属性;
在本发明中,为描述日志-事件集
Figure BDA0002929781300000151
中的各个日志-事件有什么及其关系,应用云服务事件的语义本体CSE=<ID,DEP,time,status,RETRY,LOAD,SR>对各个日志-事件进行属性判断。
步骤401,设置云服务事件的语义本体,记为CSE;
所述CSE=<ID,DEP,time,status,RETRY,LOAD,SR>;
ID是标识属性,指标识云服务事件施事者的属性。如作业名,任务名、实例名、机器编号。在本发明中,针对标识属性ID,应用巴克斯范式(Backus-Naur Form,简称BNF),并根据BNF表达式设立日志-映射规则。
DEP是关联属性,指描述云服务事件之间联系的属性。如日志归属某任务,这些任务与任务之间存在依赖关系,在云服务事件中,该属性蕴含在任务名中,本发明面向云服务事件之间的联系构造向量,即抽取依赖关系作为一个单独的属性。
time是时间属性,指描述云服务事件的起始时刻与结束时刻的属性。
status是状态属性,指描述云服务事件呈现何种状态的属性。
RETRY是重试属性,指描述云服务事件是否存在重启的属性。
LOAD是载荷属性,指描述云服务事件使用硬件资源的属性。
SR是句法关系,指描述在同一个云服务事件中的标识属性、依赖属性、时间属性、状态属性、重试属性和载荷属性之间的关系。
Figure BDA0002929781300000152
步骤402,日志-事件的属性判断;
采用CSE=<ID,DEP,time,status,RETRY,LOAD,SR>对
Figure BDA0002929781300000153
中的各个日志-事件进行属性判断,得到日志-属性集,记为CSL_CSE。
所述
Figure BDA0002929781300000154
Figure BDA0002929781300000155
表示第一条日志-属性。
Figure BDA0002929781300000156
表示第二条日志-属性。
Figure BDA0002929781300000157
表示第i条日志-属性。
Figure BDA0002929781300000158
表示第j条日志-属性。
Figure BDA0002929781300000159
表示第y条日志-属性。
Figure BDA00029297813000001510
表示最后一条日志-属性。
例如,第一条日志-属性
Figure BDA0002929781300000161
Figure BDA0002929781300000162
例如,第二条日志-属性
Figure BDA0002929781300000163
Figure BDA0002929781300000164
例如,第i条日志-属性
Figure BDA0002929781300000165
Figure BDA0002929781300000166
例如,第j条日志-属性
Figure BDA0002929781300000167
Figure BDA0002929781300000168
例如,第y条日志-属性
Figure BDA0002929781300000169
Figure BDA00029297813000001610
例如,最后一条日志-属性
Figure BDA00029297813000001611
Figure BDA00029297813000001612
步骤五,设置日志-映射规则集,记为LLNLP;
在本发明中,日志-映射规则集LLNLP是依据类比NLP(Natural LanguageProcessing)的word2vec方法来设定的。
NLP的word2vec方法抽象为
Figure BDA0002929781300000171
{word}×{(word,vector)}→{word′s_vector}描述。
Figure BDA0002929781300000172
表示映射函数。
{word}表示待映射的字或词。
{(word,vector)}表示词库,词与向量一一对应的集合。
{word′s_vector}表示为词向量集合。
在本发明中,word2vec方法适用的词库实际上是词转向量的映射规则,将该思想应用于处理日志-事件集
Figure BDA0002929781300000173
分析“词”,设立的映射规则有十二种,即日志-映射规则集LLNLP。
所述
Figure BDA0002929781300000174
例如:
Figure BDA0002929781300000175
步骤六,构造时变状态空间向量;
步骤601,依据日志-属性匹配日志-映射规则,得到规则匹配后的标记日志;
对日志-属性集
Figure BDA0002929781300000176
中的各个日志-属性与日志-映射规则集
Figure BDA0002929781300000181
中的各个规则进行映射处理,得到规则匹配后的标记日志集,记为CSL_LLNLP。
在本发明中,所述规则匹配后的标记日志集
Figure BDA0002929781300000182
中:
Figure BDA0002929781300000183
表示第一条规则匹配后的标记日志。
Figure BDA0002929781300000184
表示第二条规则匹配后的标记日志。
Figure BDA0002929781300000185
表示第i条规则匹配后的标记日志。
Figure BDA0002929781300000186
表示第j条规则匹配后的标记日志。
Figure BDA0002929781300000187
表示第y条规则匹配后的标记日志。
Figure BDA0002929781300000188
表示最后一条规则匹配后的标记日志。
例如,第一条规则匹配后的标记日志
Figure BDA0002929781300000189
Figure BDA00029297813000001810
例如,第二条规则匹配后的标记日志
Figure BDA00029297813000001811
Figure BDA00029297813000001812
例如,第i条规则匹配后的标记日志
Figure BDA0002929781300000191
Figure BDA0002929781300000192
例如,第j条规则匹配后的标记日志
Figure BDA0002929781300000193
Figure BDA0002929781300000194
例如,第y条规则匹配后的标记日志
Figure BDA0002929781300000195
Figure BDA0002929781300000196
例如,最后一条规则匹配后的标记日志
Figure BDA0002929781300000201
Figure BDA0002929781300000202
步骤602,对规则映射后的标记日志进行31维度的时变状态空间向量构造,得到时变空间向量-日志集,记为CSL_LLNLP向量
在本发明中,所述时变空间向量-日志集
Figure BDA0002929781300000203
Figure BDA0002929781300000204
表示规则映射后的第一条规则匹配后的标记日志,简称为第一条时变空间向量-日志。
Figure BDA0002929781300000205
表示规则映射后的第二条规则匹配后的标记日志,简称为第二条时变空间向量-日志。
Figure BDA0002929781300000206
表示规则映射后的第i条规则匹配后的标记日志,简称为第i条时变空间向量-日志。
Figure BDA0002929781300000207
表示规则映射后的第j条规则匹配后的标记日志,简称为第j条时变空间向量-日志。
Figure BDA0002929781300000208
表示规则映射后的第y条规则匹配后的标记日志,简称为第y条时变空间向量-日志。
Figure BDA0002929781300000209
表示规则映射后的最后一条规则匹配后的标记日志,简称为最后一条时变空间向量-日志。
例如,第一条时变空间向量-日志
Figure BDA0002929781300000211
Figure BDA0002929781300000212
其中,第1行为定语(归属标识属性ID);第2行为主语(实例标识属性ID);第3行为和第4行为定语(关联属性);第5行为时间状语(时间属性);第6行为谓语(状态属性);第7行为补语(载荷属性)。
例如,第二条时变空间向量-日志
Figure BDA0002929781300000213
Figure BDA0002929781300000214
其中,第1行为主语(实例标识属性ID);第2行为谓语(状态属性)。
例如,第i条时变空间向量-日志
Figure BDA0002929781300000215
Figure BDA0002929781300000216
其中,第1行为主语(实例标识属性ID);第2行为谓语(状态属性);第3行为补语(载荷属性)。
例如,第j条时变空间向量-日志
Figure BDA0002929781300000217
Figure BDA0002929781300000218
其中,第1行为定语(归属标识属性ID);第2行为主语(实例标识属性ID);第3行为和第4行为定语(关联属性);第5行为谓语(状态属性);第6行为补语(载荷属性)。
例如,第y条时变空间向量-日志
Figure BDA0002929781300000219
Figure BDA00029297813000002110
其中,第1行为定语(归属标识属性ID);第2行为主语(实例标识属性ID);第3行为和第4行为定语(关联属性);第5行为时间状语(时间属性);第6行为谓语(状态属性);第7行为补语(载荷属性)。
例如,最后一条时变空间向量-日志
Figure BDA0002929781300000221
Figure BDA0002929781300000222
其中,第1行为定语(归属标识属性ID);第2行为主语(实例标识属性ID);第3行为和第4行为定语(关联属性);第5行为时间状语(时间属性);第6行为谓语(状态属性);第7行为方式状语(重试属性);第8行为补语(载荷属性)。
参见图4所示,读入日志-事件集
Figure BDA0002929781300000223
读入日志-映射规则集
Figure BDA0002929781300000224
如果任意一条日志-事件中记录的字段属于云服务事件的语义本体CSE=<ID,DEP,time,status,RETRY,LOAD,SR>中的标识属性ID,则应用BNF(巴克斯范式)映射规则,映射该字段为标识维向量,并赋值给IDvalues(标识集合);
如果该日志-事件中记录的字段属于状态属性status,则应用映射状态的规则,映射该字段为状态维的向量,并赋值给Svalues(状态集合);
如果日志-事件中记录的字段属于重试属性RETRY或载荷属性LOAD,则应用Z分的映射规则,映射该字段为重试维或载荷维的向量,并赋值给Zvalues(标准分集合);
如果日志-事件中记录的字段属于时间属性time,则直接赋值给Tvalues(时刻集合);
最后,应用日志-映射规则集
Figure BDA0002929781300000225
调整各个维度值的位置,构造得到一条日志-事件的规则匹配后的标记日志,再将所述的规则匹配后的标记日志添加至Cloud-Log2vec(云服务日志向量集合)中。
遍历完成所有日志-事件和日志-映射规则,从而构造得到云服务日志的状态空间向量。
在本发明中,选取Alibaba cluster trace v2018数据集的一个作业,生成时变状态空间向量。为验证构造时变状态空间向量,选取部分云服务事件,构造并生成时变状态空间向量。生成的时变状态空间向量,每一个维度的数量级不一致,变化范围从10-2到109,为了可展示性,将向量的各个维度做归一化处理。例如,图5所示为“j_121701”号作业中实例号为“1169055665”的云服务事件的状态空间向量。
参见图5所示,图中,v_job表示向量的作业号,v_machine表示向量的机器号,v_task表示向量的任务号,v_inst表示向量的实例号,v_dep表示向量的依赖号,v_st表示向量的开始时刻,v_et表示向量的结束时刻,v_status表示向量的状态级值,v_no.表示向量的实例重试值,v_tno.表示向量的实例共试值,v_c.avg表示向量的CPU平均利用量,v_c.max表示向量的CPU最大利用量,v_m.avg表示向量的内存平均利用量,v_m.max表示向量的内存最大利用量。从日志-事件到时变状态空间向量,使用巴克斯范式(BNF)描述语言描述云服务事件,运用BNF、Z分等方法,设定映射规则,将日志-事件映射为时变状态空间向量,生成的向量共计31维。
步骤七,面向时变空间向量-日志之间的联系,构造云服务的事件-关联向量;
对时变空间向量-日志集
Figure BDA0002929781300000231
中的两两时变空间向量-日志做笛卡尔积,构造并生成事件-关联向量对Pairi,j;然后将每一个所述的事件-关联向量对作为一个联系样本,每一个样本是62维的向量。
在本发明中,事件-关联向量对的数目为z(z-1)对,z表示云服务日志的总条数。
在本发明中,对于存在已知联系的联系样本打上联系标签,标签赋值为“1”表示有联系。对于不存在联系的联系样本打上联系标签,标签赋值为“0”表示无联系。
面向时变空间向量-日志之间的联系,构造云服务的事件-关联向量。例如,
Figure BDA0002929781300000232
Figure BDA0002929781300000233
构造并生成事件-关联向量对,记为Pairz,y;所述
Figure BDA0002929781300000234
Figure BDA0002929781300000235
去掉方式状语的日志。
Figure BDA0002929781300000236
前端括号中的第1行为定语(归属标识属性ID);
前端括号中的第2行为主语(实例标识属性ID);
前端括号中的第3行为和第4行为定语(关联属性);
前端括号中的第5行为时间状语(时间属性);
前端括号中的第6行为谓语(状态属性);
前端括号中的第7行为方式状语(重试属性);
前端括号中的第8行为补语(载荷属性)。
后端括号中的第1行为定语(归属标识属性ID);
后端括号中的第2行为主语(实例标识属性ID);
后端括号中的第3行为和第4行为定语(关联属性);
后端括号中的第5行为时间状语(时间属性);
后端括号中的第6行为谓语(状态属性);
后端括号中的第7行为方式状语(重试属性);
步骤八:验证;
将本发明的面向云服务事件联系的时变状态空间向量的构造方法安装到半监督SVM模型中,形成改进的半监督SVM模型。从Alibaba cluster trace v2018数据集中任意选取出训练集和测试集所需的云报告日志。应用改进的半监督SVM模型进行预测云服务事件之间的联系。
经过改进的半监督SVM模型训练,将测试集送入半监督SVM模型做预测,在筛选伪标签的规则下,预测出测试集样本的标签,并将预测出来的结果与样本相比较。实验结果表明,应用改进的半监督SVM可准确预测云服务日志事件之间的联系,并取得高精度的技术效果,如表1所示。
表2应用改进的半监督SVM模型进行的预测及其结果
Figure BDA0002929781300000241
表2给出了改进的半监督SVM模型预测云服务日志事件之间联系的结果。
在实施例a中,训练样本中的标签值为“1”和“0”的比例为1:1,共计720个样本;测试集中的标签值为“1”和“0”的比例为1:324.44,共计32,544个样本。经过训练后,得出结果为准确率为0.9990,精确率为1.0000,召回率为0.7700,错误率为0.0007。
在实施例b中,训练样本中的标签值为“1”和“0”的比例为3:1,共计480个样本;测试集中的标签值为“1”和“0”的比例为1:326.84,共计32,784个样本。经过训练后,得出结果为准确率为0.9995,精确率为1.0000,召回率为0.8400,错误率为0.0005。

Claims (2)

1.一种面向云服务事件联系的时变状态空间向量的构造方法,其特征在于有下列步骤:
步骤一,解读云服务日志,明确云服务日志的每一条记录的各字段含义;
步骤101,收集一段时间里的云服务日志记录,采用集合形式表示为云服务日志集
Figure FDA0002929781290000011
Log1表示第一条云服务日志;
Log2表示第二条云服务日志;
Logi表示第i条云服务日志;
Logj表示第j条云服务日志;
Logy表示第y条云服务日志;
Logz表示最后一条云服务日志;下角标z表示云服务日志的总条数;
步骤102,设置字段内容格式,记为FCF;
所述
Figure FDA0002929781290000012
inst_name表示实施名;
task_name表示任务名;
job_name表示作业名;
start_time表示开始时刻;
end_time表示结束时刻;
status表示实施状态;
machine_id表示云服务器标识;
seq_no表示实例的序号;
total_seq_no表示实例的总序号;
cpu_avg表示CPU平均利用量;
cpu_max表示CPU最大利用量;
mem_avg表示内存平均利用量;
mem_max表示内存最大利用量;
步骤103,采用字段内容格式FCF对云服务日志集
Figure FDA0002929781290000013
中的各个云服务日志进行字段含义的提取,得到字段含义表征的日志集,记为CSLFCF,且
Figure FDA0002929781290000021
其中:
Figure FDA0002929781290000022
表示第一条字段格式日志;
Figure FDA0002929781290000023
表示第二条字段格式日志;
Figure FDA0002929781290000024
表示第i条字段格式日志;
Figure FDA0002929781290000025
表示第j条字段格式日志;
Figure FDA0002929781290000026
表示第y条字段格式日志;
Figure FDA0002929781290000027
表示最后一条字段格式日志;
步骤二,句法化处理,构建句法化-日志集;
步骤201,设置句法化结构集,记为SSY;
Figure FDA0002929781290000028
步骤202,将字段含义表征的日志集CSLFCF中的各个日志分别与句法化结构集SSY中的句法化结构进行自然语言的汉语句法化描述匹配,得到句法化结构的句法化-日志集,记为CSL_SSY;
所述
Figure FDA0002929781290000029
Figure FDA00029297812900000210
表示第一条句法化日志;
Figure FDA00029297812900000211
表示第二条句法化日志;
Figure FDA00029297812900000212
表示第i条句法化日志;
Figure FDA00029297812900000213
表示第j条句法化日志;
Figure FDA00029297812900000214
表示第y条句法化日志;
Figure FDA00029297812900000215
表示最后一条句法化日志;
步骤四,依据云服务事件的语义本体判断日志-事件的属性;
步骤401,设置云服务事件的语义本体,记为CSE;
所述CSE=<ID,DEP,time,status,RETRY,LOAD,SR>;
ID是标识属性,指标识云服务事件施事者的属性;
DEP是关联属性,指描述云服务事件之间联系的属性;
time是时间属性,指描述云服务事件的起始时刻与结束时刻的属性;
status是状态属性,指描述云服务事件呈现何种状态的属性;
RETRY是重试属性,指描述云服务事件是否存在重启的属性;
LOAD是载荷属性,指描述云服务事件使用硬件资源的属性;
SR是句法关系,指描述在同一个云服务事件中的标识属性、依赖属性、时间属性、状态属性、重试属性和载荷属性之间的关系;
步骤402,日志-事件的属性判断;
采用CSE=<ID,DEP,time,status,RETRY,LOAD,SR>对
Figure FDA0002929781290000031
中的各个日志-事件进行属性判断,得到日志-属性集,记为CSL_CSE;
所述
Figure FDA0002929781290000032
Figure FDA0002929781290000033
表示第一条日志-属性;
Figure FDA0002929781290000034
表示第二条日志-属性;
Figure FDA0002929781290000035
表示第i条日志-属性;
Figure FDA0002929781290000036
表示第j条日志-属性;
Figure FDA0002929781290000037
表示第y条日志-属性;
Figure FDA0002929781290000038
表示最后一条日志-属性;
步骤六,构造时变状态空间向量;
步骤601,依据日志-属性匹配日志-映射规则,得到规则匹配后的标记日志;
对日志-属性集
Figure FDA0002929781290000039
中的各个日志-属性与日志-映射规则集
Figure FDA00029297812900000310
中的各个规则进行映射处理,得到规则匹配后的标记日志集,记为CSL_LLNLP;
所述规则匹配后的标记日志集
Figure FDA00029297812900000311
中:
Figure FDA0002929781290000041
表示第一条规则匹配后的标记日志;
Figure FDA0002929781290000042
表示第二条规则匹配后的标记日志;
Figure FDA0002929781290000043
表示第i条规则匹配后的标记日志;
Figure FDA0002929781290000044
表示第j条规则匹配后的标记日志;
Figure FDA0002929781290000045
表示第y条规则匹配后的标记日志;
Figure FDA0002929781290000046
表示最后一条规则匹配后的标记日志;
读入日志-事件集
Figure FDA0002929781290000047
读入日志-映射规则集
Figure FDA0002929781290000048
如果任意一条日志-事件中记录的字段属于云服务事件的语义本体CSE=<ID,DEP,time,status,RETRY,LOAD,SR>中的标识属性ID,则应用BNF(巴克斯范式)映射规则,映射该字段为标识维向量,并赋值给IDvalues(标识集合);
如果该日志-事件中记录的字段属于状态属性status,则应用映射状态的规则,映射该字段为状态维的向量,并赋值给Svalues(状态集合);
如果日志-事件中记录的字段属于重试属性RETRY或载荷属性LOAD,则应用Z分的映射规则,映射该字段为重试维或载荷维的向量,并赋值给Zvalues(标准分集合);
如果日志-事件中记录的字段属于时间属性time,则直接赋值给Tvalues(时刻集合);
最后,应用日志-映射规则集
Figure FDA0002929781290000049
调整各个维度值的位置,构造得到一条日志-事件的规则匹配后的标记日志,再将所述的规则匹配后的标记日志添加至Cloud-Log2vec(云服务日志向量集合)中;
遍历完成所有日志-事件和日志-映射规则,从而构造得到云服务日志的状态空间向量;
步骤七,面向时变空间向量-日志之间的联系,构造云服务的事件-关联向量;
对时变空间向量-日志集
Figure FDA0002929781290000051
中的两两时变空间向量-日志做笛卡尔积,构造并生成事件-关联向量对Pairi,j;然后将每一个所述的事件-关联向量对作为一个联系样本,每一个样本是62维的向量;
事件-关联向量对的数目为z(z-1)对,z表示云服务日志的总条数;
对于存在已知联系的联系样本打上联系标签,标签赋值为“1”表示有联系;对于不存在联系的联系样本打上联系标签,标签赋值为“0”表示无联系。
2.根据权利要求1所述的面向云服务事件联系的时变状态空间向量的构造方法,其特征在于:云服务日志来源于Alibaba cluster trace v2018数据集。
CN202110145205.9A 2021-02-02 2021-02-02 面向云服务事件联系的时变状态空间向量的构造方法 Active CN112861478B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110145205.9A CN112861478B (zh) 2021-02-02 2021-02-02 面向云服务事件联系的时变状态空间向量的构造方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110145205.9A CN112861478B (zh) 2021-02-02 2021-02-02 面向云服务事件联系的时变状态空间向量的构造方法

Publications (2)

Publication Number Publication Date
CN112861478A CN112861478A (zh) 2021-05-28
CN112861478B true CN112861478B (zh) 2022-07-05

Family

ID=75986365

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110145205.9A Active CN112861478B (zh) 2021-02-02 2021-02-02 面向云服务事件联系的时变状态空间向量的构造方法

Country Status (1)

Country Link
CN (1) CN112861478B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103546312A (zh) * 2013-08-27 2014-01-29 中国航天科工集团第二研究院七〇六所 一种海量多源异构日志关联分析方法
CN105447099A (zh) * 2015-11-11 2016-03-30 中国建设银行股份有限公司 日志结构化信息提取方法及装置
CN106682022A (zh) * 2015-11-10 2017-05-17 中国电信股份有限公司 一种日志查询方法和装置
CN109861844A (zh) * 2018-12-07 2019-06-07 中国人民大学 一种基于日志的云服务问题细粒度智能溯源方法
CN110321457A (zh) * 2019-04-19 2019-10-11 杭州玳数科技有限公司 访问日志解析规则生成方法及装置、日志解析方法及系统
CN111190873A (zh) * 2019-12-24 2020-05-22 同济大学 一种用于云原生系统日志训练的日志模式提取方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10706229B2 (en) * 2017-09-28 2020-07-07 Nec Corporation Content aware heterogeneous log pattern comparative analysis engine

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103546312A (zh) * 2013-08-27 2014-01-29 中国航天科工集团第二研究院七〇六所 一种海量多源异构日志关联分析方法
CN106682022A (zh) * 2015-11-10 2017-05-17 中国电信股份有限公司 一种日志查询方法和装置
CN105447099A (zh) * 2015-11-11 2016-03-30 中国建设银行股份有限公司 日志结构化信息提取方法及装置
CN109861844A (zh) * 2018-12-07 2019-06-07 中国人民大学 一种基于日志的云服务问题细粒度智能溯源方法
CN110321457A (zh) * 2019-04-19 2019-10-11 杭州玳数科技有限公司 访问日志解析规则生成方法及装置、日志解析方法及系统
CN111190873A (zh) * 2019-12-24 2020-05-22 同济大学 一种用于云原生系统日志训练的日志模式提取方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向时变需求的云服务匹配方法;罗贺 等;《中国管理科学》;20121115;179-183 *

Also Published As

Publication number Publication date
CN112861478A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
US11316727B2 (en) Method and system for clustering event messages and manage event-message clusters
US10725836B2 (en) Intent-based organisation of APIs
CN107430612B (zh) 查找描述对计算问题的解决方案的文档
US10810103B2 (en) Method and system for identifying event-message transactions
US10205627B2 (en) Method and system for clustering event messages
US20150370799A1 (en) Method and system for clustering and prioritizing event messages
US10120928B2 (en) Method and system for clustering event messages and managing event-message clusters
US20220100963A1 (en) Event extraction from documents with co-reference
WO2012079836A1 (en) Method and system for creating and processing a data rule, data processing program, and computer program product
WO2020259280A1 (zh) 日志管理方法、装置、网络设备和可读存储介质
US20200012728A1 (en) Unstructured data clustering of information technology service delivery actions
US20220100772A1 (en) Context-sensitive linking of entities to private databases
CN117252261A (zh) 知识图谱的构建方法、电子设备及存储介质
EP4222635A1 (en) Lifecycle management for customized natural language processing
US20220100967A1 (en) Lifecycle management for customized natural language processing
CN114385148A (zh) 一种实现联动功能的方法、装置、设备和存储介质
CN111914859A (zh) 一种服务复用方法、计算设备及计算机可读存储介质
US20220129261A1 (en) Distributed Vectorized Representations of Source Code Commits
CN112861478B (zh) 面向云服务事件联系的时变状态空间向量的构造方法
CN116578700A (zh) 日志分类方法、日志分类装置、设备及介质
Damerau Automatic parsing for content analysis
Deriviere et al. A scalable and distributed nlp architecture for web document annotation
CN117852553B (zh) 基于聊天记录提取元器件交易场景信息的语言处理系统
Alexander Automated Trouble Report Labeling: In The Telecom Industry
US20230350903A1 (en) Address matching from single string to address matching score

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant