CN111460802B - 异常报文分类方法、装置、计算机设备和存储介质 - Google Patents

异常报文分类方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111460802B
CN111460802B CN202010171857.5A CN202010171857A CN111460802B CN 111460802 B CN111460802 B CN 111460802B CN 202010171857 A CN202010171857 A CN 202010171857A CN 111460802 B CN111460802 B CN 111460802B
Authority
CN
China
Prior art keywords
message
abnormal
messages
library
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010171857.5A
Other languages
English (en)
Other versions
CN111460802A (zh
Inventor
吴宏平
贺勇军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weimin Insurance Agency Co Ltd
Original Assignee
Weimin Insurance Agency Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weimin Insurance Agency Co Ltd filed Critical Weimin Insurance Agency Co Ltd
Priority to CN202010171857.5A priority Critical patent/CN111460802B/zh
Publication of CN111460802A publication Critical patent/CN111460802A/zh
Application granted granted Critical
Publication of CN111460802B publication Critical patent/CN111460802B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种异常报文分类方法、装置、计算机设备及存储介质,所述方法包括:获取异常报文;根据标签库,对所述异常报文设置标签;根据所述异常报文的标签和分词库,对所述异常报文进行语句分词;根据语句分词结果,获取多个所述异常报文之间的相似性;使相似的所述异常报文进入相同的分桶,不相似的所述报文进入不相同的分桶;其中,所述标签库和分词库根据报文属性更新,所述报文属性包括:报文对应的平台服务器、报文对应的协议、报文对应的接口、报文对应的地区。本申请能提高异常报文分类的效率,解决了异常报文分类不合理的问题。

Description

异常报文分类方法、装置、计算机设备和存储介质
技术领域
本申请涉及数据处理领域,尤其涉及一种异常报文分类方法、装置、计算机设备和存储介质。
背景技术
车险是指根据法律规定实行的中国地区市场销售的“机动车交通事故责任强制保险”和 “机动车商业保险”两款保险产品。随着网络的发展,互联网车险成为一种新型的车险形式。互联网车联系统涉及到保险公司、车险平台等。
车险平台指为开展车险业务提供技术支撑的,可以同时为多家保险公司提供服务的软件系统。由于互联网车险系统中接入了多家保险公司和多个车险平台,而不同的车险平台对相关信息的描述语句可能各不相同,导致车险平台返回的报文繁杂,无法找出规律逻辑进行规则分类,导致问题排查定位困难以及后续线上问题难以跟踪处理。
发明内容
为了解决上述技术问题,本申请提供了一种异常报文分类方法、装置、计算机设备和存储介质,能解决及异常报文分类不够合理的问题。
本申请提供了一种异常报文分类方法,所述方法包括:
获取异常报文;
根据标签库,对所述异常报文设置标签;
根据所述异常报文的标签和分词库,对所述异常报文进行语句分词;
根据语句分词结果,获取多个所述异常报文之间的相似性;
使相似的所述异常报文进入相同的分桶,不相似的所述报文进入不相同的分桶;
其中,所述标签库和分词库根据报文属性更新,所述报文属性包括:报文对应的平台服务器、报文对应的协议、报文对应的接口、报文对应的地区。
本申请提供了一种异常报文分类装置,所述装置包括:
异常报文获取单元,用于获取异常报文;
标签设置单元,用于根据标签库,对所述异常报文设置标签;
语句分词单元,用于根据所述异常报文的标签和分词库,对所述异常报文进行语句分词;
相似性获取单元,用于根据语句分词结果,获取多个所述异常报文之间的相似性;
分桶单元,用于使相似的所述异常报文进入相同的分桶,不相似的所述报文进入不相同的分桶;
其中,所述标签库和分词库根据报文属性更新,所述报文属性包括:报文对应的平台服务器、报文对应的协议、报文对应的接口、报文对应的地区。
本申请提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
本申请提供了一种异常报文分类方法,根据标签库,对异常报文设置标签,根据标签和分词库,对异常报文进行语句分词,根据语句分词结果,获取多个所述异常报文之间的相似性;然后根据异常报文之间的相似性,对异常报文进行分类,相似的所述异常报文进入相同的分桶,不相似的所述报文进入不相同的分桶。本申请中,所述标签库和分词库根据报文属性更新,所述异常报文的属性包括:报文对应的平台服务器、报文对应的协议、报文对应的接口、报文对应的地区。本申请的方法中,由于设置了标签库,无需大量更新核心算法,仅通过更新标签库和分词库,即可以灵活的设置报文分类的颗粒度、灵活的重新分类,提高了异常报文分类的效率,解决了异常报文分类不合理的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1所示为本申请实施例中的异常报文分类方法的应用环境图;
图2所示为本申请实施例的异常报文分类方法的流程图;
图3所示为本申请实施例的对异常报文进行语句分词的流程示意图;
图4所示为本申请实施例的一种异常报文分类方法的流程图;
图5所示为本申请实施例的一种异常报文分类方法的数据处理及流向示意图;
图6所示为本申请实施例的异常报文分类装置的示意图;
图7所示为本申请实施例中计算机设备的内部结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为一个实施例中页面数据处理方法的应用环境图。参照图1,该异常报文分类方法应用于异常报文分类系统。该异常报文分类包括终端110和服务器120。终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端具体可以是手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
如图2所示,在一个实施例中,提供了一种异常报文分类方法,可以应用于上述终端110和服务器120。本申请的一个实施例中,异常报文分类系统可以是在车险平台上。
参考图2,本申请实施例的异常报文分类方法包括:
步骤210,获取异常报文;
步骤220,根据标签库,对所述异常报文设置标签;
步骤230,根据所述异常报文的标签和分词库,对所述异常报文进行语句分词;
步骤240,根据语句分词结果,获取多个所述异常报文之间的相似性;
步骤250,使相似的所述异常报文进入相同的分桶,不相似的所述报文进入不相同的分桶。
其中,所述标签库和分词库根据报文属性更新,所述异常报文的属性包括:报文对应的平台服务器、报文对应的协议、报文对应的接口、报文对应的地区。
本申请的实施例中,平台服务器可以是各保险公司的平台/服务器,或者其他第三方公司/系统。异常报文分类系统可以设置于车险平台上。各保险公司按通用标准协议接入车险平台,多家保险公司依照保险公司的系统核心返回报文至车险平台。
不同的保险公司和第三方公司,内部架构可能不同,因此报文对应的协议也是不同的。不同保险公司和第三方公司的接口也是各不相同。车险可以包括主流程和个性化流程,不同的流程中调用的接口不同。例如主流程主要是报价、投保、支付、出单,而在某些地区,会依照当地相关法律法规的要求,需要短信验证以及实名等等个性化流程。
车险平台一般对接的保险公司或者第三方公司是以总公司为维度的,保险公司或第三方公司内部,总公司对接其对应的核心系统、分公司有一套固定的逻辑及规则。车险业务遍布各地,因各地方业务规则不同,各个区域的核保规则不同,导致报文会有不同的配置,使得返回报文会受到地区配置影响。
保险公司返回到车险平台的报文若持续不变,则可以维持分类的准确性,然而实际情况是由于以上的各种原因,保险公司返回的报文会频繁变动,此外,还有其他原因导致报文的变动,例如车险平台与新的保险公司或者第三方合作,均会有不同的返回报文;或可能保险公司或者第三方公司的系统也会的进行系统升级,系统升级后新的逻辑判断也会产生新的语句返回;或可能保险公司、第三方公司的线程数超出或网络异常时,也可能会出现大量非业务语句的异常报文。
本申请实施例的异常报文分类方法中,根据标签库,对异常报文设置标签,根据标签和分词库,对异常报文进行语句分词,根据语句分词结果,获取多个所述异常报文之间的相似性;然后根据异常报文之间的相似性,对异常报文进行分类,相似的所述异常报文进入相同的分桶,不相似的所述报文进入不相同的分桶。本申请中,所述标签库和分词库根据报文属性更新,所述异常报文的属性包括:报文对应的平台服务器、报文对应的协议、报文对应的接口、报文对应的地区。本申请的方法中,由于设置了标签库,无需大量更新核心算法,仅通过更新标签库和分词库,即可以灵活的设置报文分类的颗粒度、灵活的重新分类,提高了异常报文分类的效率。
本申请实施例中,步骤210中,获取异常报文,包括:
从各个平台服务器获取返回报文,
根据所述返回报文的状态码,判断所述返回报文的状态,所述报文的状态包括正常或异常。
本申请实施例中,返回报文的状态码,和报文属性有关,还和预设算法、规则等有关,在此不再赘述。
本申请实施例中,步骤220中,所述根据标签库,对异常报文设置标签,包括:
获取所述异常报文的关键字;
根据所述标签库和异常报文的关键字,设置所述异常报文的标签。
本申请一个实施例中,报文可以是:商业险-违返规则列表,具体为:
[网销规则库.0360.通用-XX公司-涉水-20180704-51网销:转保车龄大于5年车辆禁保发动机涉水损失险- R001]。
上述报文的关键字可以是:“网销规则库”;而“网销规则库” 可以对应标签库中的“核保规则”的标签,因此上述报文的标签可以是“核保规则”。
上述报文中的关键字或可以是“R001”,该关键字是一个“错误码”,不同错误码对应标签库中的不同标签,R001可以对应标签库中的“报价时间不可早于可报价起期”。
图3所示为本申请实施例的对异常报文进行语句分词的流程示意图。
本申请实施例中,每个所述标签对应预设的分数值。
参考图3所示,在步骤230中,所述根据异常报文的标签和分词库,对所述异常报文进行语句分词,包括:
步骤310,获取所述异常报文的总分值。
所述异常报文的总分值为所述异常报文包括的所有标签的分数值的总和;
步骤320,判断所述异常报文的总分值是否大于等于分数阈值,若所述异常报文的总分值大于等于所述分数阈值,转至步骤330,若所述异常报文的总分值小于所述分数阈值,则转至步骤340。
步骤330,将所述异常报文放入第一分桶。
步骤340,则根据预设规则库,对所述异常报文进行过滤清洗,获取多个特征词。
本申请实施例中,标签库中多有个标签,根据标签库,对异常报文设置标签。每一个标签对应一个分数值,一些特定关键字或状态码对应较高的分数值,例如“系统升级中”、“requestId重复”、“配置信息错误”等,只要含有这些标签,异常报文的总分值就会大于分数阈值,这些异常报文作为同一个分类,直接放入第一分桶。
上述“第一分桶”只是为了便于描述,用于说明按照本申请实施例的方法,这些异常报文属于相同的一类,并不指示实际存在的名为“第一分桶”的“分桶”或者“类别”,在此不再赘述。
一个异常报文可以包括多个标签,如果该异常报文总分值小于所述分数阈值,则根据预设规则库,对所述异常报文进行过滤清洗,获取多个特征词。
本申请实施例中,标签库可以更新,在标签库更新之后,可以对某一个时间段内的所有异常报文重新设置标签,从新计算异常报文总分数,重新分桶,以达到优化分桶结果的目的。
本申请实施例中,更新标签库之后可以重新分类,还是按照相同的算法进行,核心算法、架构等无需更新,因此灵活性更高。
标签库的更新,可以是重新设定标签,或可以是新增/减少/更改标签,或可以是更新每个标签对应的分数。对标签库的更新,可以更改异常报文分类的颗粒度,颗粒度较小,异常报文分类就越细致。
本申请实施例中,上述根据预设规则库,对所述异常报文进行过滤清洗,获取多个特征词,包括:
根据所述分词库,判断所述异常报文是否包含特定特征词;
若所述异常报文包含特定特征词,则将所述特定特征词取出后,进行一般规则清洗,获取多个一般特征词,
若所述报文不包含所述特定特征词,则将所述报文进行一般规则清洗,获取多个一般特征词。
本申请实施例中,异常报文可以有两种,一种是包含特定特征词的,一种是不包含特定特征词的。包含特定特征词的异常报文的特征词包括特定特征词和一般特征词,不包含特定特征词的异常报文就仅包含一般特征词。
本申请实施例中,特定特征词的可以是“合作方频繁出现且符合业务定义的词汇”,例如“核保规则”、“划痕险”、 “短信验证码”、 “内部技术错误”、“User not found”等。
本申请的一个实施例中,一个异常报文可以是:
[交强险:失败.商业险:失败.]交强险:R999
(2019233010242339w2019233010242339提交核保失败:高风险管控车型报价失败).商业险:R999(2019233010242339w2019233010242339提交核保失败:高风险管控车型报价失败)
对上述异常报文做一般规则清洗可以是先进行分词,去除其中无意义的词,分词的方法可以是现有技术中的分词方法,分词方法或可以是预设的。上述可以分为:“交强险”、“商业险”、“失败”、“R999”、“提交”、“核保失败”、“高风险”、“车型”、“2019233010242339w2019233010242339”等等。
本申请实施例中,步骤240中,所述获取多个异常报文之间的相似性,包括:
对所述特征词进行降维,获得特征词的特征值;
对所述特征词的特征值加权处理,累计分数后得到签名值;
根据所述签名值,计算多个所述异常报文之间的距离;
若两个所述异常报文之间的距离大于等于距离阈值,则确认所述异常报文相似,
若两个所述异常报文之间的距离小于所述距离阈值,则确认所述异常报文不相似。
本申请的一个实施例中,对所述特征词进行降维,获得特征词的特征值,对所述特征词的特征值加权处理,累计分数后得到签名值,根据所述签名值,计算多个所述异常报文之间的距离,可以是:
对所述特征词进行hash降维,获得特征词的hash值;
对所述特征词的hash值加权处理,累计分数后得到simhash签名值;
根据所述simhash签名值,计算多个所述异常报文之间的距离。
本申请的一个实施例中,计算多个所述异常报文之间的距离,具体可以是:
设定simhash的保存长度,目前通常使用的为64位。
对异常报文进行一般规则清洗后开始计算,先进行hash降维,获得特征词hash值,计算每个hash特征词对应一维的simhash值,将每个特征词对应一维的simhash值乘上对应权重后相加起来,其结果就是该异常报文的simhash签名值。
一个异常报文的simhash签名值为[x1,x2,x3……xN],另一个异常报文的simhash签名值为[y1,y2,y3……yN],计算两者之间的距离的方法有多种,可以是欧氏距离,例如:
或可以是曼哈顿距离,例如:
或可以是汉明距离:
上述确定异常报文相似性的方法,还可以采用给特征词赋予特征向量及特征向量权值,然后在计算距离,通过距离确认相似性;或可以采用本领域其他方法,在此不再赘述。
本申请实施例中,在所述获取多个异常报文的相似性之后,在所述使相似的异常报文进入相同的分桶之前,所述方法还包括:
将所述多个相似报文中的任一一条相似报文与多个历史分桶中的历史报文进行相似性判定;
若所述相似报文与所述历史报文相似,则使所述多个相似报文进入对应的历史分桶;
若所述相似报文与所有历史报文不相似,则新建分桶,使所述多个相似报文进入所述新建分桶。
本申请的系统,对异常报文分类可以是实时的,或可以是周期性的。由于异常报文产生的非常多,且可能因时间段不同而具有聚集性,例如可能在白天工作时段非常集中,在夜晚几乎没有或者很少。对异常报文的分类,是需要消耗较多资源的,特别是实时处理,需要消耗的资源更多。如果以白天集中产生的时间段为基础配置资源,那么在夜晚就会有很多资源被闲置,因此本申请的系统,对异常报文采取周期性的分类。
当前周期之前,已经分类的异常报文进入了多个分桶,本申请实施例中,当前周期之前的周期中,对异常报文分类而产生的分桶,相对于当前周期来说,都是历史分桶。
当前周期分类的异常报文有可能和当前周期之前的周期中分类重复,所以当前周期分类的异常报文,还需要和历史分桶中的异常报文做一个比较,避免分桶重复,即避免相同分类却有多个分桶,从而出现误差。
本申请实施例中,若一个异常报文的标签总分值大于等于分数阈值,则将该异常报文放入第一分桶。在将异常报文放入第一分桶之前,也可以和历史分桶中的异常报文做一个比较,避免出现误差。
由于第一分桶中的异常报文的标签总分值是大于等于分数阈值的,所以在做比较的时候,可以与历史周期中的第一分桶做比较,从而减少比较的次数和工作量。
或者在标签库更新之后,第一分桶中的异常报文的标签总分值可能会变化;在分数阈值有变化时,能进入第一分桶的异常报文也会变化,此时可以将第一分桶中的异常报文和所有历史分桶中的异常报文做避免,避免出现误差。
本申请实施例中,所述方法还包括:
根据所述报文属性,调整所述标签库和/或分词库;和/或
根据历史分桶,调整所述标签库和/或分词库。
本申请实施例中,所述方法还包括:
根据所述报文属性,调整所述分数阈值和/或距离阈值;和/或
根据历史分桶,调整所述分数阈值和/或距离阈值。
本申请实施例中,标签库、分词库、距离阈值及分数阈值都是可以调整的,调整依据可以是异常报文属性,或可以是历史分桶,或可以是新增分桶数,或可以是上一周期内/历史异常报文的总分桶数,或可以是维护人员的反馈等,在此不再赘述。
在本申请实施例中,原本的标签库中是没有实名相关标签的,如果某一个区域的要求实名认证或短信验证等,报文的属性中可以有“实名通过”、“实名未通过”、“短信验证通过”和“短信验证未通过”等,那么可以根据报文属性,在标签库中新增“实名”和“短信验证”相关的标签。
在本申请实施例中,对异常报文分类之后,可以定期排查历史分桶,如果历史分桶中出现大量不干净分类,即出现大量不正确分类,则可以重新调整标签库或分词库。
在本申请的实施例中,在排查历史分桶的时候,发现是由于分数阈值设置的不合理造成的,例如原本达到10分可以直接进入历史分桶,但条件太过宽松,导致历史分桶杂乱,则可以将分数阈值改为5分。
在本申请的一个实施例中,在排查历史分桶时,发现一段时间内产生的新的分桶数量过多,排查后发现,其中一个历史分桶,例如A中,原本设定汉明距离为3以内才可以进入该分桶,但因为条件太过严格导致生成其他的大量分桶,则设定汉明距离为5以内均可以进入分桶A。
本申请实施例,标签库、分词库、距离阈值及分数阈值都是可以调整的,可以根据实际情况进行调整,包括但可以不限于上述调整方法。调整标签库、分词库、距离阈值及分数阈值而不必调整核心算法或系统架构,因此灵活性更高。此外,调整标签库、分词库、距离阈值及分数阈值,还可以调整分类的颗粒度,从而提高分类精度,或在分类精度和资源消耗等之间达到平衡。
图4所示为本申请实施例的一种异常报文分类方法的流程图,图5所示为本申请实施例的一种异常报文分类方法的数据处理及流向示意图。
图5所示包括多端,分别为保险公司、车险平台,其中车险平台又包括处理器、规则库、分类结果。其中,规则库中包括标签库、分词库、分数阈值和距离阈值等。
结合图4、图5所示,所述方法包括:
步骤410,处理器从保险公司获取返回报文。
步骤420,处理器从返回报文中获取异常报文。
步骤430,处理器调用规则库中的标签库,对异常报文设置标签。
步骤440,处理器判断异常报文总分值是否大于等于分数阈值,若大于等于分数阈值,则转至步骤450,若小于分数阈值,则转至步骤460。
步骤450,处理器将异常报文放入第一分桶。
步骤460,处理器调用分词库,对异常报文进行语句分词,调用距离阈值,进行相似性分析,转至步骤470。
步骤470,处理器根据相似性,对异常报文进行分桶。
步骤480,对分桶后的异常报文,处理器将其与历史分桶中的异常报文进行相似性分析;若相似,转至步骤490,若不相似,转至步骤491。
步骤490,处理器新建分桶,使异常报文进入新建分桶。
步骤491,处理器使异常报文进入历史分桶。
参考图4、图5所示,规则库中的标签库、分词库、分数阈值和距离阈值都是可以调整的,而处理器的架构、算法等无需调整。
本申请实施例的异常报文分类方法,灵活性高,适应性强。
本申请实施例中,对异常报文进行分类,每一个类别对应一个分桶,而每一个分桶在实际应用中可以对应一个缺陷类。每个缺陷类可以为客户预设指定解决流程和话术,也可以为开发、维护方预设缺陷修复任务。
本申请实施例中,分桶后还可以绘制分桶数据的统计图表来直观显示缺陷类造成的车险业务的失败率,便于确定缺陷类的紧急程度和影响范围。
本申请实施例中,分桶数据的增长数量走势还可以直接衡量缺陷类的修复效率和修复成果。
本申请实施例的异常报文分类方法,提升了异常报文产生后定位缺陷、修复缺陷的运维工作的效率,减少了相似问题重复排查的时间,能将各个保险公司的缺陷从业务影响范围、解决时效等方面进行更好的管理。
本申请实施例的异常报文分类方法,可以有效的将复杂的返回报文进行分类后,等待进一步的业务使用,在问题发生时可以从上游产品的设计,至下游客服的问题处理,建立一整套问题处理流程,有别于既往需要投入大量成本来维护分类准确度的方法,本申请实施例的方法透过不停优化标签库、规则库及各种阈值,可使得整体分类维持稳定的水平,并可以透过改变阀值,灵活配合业务需求,解决了既往无法按照业务要求随机变更分类维度的问题,透过系统实现自动增加分类的功能。
图2至图5为一个实施例中异常报文分类方法的流程示意图。应该理解的是,虽然图2至图5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至图5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
与上述异常报文分类方法相对应,本申请实施例还提供了一种异常报文分类装置。
图6所示为本申请实施例的异常报文分类装置的示意图,如图6所示,所述装置包括:
异常报文获取单元610,用于获取异常报文;
标签设置单元620,用于根据标签库,对所述异常报文设置标签;
语句分词单元630,用于根据所述异常报文的标签和分词库,对所述异常报文进行语句分词;
相似性获取单元640,用于根据语句分词结果,获取多个所述异常报文之间的相似性;
分桶单元650,用于使相似的所述异常报文进入相同的分桶,不相似的所述报文进入不相同的分桶。
本申请实施例中,异常报文获取单元610还用于:
从各个平台服务器获取返回报文;
根据所述返回报文的状态码,判断所述返回报文的状态,所述报文的状态包括正常或异常。
本申请实施例中,标签设置单元620还用于包括:
获取所述异常报文的关键字;
根据所述标签库和异常报文的关键字,设置所述异常报文的标签。
本申请实施例中,每个所述标签对应预设的分数值;
语句分词单元630还用于:
获取所述异常报文的总分值,所述异常报文的总分值为所述异常报文包括的所有标签的分数值的总和;
判断所述异常报文的总分值是否大于等于分数阈值;
若所述异常报文的总分值大于等于所述分数阈值,则将所述异常报文放入第一分桶,
若所述异常报文的总分值小于所述分数阈值,则根据预设规则库,对所述异常报文进行过滤清洗,获取多个特征词。
语句分词单元630还用于:
根据所述分词库,判断所述异常报文是否包含特定特征词;
若所述异常报文包含特定特征词,则将所述特定特征词取出后,进行一般规则清洗,获取多个一般特征词,
若所述报文不包含所述特定特征词,则将所述报文进行一般规则清洗,获取多个一般特征词。
相似性获取单元640还用于:
对所述特征词进行hash降维,获得特征词hash值;
对所述特征词hash值加权处理,累计分数后得到simhash签名值;
根据所述simhash签名值,计算多个所述异常报文之间的距离;
若两个所述异常报文之间的距离大于等于距离阈值,则确认所述异常报文相似,
若两个所述异常报文之间的距离小于所述距离阈值,则确认所述异常报文不相似。
相似性获取单元640还用于:
在所述获取多个异常报文的相似性之后,在所述使相似的异常报文进入相同的分桶之前:
将所述多个相似报文中的任一一条相似报文与多个历史分桶中的历史报文进行相似性判定;
若所述相似报文与所述历史报文相似,则使所述多个相似报文进入对应的历史分桶;
若所述相似报文与所有历史报文不相似,则新建分桶,使所述多个相似报文进入所述新建分桶。
本申请实施例中,可以根据所述异常报文属性,调整所述标签库和/或分词库;和/或根据历史分桶,调整所述标签库和/或分词库。
本申请实施例中,可以根据所述异常报文属性,调整所述分数阈值和/或距离阈值;和/或根据历史分桶,调整所述分数阈值和/或距离阈值。
本申请实施例中,所述第一分桶为历史分桶中所述总分值大于等于所述分数阈值的异常报文进入的分桶。
本申请实施例中,所述第一分桶还可以为新建分桶。
本申请实施例的异常报文分类装置对异常报文的分类更加灵活。
本申请还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
图7示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110或服务器120。如图7所示,该计算机设备通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现页面数据处理方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行页面数据处理方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的异常报文分类方法和装置可以实现为一种计算机程序的形式,计算机程序可在如图7所示的计算机设备上运行。计算机设备的存储器中可存储异常报文分类装置的各个程序模块,比如,图6所示的异常报文获取单元610、标签设置单元620、语句分词单元630、相似性获取单元640、分桶单元650。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的异常报文分类方法中的步骤。
例如,图7所示的计算机设备可以通过如图6所示的异常报文分类装置中的异常报文获取单元610执行获取异常报文。计算机设备可以通过标签设置单元620执行根据标签库,对所述异常报文设置标签。计算机设备可以通过语句分词单元630执行根据所述异常报文的标签和分词库,对所述异常报文进行语句分词。计算机设备可以通过相似性获取单元640执行根据语句分词结果,获取多个所述异常报文之间的相似性。计算机设备可以通过分桶单元650执行使相似的所述异常报文进入相同的分桶,不相似的所述报文进入不相同的分桶。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取异常报文;根据标签库,对所述异常报文设置标签;根据所述异常报文的标签和分词库,对所述异常报文进行语句分词;根据语句分词结果,获取多个所述异常报文之间的相似性;使相似的所述异常报文进入相同的分桶,不相似的所述报文进入不相同的分桶;其中,所述标签库和分词库根据报文属性更新,所述异常报文的属性包括:报文对应的平台服务器、报文对应的协议、报文对应的接口、报文对应的地区。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从各个平台服务器获取返回报文,根据所述返回报文的状态码,判断所述返回报文的状态,所述报文的状态包括正常或异常。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取所述异常报文的关键字;根据所述标签库和异常报文的关键字,设置所述异常报文的标签。
在一个实施例中,每个所述标签对应预设的分数值;所述根据异常报文的标签和分词库,对所述异常报文进行语句分词,包括:获取所述异常报文的总分值,所述异常报文的总分值为所述异常报文包括的所有标签的分数值的总和;判断所述异常报文的总分值是否大于等于分数阈值;若所述异常报文的总分值大于等于所述分数阈值,则将所述异常报文放入第一分桶,若所述异常报文的总分值小于所述分数阈值,则根据预设规则库,对所述异常报文进行过滤清洗,获取多个特征词。
在一个实施例中,所述对异常报文进行过滤清洗,获取多个特征词,包括:根据所述分词库,判断所述异常报文是否包含特定特征词;若所述异常报文包含特定特征词,则将所述特定特征词取出后,进行一般规则清洗,获取多个一般特征词,若所述报文不包含所述特定特征词,则将所述报文进行一般规则清洗,获取多个一般特征词。
在一个实施例中,所述获取多个异常报文之间的相似性,包括:对所述特征词进行hash降维,获得特征词hash值;对所述特征词hash值加权处理,累计分数后得到simhash签名值;根据所述simhash签名值,计算多个所述异常报文之间的距离;若两个所述异常报文之间的距离大于等于距离阈值,则确认所述异常报文相似,若两个所述异常报文之间的距离小于所述距离阈值,则确认所述异常报文不相似。
在一个实施例中,在所述获取多个异常报文的相似性之后,在所述使相似的异常报文进入相同的分桶之前,所述方法还包括:将所述多个相似报文中的任一一条相似报文与多个历史分桶中的历史报文进行相似性判定;若所述相似报文与所述历史报文相似,则使所述多个相似报文进入对应的历史分桶;若所述相似报文与所有历史报文不相似,则新建分桶,使所述多个相似报文进入所述新建分桶。
在一个实施例中,根据所述异常报文属性,调整所述标签库和/或分词库;和/或根据历史分桶,调整所述标签库和/或分词库。
在一个实施例中,根据所述异常报文属性,调整所述分数阈值和/或距离阈值;和/或根据历史分桶,调整所述分数阈值和/或距离阈值。
在一个实施例中,所述第一分桶为历史分桶中所述总分值大于等于所述分数阈值的异常报文进入的分桶。
在一个实施例中,所述第一分桶为新建分桶。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取异常报文;根据标签库,对所述异常报文设置标签;根据所述异常报文的标签和分词库,对所述异常报文进行语句分词;根据语句分词结果,获取多个所述异常报文之间的相似性;使相似的所述异常报文进入相同的分桶,不相似的所述报文进入不相同的分桶;其中,所述标签库和分词库根据报文属性更新,所述异常报文的属性包括:报文对应的平台服务器、报文对应的协议、报文对应的接口、报文对应的地区。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:从各个平台服务器获取返回报文, 根据所述返回报文的状态码,判断所述返回报文的状态,所述报文的状态包括正常或异常。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取所述异常报文的关键字;根据所述标签库和异常报文的关键字,设置所述异常报文的标签。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取所述异常报文的总分值,所述异常报文的总分值为所述异常报文包括的所有标签的分数值的总和;判断所述异常报文的总分值是否大于等于分数阈值;若所述异常报文的总分值大于等于所述分数阈值,则将所述异常报文放入第一分桶,若所述异常报文的总分值小于所述分数阈值,则根据预设规则库,对所述异常报文进行过滤清洗,获取多个特征词。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据所述分词库,判断所述异常报文是否包含特定特征词;若所述异常报文包含特定特征词,则将所述特定特征词取出后,进行一般规则清洗,获取多个一般特征词,若所述报文不包含所述特定特征词,则将所述报文进行一般规则清洗,获取多个一般特征词。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对所述特征词进行hash降维,获得特征词hash值;对所述特征词hash值加权处理,累计分数后得到simhash签名值;根据所述simhash签名值,计算多个所述异常报文之间的距离;若两个所述异常报文之间的距离大于等于距离阈值,则确认所述异常报文相似,若两个所述异常报文之间的距离小于所述距离阈值,则确认所述异常报文不相似。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将所述多个相似报文中的任一一条相似报文与多个历史分桶中的历史报文进行相似性判定;若所述相似报文与所述历史报文相似,则使所述多个相似报文进入对应的历史分桶;若所述相似报文与所有历史报文不相似,则新建分桶,使所述多个相似报文进入所述新建分桶。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据所述异常报文属性,调整所述标签库和/或分词库;和/或根据历史分桶,调整所述标签库和/或分词库。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据所述异常报文属性,调整所述分数阈值和/或距离阈值;和/或根据历史分桶,调整所述分数阈值和/或距离阈值。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (11)

1.一种异常报文分类方法,其特征在于,所述方法包括:
获取异常报文;
根据标签库,对所述异常报文设置标签;
根据所述异常报文的标签和分词库,对所述异常报文进行语句分词;
根据语句分词结果,获取多个所述异常报文之间的相似性;
使相似的所述异常报文进入相同的分桶,不相似的所述报文进入不相同的分桶;
其中,所述标签库和分词库根据报文属性更新,所述报文属性包括:报文对应的平台服务器、报文对应的协议、报文对应的接口、报文对应的地区;
每个所述标签对应预设的分数值;
所述根据异常报文的标签和分词库,对所述异常报文进行语句分词,包括:
获取所述异常报文的总分值,所述异常报文的总分值为所述异常报文包括的所有标签的分数值的总和;
判断所述异常报文的总分值是否大于等于分数阈值;
若所述异常报文的总分值大于等于所述分数阈值,则将所述异常报文放入第一分桶;
若所述异常报文的总分值小于所述分数阈值,则对所述异常报文进行语句分词;
所述判断所述异常报文的总分值是否大于等于分数阈值之后,所述方法还包括:
若所述异常报文的总分值小于所述分数阈值,则根据所述分词库,判断所述异常报文是否包含特定特征词;
若所述异常报文包含特定特征词,则将所述特定特征词取出后,进行一般规则清洗,获取多个一般特征词,
若所述异常报文不包含所述特定特征词,则将所述报文进行一般规则清洗,获取多个一般特征词。
2.如权利要求1所述的方法,其特征在于,所述获取异常报文,包括:
从各个平台服务器获取报文,
根据所述报文的状态码,判断所述报文的状态,以获取异常报文,所述报文的状态包括正常或异常。
3.如权利要求1所述的方法,其特征在于,所述根据标签库,对异常报文设置标签,包括:
获取所述异常报文的关键字;
根据所述标签库和所述异常报文的关键字,设置所述异常报文的标签。
4.如权利要求1所述的方法,其特征在于,所述获取多个异常报文之间的相似性,包括:
对所述特征词进行降维处理,获得特征词的特征值;
对所述特征词的特征值加权处理,累计分数后得到签名值;
根据所述签名值,计算多个所述异常报文之间的距离;
若两个所述异常报文之间的距离大于等于距离阈值,则确认所述异常报文相似,
若两个所述异常报文之间的距离小于所述距离阈值,则确认所述异常报文不相似;
其中,所述特征词为一般特征词,或为一般特征词和特定特征词。
5.如权利要求1所述的方法,其特征在于,在所述获取多个异常报文的相似性之后,在所述使相似的异常报文进入相同的分桶之前,所述方法还包括:
将多个相似报文中的任一一条相似报文与多个历史分桶中的历史报文进行相似性判定;
若所述相似报文与所述历史报文相似,则使所述多个相似报文进入对应的历史分桶;
若所述相似报文与所有历史报文不相似,则新建分桶,使所述多个相似报文进入所述新建分桶。
6.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述报文属性,调整所述标签库和/或分词库;和/或,
根据历史分桶,调整所述标签库和/或分词库。
7.如权利要求4所述的方法,其特征在于,所述方法还包括:
根据所述报文属性,调整所述分数阈值和/或距离阈值;和/或
根据历史分桶,调整所述分数阈值和/或距离阈值。
8.如权利要求5所述的方法,其特征在于,所述第一分桶为历史分桶中所述总分值大于等于所述分数阈值的异常报文进入的分桶。
9.一种异常报文分类装置,其特征在于,所述装置包括:
异常报文获取单元,用于获取异常报文;
标签设置单元,用于根据标签库,对所述异常报文设置标签;
语句分词单元,用于根据所述异常报文的标签和分词库,对所述异常报文进行语句分词;
相似性获取单元,用于根据语句分词结果,获取多个所述异常报文之间的相似性;
分桶单元,用于使相似的所述异常报文进入相同的分桶,不相似的所述报文进入不相同的分桶;
其中,所述标签库和分词库根据报文属性更新,所述报文属性包括:报文对应的平台服务器、报文对应的协议、报文对应的接口、报文对应的地区;
每个所述标签对应预设的分数值;
所述语句分词单元还用于:
获取所述异常报文的总分值,所述异常报文的总分值为所述异常报文包括的所有标签的分数值的总和;
判断所述异常报文的总分值是否大于等于分数阈值;
若所述异常报文的总分值大于等于所述分数阈值,则将所述异常报文放入第一分桶;
若所述异常报文的总分值小于所述分数阈值,则对所述异常报文进行语句分词;
所述语句分词单元还用于:
若所述异常报文的总分值小于所述分数阈值,则根据所述分词库,判断所述异常报文是否包含特定特征词;
若所述异常报文包含特定特征词,则将所述特定特征词取出后,进行一般规则清洗,获取多个一般特征词,
若所述异常报文不包含所述特定特征词,则将所述报文进行一般规则清洗,获取多个一般特征词。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
CN202010171857.5A 2020-03-12 2020-03-12 异常报文分类方法、装置、计算机设备和存储介质 Active CN111460802B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010171857.5A CN111460802B (zh) 2020-03-12 2020-03-12 异常报文分类方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010171857.5A CN111460802B (zh) 2020-03-12 2020-03-12 异常报文分类方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN111460802A CN111460802A (zh) 2020-07-28
CN111460802B true CN111460802B (zh) 2024-02-20

Family

ID=71680772

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010171857.5A Active CN111460802B (zh) 2020-03-12 2020-03-12 异常报文分类方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN111460802B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108563722A (zh) * 2018-04-03 2018-09-21 有米科技股份有限公司 文本信息的行业分类方法、系统、计算机设备和存储介质
CN110516066A (zh) * 2019-07-23 2019-11-29 同盾控股有限公司 一种文本内容安全防护方法和装置
CN110674442A (zh) * 2019-09-17 2020-01-10 中国银联股份有限公司 页面监控方法、装置、设备及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063427A (zh) * 2014-06-06 2014-09-24 北京搜狗科技发展有限公司 一种基于语义理解的表情输入方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108563722A (zh) * 2018-04-03 2018-09-21 有米科技股份有限公司 文本信息的行业分类方法、系统、计算机设备和存储介质
CN110516066A (zh) * 2019-07-23 2019-11-29 同盾控股有限公司 一种文本内容安全防护方法和装置
CN110674442A (zh) * 2019-09-17 2020-01-10 中国银联股份有限公司 页面监控方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN111460802A (zh) 2020-07-28

Similar Documents

Publication Publication Date Title
US20220405775A1 (en) Methods, processes, and systems to deploy artificial intelligence (ai)-based customer relationship management (crm) system using model-driven software architecture
US8027863B2 (en) Method for forecasting a future inventory demand
CN111401777B (zh) 企业风险的评估方法、装置、终端设备及存储介质
CN111192144A (zh) 一种金融数据预测方法、装置、设备及存储介质
US7607046B1 (en) System for predicting and preventing escalations
CN110990529B (zh) 企业的行业明细划分方法及系统
CN111652278A (zh) 用户行为检测方法、装置、电子设备及介质
CN111340365A (zh) 企业数据处理方法、装置、计算机设备和存储介质
CN110942314A (zh) 异常账户监管方法及装置
CN112232606B (zh) 业务数据的预测方法、装置、设备及存储介质
US20080300981A1 (en) Campaign optimization
CN111460802B (zh) 异常报文分类方法、装置、计算机设备和存储介质
US11822562B2 (en) Unstructured text processing for geographical location determination system
US11935075B2 (en) Card inactivity modeling
CN116188025A (zh) 一种电商平台供应商的筛选方法、装置、设备和介质
US11922352B1 (en) System and method for risk tracking
US20220277249A1 (en) Benchmarking based on company vendor data
CN114385121A (zh) 一种基于业务分层的软件设计建模方法及系统
CN113626605A (zh) 信息分类方法、装置、电子设备及可读存储介质
CN111932131A (zh) 业务数据处理方法及装置
CN114548463A (zh) 线路信息预测方法、装置、计算机设备和存储介质
US11948207B1 (en) Machine learning based approach for recommending different categories of tax deductible expenses and related examples of tax deductible expenses for each category
US20240193066A1 (en) System and Method for Identifying Performance or Productivity Degradation in Devices when Application Profiles of Devices are Changed in a Logical Group
US20230410157A1 (en) Transformation of return content using artificial intelligence
CN115345637A (zh) 消费预测方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant