CN110955757A - 光伏电站设备日志检索方法和系统 - Google Patents

光伏电站设备日志检索方法和系统 Download PDF

Info

Publication number
CN110955757A
CN110955757A CN201911241158.7A CN201911241158A CN110955757A CN 110955757 A CN110955757 A CN 110955757A CN 201911241158 A CN201911241158 A CN 201911241158A CN 110955757 A CN110955757 A CN 110955757A
Authority
CN
China
Prior art keywords
log information
log
photovoltaic power
morpheme
retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911241158.7A
Other languages
English (en)
Inventor
卫红叶
陆伟
牛峰
许盛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sungrow Power Supply Co Ltd
Original Assignee
Sungrow Power Supply Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sungrow Power Supply Co Ltd filed Critical Sungrow Power Supply Co Ltd
Priority to CN201911241158.7A priority Critical patent/CN110955757A/zh
Publication of CN110955757A publication Critical patent/CN110955757A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E40/00Technologies for an efficient electrical power generation, transmission or distribution
    • Y02E40/70Smart grids as climate change mitigation technology in the energy generation sector
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种光伏电站设备日志检索方法和系统。该方法包括:获取光伏电站设备的日志信息,日志信息用于记录光伏电站设备的运行状态;对日志信息进行分词处理,提取日志信息的关键词;提取用户输入的查询语句的语素,并根据查询语句的语素与日志信息的关键词的相关度确定检索结果。本实施例的技术方案解决了传统现场定位故障的方法耗费人力物力,以及统一格式化处理日志信息的方法检索效率低下,无法针对光伏电站设备故障进行快速定位的问题。实现了光伏电站设备日志信息的远端采集、存储及检索,日志信息检索方式灵活,提高了数据处理速度和检索效率,降低了运维人员出差到现场调试的成本,提升了光伏电站智慧化运维的能力。

Description

光伏电站设备日志检索方法和系统
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种光伏电站设备日志检索方法和系统。
背景技术
目前,光伏电站大多建设在偏远地区,当系统设备出现故障需要定位时,客服人员必须到客户现场使用定制的串口工具采集设备日志进行确定后才能进行调试,特别针对于偶现的问题,需要耗费大量的人力物力。
现有技术方案中,一般是将采集到的异构设备日志信息统一进行格式化处理后存储在数据库中,通过创建索引的方式进行检索,这种方式数据处理进程较慢,数据检索效率较低,且无法针对光伏电站设备快速定位现场故障,缺乏一套完整的解决方案。
发明内容
本发明实施例提供一种光伏电站设备日志检索方法和系统,以实现光伏电站设备日志信息的远端采集、存储及检索,提高数据处理速度和检索效率,降低运维成本,提升光伏电站智慧化运维的能力。
第一方面,本发明实施例提供了一种光伏电站设备日志检索方法,该方法包括:
获取光伏电站设备的日志信息,所述日志信息用于记录所述光伏电站设备的运行状态;
对所述日志信息进行分词处理,提取所述日志信息的关键词;
提取用户输入的查询语句的语素,并根据所述查询语句的语素与所述日志信息的关键词的相关度确定检索结果。
可选地,获取光伏电站设备的日志信息,包括:
周期性地获取订阅的各个光伏电站设备的日志信息。
可选地,所述日志信息包括日志报文和日志编号;
对所述日志信息进行分词处理,提取所述日志信息的关键词,包括:
从所述日志信息的日志报文中提取至少一个关键词;
将所述至少一个关键词与对应的日志编号关联,并生成按照日志编号从大到小的顺序排列的倒排表。
可选地,所述日志信息包括时间信息,所述时间信息用于指示所述日志信息的获取时间;所述方法还包括:
根据所述日志信息的时间信息将所述日志信息切分为热日志信息和冷日志信息,其中,所述热日志信息为设定周期内获取的日志信息,所述冷日志信息为设定周期外获取的日志信息;
将所述热日志信息和所述冷日志信息分别存储于不同的数据节点;
若所述查询语句中包括查询时间,则判断所述查询时间是否在所述设定周期内;
若所述查询时间在所述设定周期内,则在存储所述热日志信息的数据节点内确定所述检索结果;
若所述查询时间不在所述设定周期内,则在存储所述冷日志信息的数据节点内确定所述检索结果。
可选地,所述方法还包括:
若设定时间内提取到重复的查询语句,则将第一次根据所述查询语句确定的检索结果对应的日志信息转存到存储查询结果缓存数据节点或所述热日志信息的数据节点,并设置过期时间;
若在所述过期时间内提取到重复的所述查询语句,则确定第一次根据所述查询语句确定的检索结果为本次检索结果。
可选地,提取用户输入的查询语句的语素,并根据所述查询语句的语素与所述日志信息的关键词的相关度确定检索结果,包括:
对所述查询语句进行语素分析,提取至少一个语素;
计算各所述语素的相关性权重,并对所述相关性权重的计算进行优化;
计算各所述语素与对应的备选日志信息的相关性得分,其中,所述备选日志信息为包括所述语素的日志信息;
根据优化后的所述相关性权重和所述相关性得分确定各所述备选日志信息的相关度;
确定满足目标相关度的所述备选日志信息为检索结果。
可选地,计算各所述语素的相关性权重包括:
确定所述日志信息的总数;
计算包含各所述语素的日志信息的数量;
根据所述日志信息的总数和包含所述语素的日志信息的数量确定各所述语素的相关性权重;
优化后的相关性权重计算为:
Figure BDA0002306262970000041
其中,IDF(qi)为优化后的相关性权重,qi为第i个语素,N为所述日志信息的总数,n(qi)为包含第i个语素的日志信息的数量。
可选地,计算各所述语素与对应的备选日志信息的相关性得分,包括:
确定各所述语素在所述备选日志信息中出现的频率;
根据第一预设调节因子、第二预设调节因子、各所述语素对应的备选日志信息的长度和所有日志信息的平均长度计算检索结果对应的调节系数;
根据各所述语素在备选日志信息中出现的频率和所述调节系数确定各所述语素与对应的备选日志信息的相关性得分。
可选地,所述调节系数计算为:
Figure BDA0002306262970000042
其中,K为所述调节系数,k1为第一预设调节因子,b为第二预设调节因子,dl为所述语素对应的日志信息的长度,avgdl为所有日志信息的平均长度;
所述相关性得分计算为:
Figure BDA0002306262970000043
其中,R(qi,d)为第i个语素对应的日志信息d的相关性得分,fi为第i个语素在日志信息d中出现的频率。
可选地,根据优化后的所述相关性权重和所述相关性得分确定所述查询语句与对应的各日志信息的相关度,包括:
将i个语素分别与备选日志信息dj的相关性得分进行加权求和,确定备选日志信息dj的相关度,其中,j为大于等于1、且小于等于n的整数。
第二方面,本发明实施例还提供了一种光伏电站设备日志检索系统,该系统包括:
日志信息获取模块,用于获取光伏电站设备的日志信息,所述日志信息用于记录所述光伏电站设备的运行状态;
关键词提取模块,用于对所述日志信息进行分词处理,提取所述日志信息的关键词;
检索结果确定模块,用于提取用户输入的查询语句的语素,并根据所述查询语句的语素与所述日志信息的关键词的相关度确定检索结果。
本发明实施例提供了一种光伏电站设备日志检索方法和系统,该方法包括:获取光伏电站设备的日志信息,日志信息用于记录光伏电站设备的运行状态;对日志信息进行分词处理,提取日志信息的关键词;提取用户输入的查询语句的语素,并根据查询语句的语素与日志信息的关键词的相关度确定检索结果。通过物联网远端获取光伏电站设备的日志信息,由云平台对日志信息进行分词处理及存储,并根据查询语句的语素与日志信息的关键词的相关度确定检索结果,无需运维人员到现场即可查到设备的日志信息,不需要对海量数据结构不同的日志信息进行归一化格式处理,能够实现异构日志信息的检索。解决了传统现场定位故障的方法耗费人力物力,以及统一格式化处理日志信息的方法检索效率低下,无法针对光伏电站设备故障进行快速定位的问题。实现了光伏电站设备日志信息的远端采集、存储及检索,日志信息检索方式灵活,提高了数据处理速度和检索效率,降低了运维人员出差到现场调试的成本,提升了光伏电站智慧化运维的能力。
附图说明
图1为本发明实施例提供的一种光伏电站设备日志检索方法的流程示意图;
图2为本发明实施例提供的另一种光伏电站设备日志检索方法的流程示意图;
图3为本发明实施例提供的另一种光伏电站设备日志检索方法的流程示意图;
图4为本发明实施例提供的另一种光伏电站设备日志检索方法的流程示意图;
图5为本发明实施例提供的另一种光伏电站设备日志检索方法的流程示意图;
图6为本发明实施例提供的一种光伏电站设备日志检索系统的结构示意图;
图7为本发明实施例提供的一种光伏电站设备日志检索设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
图1为本发明实施例提供的一种光伏电站设备日志检索方法的流程示意图。本实施例可适用于获取、处理、存储并检索光伏电站设备日志的情况,该方法可以由光伏电站设备日志检索系统执行,该系统可以采用软件和/或硬件的方式实现,该系统可配置于电子设备中,例如服务器或终端设备,典型的终端设备具体包括电脑或平板电脑等。如图1所示,该方法具体可以包括:
S110、获取光伏电站设备的日志信息。其中,日志信息用于记录光伏电站设备的运行状态。
具体地,光伏电站设备可以包括光伏电站中的逆变器、电表和通讯设备等。光伏电站设备的日志信息可以包括设备编号、信息获取时间和设备的运行状态等信息,其中,运行状态可以包括设备联网状态、设备故障状态和设备故障节点等信息。
示例性地,通过物联网建立云平台和光伏电站设备之间的连接,光伏电站设备可将运行状态的日志信息进行存储记录,由通信设备将日志信息上传至云平台,通过云平台进行光伏电站设备的日志信息的获取,并通过分布式的存储引擎不断对日志信息进行更新。
S120、对日志信息进行分词处理,提取日志信息的关键词。
具体地,云平台可以通过提取各日志信息中不同类型的关键词实现对日志信息的分词处理。例如,日志信息可以包括设备类型、设备编号、信息获取时间和设备的运行状态等信息,通过对上述信息进行分词处理可以提取不同类型信息的关键词。其中,由于光伏电站中各设备的类型和功能互不相同,日志信息的格式也各不相同,例如,通信设备的日志信息中的关键词可以包括联网情况,而逆变器的日志信息的关键词可以包括输出功率,而不包括联网情况。这样能够直接获取海量异构的光伏电站设备的日志信息并分析提取不同类型的关键词,而不需要对多样的日志信息进行统一的归一格式化处理,提升了数据处理的速度。
S130、提取用户输入的查询语句的语素,并根据查询语句的语素与日志信息的关键词的相关度确定检索结果。
示例性地,当光伏电站现场出现问题时,运维人员可在浏览器输入查询语句进行查询,例如,运维人员想要获取逆变器0050在2019年11月30日的故障信息,可以输入查询语句:“2019年11月30日逆变器0050的运行状态”进行查询,云平台通过检索引擎对该查询语句进行语素分析,提取该查询语句中的语素“2019年11月30日”、“逆变器”、“0050”和“运行状态”,并根据日志信息的关键词“信息获取时间”、“设备类型”“设备编号”“设备的运行状态”确定查询语句中的语素与日志信息的关键词的相关度,将相关度最高的一组或较高的几组作为最终的检索结果。这种检索方法能够根据运维人员输入的多样化查询语句快速确定相关度最高的检索结果,同时也不需要事先对日志信息的格式进行处理,相较于传统的通过单一类型索引检索统一化日志信息数据的方式更为灵活高效。
本发明实施例提供的光伏电站设备日志检索方法,能够通过物联网远端获取光伏电站设备的日志信息,由云平台对日志信息进行分词处理及存储,并根据查询语句的语素与日志信息的关键词的相关度确定检索结果,无需运维人员到现场即可查到设备的日志信息,不需要对海量数据结构不同的日志信息进行归一化格式处理,能够实现异构日志信息的检索。解决了传统现场定位故障的方法耗费人力物力,以及统一格式化处理日志信息的方法检索效率低下,无法针对光伏电站设备故障进行快速定位的问题。实现了光伏电站设备日志信息的远端采集、存储及检索,日志信息检索方式灵活,提高了数据处理速度和检索效率,降低了运维人员出差到现场调试的成本,提升了光伏电站智慧化运维的能力。
图2为本发明实施例提供的另一种光伏电站设备日志检索方法的流程示意图。本实施例在上述实施例的基础上,进一步优化了上述光伏电站设备日志检索方法。相应的,如图2所示,本实施例的方法具体包括:
S210、周期性地获取订阅的各个光伏电站设备的日志信息。
示例性地,可以通过通信设备按照设定周期轮询获取光伏电站设备的最新日志信息,通过云平台中的信息收集层预设一个数据收集节点用于收集日志信息,使用发布和订阅的模式将光伏电站设备的日志信息发布到指定收集节点,信息收集层负责订阅日志信息,并获取通信设备发布的日志信息,通过通信设备统一采集光伏电站设备的日志信息,并上传到云平台。
可选地,日志信息包括日志报文和日志编号。其中,日志报文可以记录上述实施例中所提到的设备编号和设备的运行状态等信息。
具体地,日志报文用于记录光伏电站设备详细的日志内容,各光伏电站设备的日志报文的格式可以互不相同,每个日志信息都可以对应唯一的一个日志编号。
S220、从日志信息的日志报文中提取至少一个关键词。
示例性地,一种日志报文的内容可以是:XX设备在XX时间未联网,则可以提取关键词“XX设备”(设备型号)、“XX时间”(信息获取时间)和“未联网”(联网状态),另一种日志报文内容可以是:*编号*设备在*时间故障运行,则可以提取关键词“*编号”(设备编号)、“*设备”(设备类型)、“*时间”(信息获取时间)和“故障运行”(设备的运行状态),可以通过云平台的信息处理层进行上述分词处理,提取不同类型信息的关键词。
S230、将至少一个关键词与对应的日志编号关联,并生成按照日志编号从大到小的顺序排列的倒排表。
具体地,可以根据日志信息获取的先后顺序进行编号,信息获取时间越早编号越小,获取时间越晚编号越大。对日志信息进行分词处理后,可以生成关键词及其对应的日志编号的倒排表,即每个关键词都指向包含该词的日志信息的日志链表,且日志编号从大到小的顺序倒排,这样运维人员检索时,最新获取的信息在倒排表中位于前列,便于快速得到每个关键词对应的日志信息,
S240、提取用户输入的查询语句的语素,并根据查询语句的语素与日志信息的关键词的相关度确定检索结果。
本实施例提供的光伏电站设备日志检索方法,优化了海量设备日志信息的存储方式,提升了运维人员的检索速度,不必再将海量非结构化数据进行归一化处理,提升了查询效率。
图3为本发明实施例提供的另一种光伏电站设备日志检索方法的流程示意图。本实施例在上述实施例的基础上,进一步优化了上述光伏电站设备日志检索方法。相应的,如图3所示,本实施例的方法具体包括:
S310、获取光伏电站设备的日志信息。其中,日志信息用于记录光伏电站设备的运行状态。
S320、对日志信息进行分词处理,提取日志信息的关键词。
可选地,日志信息包括时间信息,时间信息用于指示日志信息的获取时间(即上述实施例中提到的信息获取时间)。
相应的,该方法还可以包括:
S330、根据日志信息的时间信息将日志信息切分为热日志信息和冷日志信息。其中,热日志信息为设定周期内获取的日志信息,冷日志信息为设定周期外获取的日志信息。
具体地,可以在设备日志信息存储时,预先设置设定周期按获取时间对日志信息进行切分,将获取时间超过设定周期的日志信息切分为冷日志信息,将获取时间在设定周期以内的日志信息切分为热日志信息。
S340、将热日志信息和冷日志信息分别存储于不同的数据节点。
示例性地,光伏电站维护的场景一般专注于近期的设备日志信息查询(例如设定周期为最近1个月),可以通过云平台的信息存储层对日志信息进行存储,将热日志信息存储在性能较好的服务器中的固态硬盘上,较早的日志信息由于数据完整性也需要保留,但早期日志信息查询频次较低,可以将冷日志信息存储在另一台服务器中,实现日志信息的分布式存储。
S350、判断查询语句中是否包括查询时间。
若查询语句中包括查询时间,则执行S360;若查询语句中不包括查询时间,则执行S390。其中,查询时间用于确定日志信息的获取时间。
S360、判断查询时间是否在设定周期内。
若查询时间在设定周期内,则执行S370;若查询时间不在设定周期内,则执行S380。
S370、在存储热日志信息的数据节点内确定检索结果。
具体地,当运维人员通过云平台的查询服务进行检索时,如果指定了查询时间,则判断查询时间是否在预先设置的设定周期内,若查询时间在设定周期内,则直接到存储热日志信息的数据节点进行查询,这样有利于快速获得近期的设备日志信息。
S380、在存储冷日志信息的数据节点内确定检索结果。
若查询时间不在设定周期内,则直接到存储冷日志信息的数据节点进行查询,这样有利于运维人员快速获得指定时间范围的数据。
S390、提取用户输入的查询语句的语素,并根据查询语句的语素与日志信息的关键词的相关度确定检索结果。
本实施例的技术方案,能够根据信息获取时间对海量光伏电站设备的日志信息进行分布式存储,将数据分别存储在不同的数据节点,以提升检索效率。另外,将检索频繁的热日志信息存储在性能好的服务器中,将检索频次低的冷日志信息存储在一般性能的服务器中,有利于提升检索性能。
可选地,在上述技术方案的基础上,光伏电站设备日志检索方法还包括:
若设定时间内提取到重复的查询语句,则将第一次根据查询语句确定的检索结果对应的日志信息转存到存储查询结果缓存数据节点或热日志信息的数据节点,并设置过期时间。
若在过期时间内提取到重复的查询语句,则确定第一次根据查询语句确定的检索结果为本次检索结果。
具体地,可以预先设置设定时间,若用户在设定时间内重复查询同样的信息,即云平台在设定时间内提取到重复的查询语句,则可以将根据第一次输入的该查询语句确定的检索结果对应的日志信息进行转存,转存到热日志信息的数据节点对应的服务器,或转存到用于存储查询结果缓存数据的服务器,并设置对应于该查询语句的过期时间,例如,过期时间可以是30分钟。可选地,还可以预先设置重复次数,例如重复次数可以是2次或3次等,即在设定时间内第二次提取到重复的查询语句,或第三次提取到重复的查询语句时,再执行数据转存和过期时间的设置。这样有利于根据设定来判断该查询语句对应的日志信息是否是频繁查询的信息,若需要频繁查询,则将该信息保存至缓存服务器或性能更佳的服务器,以提升检索速度。
示例性地,若过期时间是30分钟,云平台在数据转存后的10分钟再次提取到了重复的查询语句,则直接确定第一次根据该查询语句确定的检索结果本本次检索结果,到存储缓存数据节点或热日志信息的数据节点的服务器提取对应的日志信息。这样能够避免云平台根据重复的查询语句进行二次检索,进一步提升了检索速度。
图4为本发明实施例提供的另一种光伏电站设备日志检索方法的流程示意图。本实施例在上述实施例的基础上,进一步优化了上述检索结果确定方法。相应的,如图4所示,本实施例的方法具体包括:
S410、获取光伏电站设备的日志信息。其中,日志信息用于记录光伏电站设备的运行状态。
S420、对日志信息进行分词处理,提取日志信息的关键词。
S430、对查询语句进行语素分析,提取至少一个语素。
示例性地,可以对查询语句的成分进行分析,提取不同类型的语素,例如提取查询语句“2019年11月30日逆变器0050的运行状态”中的语素“2019年11月30日”、“逆变器”、“0050”和“运行状态”。
S440、计算各语素的相关性权重,并对相关性权重的计算进行优化。
具体地,可以预先确定所有日志信息的总数,以及包含每个语素的日志信息的数量,计算查询语句中每个语素与所有日志信息的相关性权重,并对相关性权重的计算进行优化处理,避免相关性权重出现负值,影响最终的检索结果。
S450、计算各语素与对应的备选日志信息的相关性得分。其中,备选日志信息为包括语素的日志信息。
具体地,备选日志信息可以是包括查询语句中任意语素的日志信息。可以根据语素在备选日志信息中出现的次数计算每个语素与各个备选日志信息的相关性得分。
S460、根据优化后的相关性权重和相关性得分确定各备选日志信息的相关度。
示例性地,确定某个备选日志信息与查询语句的相关度时,可以根据查询语句中各语素优化后的相关性权重和各语素与该备选日志信息的相关性得分来确定该备选日志信息的相关度。
S470、确定满足目标相关度的备选日志信息为检索结果。
具体地,可以预先设定目标相关度,将备选日志信息的相关度最高的一组日志信息或几组日志信息确定为检索结果。
本实施例的技术方案,能够针对异构设备日志进行检索,不必将海量非结构化日志数据进行归一格式化处理,提升了查询效率,运维人员不需要到光伏电站现场即可快速定位排查物联网环境下光伏电站设备的问题,降低了运维成本,提升了光伏电站智慧化运维的能力。
图5为本发明实施例提供的另一种光伏电站设备日志检索方法的流程示意图。本实施例在上述实施例的基础上,进一步优化了上述检索结果确定方法。相应的,如图5所示,本实施例的方法具体包括:
S501、获取光伏电站设备的日志信息。其中,日志信息用于记录光伏电站设备的运行状态。
S502、对日志信息进行分词处理,提取日志信息的关键词。
示例性地,假设所有的日志信息为:
1)A18090322 4G signal strength is weak,real-time data publish fail.
2)A18090322 MQTT reconnect successful,start publishing fault data.
3)A17090823 MQTT connect success,start publishing real-time data.
对日志信息1)进行分词处理,得到关键词A18090322、4G signal strength isweak和real-time data publish fail;对日志信息2)进行分词处理,得到关键词A18090322、MQTT reconnect successful和start publishing fault data;对日志信息3)进行分词处理,得到关键词A17090823、MQTT connect success和start publishing real-time data。
S503、对查询语句进行语素分析,提取至少一个语素。
假设运维人员输入的查询语句为:A18090322 real-time data。对该查询语句进行语素分析,提取语素q1:A18090322、语素q2:real-time和语素q3:data。
S504、确定日志信息的总数。
通过云平台自动统计所有日志信息的总数,示例性地,日志信息的总数为3。
S505、计算包含各语素的日志信息的数量。
具体地,在上述日志信息1)-3)中,包含语素q1:A18090322的日志信息数量为2、包含语素q2:real-time的日志信息数量为1和包含语素q3:data的日志信息数量为3。
S506、根据日志信息的总数和包含语素的日志信息的数量确定各语素的相关性权重。
可选地,优化后的相关性权重计算为:
Figure BDA0002306262970000161
其中,IDF(qi)为优化后的相关性权重,qi为第i个语素,N为日志信息的总数,n(qi)为包含第i个语素的日志信息的数量。
此处对log中的除式进行加1的优化处理,使IDF(qi)的值永远大于1。否则当公式中包含qi的文档数n(qi)超过N/2时,IDF(qi)可能会为负值,影响最终的检索结果。
具体地,包含语素q1的相关性权重IDF(A18090322)=0.204,包含语素q2的相关性权重IDF(real-time)=0.204,包含语素q3的相关性权重IDF(data)=0.057。
S507、确定各语素在备选日志信息中出现的频率。
具体地,各语素在备选日志信息中出现的频率可以是出现的次数,语素q1在日志信息1)-3)中出现的次数为1,语素q2在日志信息1)-3)中出现的次数为1,语素q3在日志信息1)-3)中出现的次数为1。
S508、根据第一预设调节因子、第二预设调节因子、各语素对应的备选日志信息的长度和所有日志信息的平均长度计算检索结果对应的调节系数。
可选地,调节系数计算为:
Figure BDA0002306262970000162
其中,K为调节系数,k1为第一预设调节因子,b为第二预设调节因子,dl为语素对应的日志信息的长度,avgdl为所有日志信息的平均长度。
具体地,可以通过云平台自动统计各语素对应的备选日志信息的长度及所有日志信息的平均长度,例如日志信息1)为备选日志信息,日志信息1)的长度可以是64,所有日志信息的平均长度可以是63。第一预设调节因子k1及第二预设调节因子b能够影响检索到的日志信息数量,可以根据运维人员的检索需求进行确定,例如k1=2,b=0.75,则K=2.0234。
S509、根据各语素在备选日志信息中出现的频率和调节系数确定各语素与对应的备选日志信息的相关性得分。
可选地,相关性得分计算为:
Figure BDA0002306262970000171
其中,R(qi,d)为第i个语素对应的日志信息d的相关性得分,fi为第i个语素在日志信息d中出现的频率。
则语素q1:A18090322与日志信息1)的相关性得分可计算为:R(q1,d)=1*(2+1)/(1+2.0234)=0.992,语素q2:real-time与日志信息1)的相关性得分为:0.992,语素q3:data与日志信息1)的相关性得分为:0.992。同理,也可以计算各语素与其他备选日志信息的相关性得分。
S510、将i个语素分别与备选日志信息dj的相关性得分进行加权求和,确定备选日志信息dj的相关度。其中,j为大于等于1、且小于等于n的整数。
示例性地,语素q1-q3与日志信息1)的相关度可计算为Score(qi,d1)=0.204*0.992+0.204*0.992+0.057*0.992=0.461。同理,也可以计算语素q1-q3与日志信息2)和3)的相关度,例如,语素q1-q3与日志信息2)的相关度为Score(qi,d2)=0.262,语素q1-q3与日志信息3)的相关度为Score(qi,d3)=0.264。
S511、确定满足目标相关度的备选日志信息为检索结果。
示例性地,可以对各备选日志的相关度Score(qi,di)按相关度从大到小进行降排序,确定满足目标相关度的第一组备选日志信息或前几组备选日志信息为检索结果。
本实施例的技术方案,能够针对异构设备日志进行检索,不必将海量非结构化日志数据进行归一格式化处理,提升了查询效率,细化了具体地检索方案,提升了检索的精确度,使运维人员不需要到光伏电站现场即可快速获取精确的日志信息。
图6为本发明实施例提供的一种光伏电站设备日志检索系统的结构示意图。本实施例可适用于实现获取、处理、存储并检索光伏电站设备日志的情况。本发明实施例所提供的光伏电站设备日志检索系统可执行本发明任意实施例所提供的光伏电站设备日志检索方法,具备执行方法相应的功能模块和有益效果。
该系统具体包括:日志信息获取模块610、关键词提取模块620和检索结果确定模块630,其中:
日志信息获取模块610用于获取光伏电站设备的日志信息,日志信息用于记录光伏电站设备的运行状态。
关键词提取模块620用于对日志信息进行分词处理,提取日志信息的关键词。
检索结果确定模块630用于提取用户输入的查询语句的语素,并根据查询语句的语素与日志信息的关键词的相关度确定检索结果。
本发明实施例所提供的光伏电站设备日志检索系统可执行本发明任意实施例所提供的光伏电站设备日志检索方法,具备执行方法相应的功能模块和有益效果。
可选地,日志信息获取模块610还用于:周期性地获取订阅的各个光伏电站设备的日志信息。
可选地,日志信息包括日志报文和日志编号;关键词提取模块620还用于:从日志信息的日志报文中提取至少一个关键词;将至少一个关键词与对应的日志编号关联,并生成按照日志编号从大到小的顺序排列的倒排表。
可选地,日志信息包括时间信息,时间信息用于指示日志信息的获取时间;该系统还包括:存储路径确定模块,用于根据日志信息的时间信息将日志信息切分为热日志信息和冷日志信息,其中,热日志信息为设定周期内获取的日志信息,冷日志信息为设定周期外获取的日志信息;将热日志信息和冷日志信息分别存储于不同的数据节点;若查询语句中包括查询时间,则判断查询时间是否在设定周期内;若查询时间在设定周期内,则在存储热日志信息的数据节点内确定检索结果;若查询时间不在设定周期内,则在存储冷日志信息的数据节点内确定检索结果。
可选地,检索结果确定模块630还用于:对查询语句进行语素分析,提取至少一个语素;计算各语素的相关性权重,并对相关性权重的计算进行优化;计算各语素与对应的备选日志信息的相关性得分,其中,备选日志信息为包括语素的日志信息;根据优化后的相关性权重和相关性得分确定各备选日志信息的相关度;确定满足目标相关度的备选日志信息为检索结果。
可选地,检索结果确定模块630还用于:确定日志信息的总数;计算包含各语素的日志信息的数量;根据日志信息的总数和包含语素的日志信息的数量确定各语素的相关性权重。
可选地,优化后的相关性权重计算为:
Figure BDA0002306262970000191
其中,IDF(qi)为优化后的相关性权重,qi为第i个语素,N为日志信息的总数,n(qi)为包含第i个语素的日志信息的数量。
可选地,检索结果确定模块630还用于:确定各语素在备选日志信息中出现的频率;根据第一预设调节因子、第二预设调节因子、各语素对应的备选日志信息的长度和所有日志信息的平均长度计算检索结果对应的调节系数;根据各语素在备选日志信息中出现的频率和调节系数确定各语素与对应的备选日志信息的相关性得分。
可选地,调节系数计算为:
Figure BDA0002306262970000201
其中,K为调节系数,k1为第一预设调节因子,b为第二预设调节因子,dl为语素对应的日志信息的长度,avgdl为所有日志信息的平均长度;
相关性得分计算为:
Figure BDA0002306262970000202
其中,R(qi,d)为第i个语素对应的日志信息d的相关性得分,fi为第i个语素在日志信息d中出现的频率。
可选地,检索结果确定模块630还用于:将i个语素分别与备选日志信息dj的相关性得分进行加权求和,确定备选日志信息dj的相关度,其中,j为大于等于1、且小于等于n的整数。
图7为本发明实施例提供的一种光伏电站设备日志检索设备的结构示意图。图7示出了适于用来实现本发明实施方式的示例性设备412的框图。图7显示的设备412仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,设备412以通用设备的形式表现。设备412的组件可以包括但不限于:一个或者多个处理器416,存储装置428,连接不同系统组件(包括存储装置428和处理器416)的总线418。
总线418表示几类总线结构中的一种或多种,包括存储装置总线或者存储装置控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry SubversiveAlliance,ISA)总线,微通道体系结构(Micro Channel Architecture,MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
设备412典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备412访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置428可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)430和/或高速缓存存储器432。设备412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘,例如只读光盘(Compact Disc Read-Only Memory,CD-ROM),数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储装置428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块442的程序/实用工具440,可以存储在例如存储装置428中,这样的程序模块442包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块442通常执行本发明所描述的实施例中的功能和/或方法。
设备412也可以与一个或多个外部设备414(例如键盘、指向终端、显示器424等)通信,还可与一个或者多个使得用户能与该设备412交互的终端通信,和/或与使得该设备412能与一个或多个其它计算终端进行通信的任何终端(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口422进行。并且,设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网(Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图7所示,网络适配器420通过总线418与设备412的其它模块通信。应当明白,尽管图中未示出,可以结合设备412使用其它硬件和/或软件模块,包括但不限于:微代码、终端驱动器、冗余处理器、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器416通过运行存储在存储装置428中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的光伏电站设备日志检索方法,参照图1,该方法包括:
S110、获取光伏电站设备的日志信息。其中,日志信息用于记录光伏电站设备的运行状态。
S120、对日志信息进行分词处理,提取日志信息的关键词。
S130、提取用户输入的查询语句的语素,并根据查询语句的语素与日志信息的关键词的相关度确定检索结果。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的光伏电站设备日志检索方法,参照图1,该方法包括:
S110、获取光伏电站设备的日志信息。其中,日志信息用于记录光伏电站设备的运行状态。
S120、对日志信息进行分词处理,提取日志信息的关键词。
S130、提取用户输入的查询语句的语素,并根据查询语句的语素与日志信息的关键词的相关度确定检索结果。本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或终端上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种光伏电站设备日志检索方法,其特征在于,包括:
获取光伏电站设备的日志信息,所述日志信息用于记录所述光伏电站设备的运行状态;
对所述日志信息进行分词处理,提取所述日志信息的关键词;
提取用户输入的查询语句的语素,并根据所述查询语句的语素与所述日志信息的关键词的相关度确定检索结果。
2.根据权利要求1所述的光伏电站设备日志检索方法,其特征在于,获取光伏电站设备的日志信息,包括:
周期性地获取订阅的各个光伏电站设备的日志信息。
3.根据权利要求1所述的光伏电站设备日志检索方法,其特征在于,所述日志信息包括日志报文和日志编号;
对所述日志信息进行分词处理,提取所述日志信息的关键词,包括:
从所述日志信息的日志报文中提取至少一个关键词;
将所述至少一个关键词与对应的日志编号关联,并生成按照日志编号从大到小的顺序排列的倒排表。
4.根据权利要求1所述的光伏电站设备日志检索方法,其特征在于,所述日志信息包括时间信息,所述时间信息用于指示所述日志信息的获取时间;所述方法还包括:
根据所述日志信息的时间信息将所述日志信息切分为热日志信息和冷日志信息,其中,所述热日志信息为设定周期内获取的日志信息,所述冷日志信息为设定周期外获取的日志信息;
将所述热日志信息和所述冷日志信息分别存储于不同的数据节点;
若所述查询语句中包括查询时间,则判断所述查询时间是否在所述设定周期内;
若所述查询时间在所述设定周期内,则在存储所述热日志信息的数据节点内确定所述检索结果;
若所述查询时间不在所述设定周期内,则在存储所述冷日志信息的数据节点内确定所述检索结果。
5.根据权利要求4所述的光伏电站设备日志检索方法,其特征在于,所述方法还包括:
若设定时间内提取到重复的查询语句,则将第一次根据所述查询语句确定的检索结果对应的日志信息转存到存储查询结果缓存数据节点或所述热日志信息的数据节点,并设置过期时间;
若在所述过期时间内提取到重复的所述查询语句,则确定第一次根据所述查询语句确定的检索结果为本次检索结果。
6.根据权利要求1所述的光伏电站设备日志检索方法,其特征在于,提取用户输入的查询语句的语素,并根据所述查询语句的语素与所述日志信息的关键词的相关度确定检索结果,包括:
对所述查询语句进行语素分析,提取至少一个语素;
计算各所述语素的相关性权重,并对所述相关性权重的计算进行优化;
计算各所述语素与对应的备选日志信息的相关性得分,其中,所述备选日志信息为包括所述语素的日志信息;
根据优化后的所述相关性权重和所述相关性得分确定各所述备选日志信息的相关度;
确定满足目标相关度的所述备选日志信息为检索结果。
7.根据权利要求6所述的光伏电站设备日志检索方法,其特征在于,计算各所述语素的相关性权重包括:
确定所述日志信息的总数;
计算包含各所述语素的日志信息的数量;
根据所述日志信息的总数和包含所述语素的日志信息的数量确定各所述语素的相关性权重;
优化后的相关性权重计算为:
Figure FDA0002306262960000031
其中,IDF(qi)为优化后的相关性权重,qi为第i个语素,N为所述日志信息的总数,n(qi)为包含第i个语素的日志信息的数量。
8.根据权利要求6所述的光伏电站设备日志检索方法,其特征在于,计算各所述语素与对应的备选日志信息的相关性得分,包括:
确定各所述语素在所述备选日志信息中出现的频率;
根据第一预设调节因子、第二预设调节因子、各所述语素对应的备选日志信息的长度和所有日志信息的平均长度计算检索结果对应的调节系数;
根据各所述语素在备选日志信息中出现的频率和所述调节系数确定各所述语素与对应的备选日志信息的相关性得分。
9.根据权利要求8所述的光伏电站设备日志检索方法,其特征在于,
所述调节系数计算为:
Figure FDA0002306262960000032
其中,K为所述调节系数,k1为第一预设调节因子,b为第二预设调节因子,dl为所述语素对应的日志信息的长度,avgdl为所有日志信息的平均长度;
所述相关性得分计算为:
Figure FDA0002306262960000041
其中,R(qi,d)为第i个语素对应的日志信息d的相关性得分,fi为第i个语素在日志信息d中出现的频率。
10.根据权利要求6所述的光伏电站设备日志检索方法,其特征在于,根据优化后的所述相关性权重和所述相关性得分确定所述查询语句与对应的各日志信息的相关度,包括:
将i个语素分别与备选日志信息dj的相关性得分进行加权求和,确定备选日志信息dj的相关度,其中,j为大于等于1、且小于等于n的整数。
11.一种光伏电站设备日志检索系统,其特征在于,包括:
日志信息获取模块,用于获取光伏电站设备的日志信息,所述日志信息用于记录所述光伏电站设备的运行状态;
关键词提取模块,用于对所述日志信息进行分词处理,提取所述日志信息的关键词;
检索结果确定模块,用于提取用户输入的查询语句的语素,并根据所述查询语句的语素与所述日志信息的关键词的相关度确定检索结果。
CN201911241158.7A 2019-12-06 2019-12-06 光伏电站设备日志检索方法和系统 Pending CN110955757A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911241158.7A CN110955757A (zh) 2019-12-06 2019-12-06 光伏电站设备日志检索方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911241158.7A CN110955757A (zh) 2019-12-06 2019-12-06 光伏电站设备日志检索方法和系统

Publications (1)

Publication Number Publication Date
CN110955757A true CN110955757A (zh) 2020-04-03

Family

ID=69980008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911241158.7A Pending CN110955757A (zh) 2019-12-06 2019-12-06 光伏电站设备日志检索方法和系统

Country Status (1)

Country Link
CN (1) CN110955757A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626597A (zh) * 2020-05-22 2020-09-04 广东电网有限责任公司 一种设备报警方法、装置、设备和介质
CN112182193A (zh) * 2020-10-19 2021-01-05 山东旗帜信息有限公司 一种交通行业中日志获取方法、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793479A (zh) * 2014-01-14 2014-05-14 上海上讯信息技术股份有限公司 日志管理方法及系统
CN104462349A (zh) * 2014-12-05 2015-03-25 曙光信息产业(北京)有限公司 一种文件处理方法及装置
CN106599199A (zh) * 2016-12-14 2017-04-26 国云科技股份有限公司 一种数据缓存与同步方法
CN108427705A (zh) * 2018-01-17 2018-08-21 平安科技(深圳)有限公司 电子装置、分布式系统日志查询方法及存储介质
CN109271355A (zh) * 2018-08-27 2019-01-25 杭州迪普科技股份有限公司 一种清理日志文件缓存的方法及装置
CN110532347A (zh) * 2019-09-02 2019-12-03 北京博睿宏远数据科技股份有限公司 一种日志数据处理方法、装置、设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793479A (zh) * 2014-01-14 2014-05-14 上海上讯信息技术股份有限公司 日志管理方法及系统
CN104462349A (zh) * 2014-12-05 2015-03-25 曙光信息产业(北京)有限公司 一种文件处理方法及装置
CN106599199A (zh) * 2016-12-14 2017-04-26 国云科技股份有限公司 一种数据缓存与同步方法
CN108427705A (zh) * 2018-01-17 2018-08-21 平安科技(深圳)有限公司 电子装置、分布式系统日志查询方法及存储介质
CN109271355A (zh) * 2018-08-27 2019-01-25 杭州迪普科技股份有限公司 一种清理日志文件缓存的方法及装置
CN110532347A (zh) * 2019-09-02 2019-12-03 北京博睿宏远数据科技股份有限公司 一种日志数据处理方法、装置、设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
许舸: ""基于语言模型的个性化检索方法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626597A (zh) * 2020-05-22 2020-09-04 广东电网有限责任公司 一种设备报警方法、装置、设备和介质
CN112182193A (zh) * 2020-10-19 2021-01-05 山东旗帜信息有限公司 一种交通行业中日志获取方法、设备及介质
CN112182193B (zh) * 2020-10-19 2023-01-13 山东旗帜信息有限公司 一种交通行业中日志获取方法、设备及介质

Similar Documents

Publication Publication Date Title
WO2019091026A1 (zh) 知识库文档快速检索方法、应用服务器及计算机可读存储介质
CN109885773A (zh) 一种文章个性化推荐方法、系统、介质及设备
EP3356951B1 (en) Managing a database of patterns used to identify subsequences in logs
CN111881011A (zh) 日志管理方法、平台、服务器及存储介质
CN111708942B (zh) 多媒体资源推送方法、装置、服务器及存储介质
CN112100149B (zh) 日志自动化分析系统
CN113407785B (zh) 一种基于分布式储存系统的数据处理方法和系统
CN110163688A (zh) 商品网络舆情检测系统
Wu et al. Extracting topics based on Word2Vec and improved Jaccard similarity coefficient
CN104361115A (zh) 一种基于共同点击的词条权重确定方法及装置
CN109885656B (zh) 基于量化热度的微博转发预测方法及装置
CN110955757A (zh) 光伏电站设备日志检索方法和系统
CN115293723A (zh) 基于大数据分析的网络舆论热度分析系统
CN110245357B (zh) 主实体识别方法和装置
CN111522950A (zh) 一种针对非结构化海量文本敏感数据的快速识别系统
CN111782970B (zh) 一种数据分析方法和装置
JP2003173352A (ja) 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体
CN108509449B (zh) 一种信息处理的方法及服务器
CN107357919A (zh) 行为日志查询系统及方法
CN114491232B (zh) 信息查询方法、装置、电子设备和存储介质
CN116225848A (zh) 日志监测方法、装置、设备和介质
CN114817458A (zh) 一种基于漏斗模型和余弦算法的中标项目检索方法
CN108763208B (zh) 话题信息获取方法、装置、服务器和计算机可读存储介质
US11726972B2 (en) Directed data indexing based on conceptual relevance
CN113722484A (zh) 基于深度学习的谣言检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200403

RJ01 Rejection of invention patent application after publication