CN117453696B - 水表缺失数据的补全方法和装置 - Google Patents
水表缺失数据的补全方法和装置 Download PDFInfo
- Publication number
- CN117453696B CN117453696B CN202311669236.XA CN202311669236A CN117453696B CN 117453696 B CN117453696 B CN 117453696B CN 202311669236 A CN202311669236 A CN 202311669236A CN 117453696 B CN117453696 B CN 117453696B
- Authority
- CN
- China
- Prior art keywords
- data
- missing
- water meter
- filling
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 217
- 238000000034 method Methods 0.000 title claims abstract description 87
- 230000001502 supplementing effect Effects 0.000 title claims description 25
- 238000004590 computer program Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 description 31
- 230000005540 biological transmission Effects 0.000 description 22
- 230000006870 function Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 239000002699 waste material Substances 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A20/00—Water conservation; Efficient water supply; Efficient water use
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Arrangements For Transmission Of Measured Signals (AREA)
Abstract
本申请提供了一种水表缺失数据的补全方法和装置,根据水表传输的数据中缺失数据的不同位置,如果缺失数据为尾部数据,利用线性插补方法确定填补数据,如果缺失数据不是尾部数据,则利用非线性插补方法确定填补数据,再使用填补数据填补水表传输的数据中的缺失数据,得到完整的数据,提高了得到完整的水表传输数据的效率和准确性,减少了对历史数据的依赖。
Description
技术领域
本申请属于数据统计技术领域,尤其涉及水表缺失数据的补全方法和装置。
背景技术
水务公司能够对水表的传输数据进行分析,从而及时发现和处理水表、管道以及用户用水的问题。然而,水表在传输数据的过程中,会受到信号干扰、网络故障、水表电池低电压等诸多因素的干扰,造成水表的传输数据的缺失,使得水务公司获取到水表传输的数据是不完整的,而根据不完整的水表传输数据,水务公司无法及时发现和处理水表、管道以及用户用水的问题。
目前,通常是利用历史数据来预测未来一天的所有时间点的用水量得到完整的水表传输数据,但是,该方法对于历史数据的完整性仍然有要求,如果历史数据也不完整,就无法得到完整的水表传输数据,因此,需要一种可以有效得到完整的水表传输数据的方案,减少对历史数据的依赖。
发明内容
本申请实施例提供了一种水表缺失数据的补全方法和装置,可以有效的得到完整的水表传输数据,提高了得到完整的水表传输数据的效率和准确性,减少了对历史数据的依赖。
第一方面,提供了一种水表缺失数据的补全方法,包括:获取水表传输的数据,水表传输的数据包括水表多次采集的数据以及每次采集数据对应的采集时间;若水表传输的数据中存在缺失数据,确定缺失数据是否为水表传输的数据中的尾部数据;若缺失数据为尾部数据,利用线性插补方法,确定第一填补数据,若缺失数据不为尾部数据,利用非线性插补方法,确定第二填补数据,其中,第一填补数据或者第二填补数据为与缺失数据对应的预测数据;使用第一填补数据或者第二填补数据填补水表传输的数据中的缺失数据。
第一方面提供的水表缺失数据的补全方法,根据缺失数据在水表传输的数据中的不同位置,利用不同的插补方法,对缺失数据进行预测,得到填补数据,再使用填补数据填补水表传输的数据中的缺失数据,使得水表传输的数据中不存在缺失数据,成为完整的数据,可以有效的得到完整的水表传输数据,提高了得到完整的水表传输数据的效率和准确性,减少了对历史数据的依赖。
在第一方面一种可能的实现方式中,利用线性插补方法,确定第一填补数据,包括:根据水表传输的数据确定线性参考变化量;根据缺失数据的相邻的数据,以及线性参考变化量,确定第一填补数据。在该实现方式中,在缺失数据是尾部数据的情况下,利用水表传输的数据进行线性插补的方法,可以更快、更准确的进行数据预测。
在第一方面一种可能的实现方式中,线性参考变化量根据如下公式确定:
,
其中,K表示线性参考变化量,ΔD1表示水表传输的数据中包括的第一数据和第二数据之差,ΔT表示第一数据和第二数据分别对应的采集时间之差,水表传输的数据是周期性采集的,P表示数据采集的周期。在该实现方式中,可以更快、更准确的确定线性参考变化量,提高了确定线性参考变化量的准确率和效率。
在第一方面一种可能的实现方式中,第一填补数据根据如下公式确定:
,
其中,F1表示第一填补数据,A表示在采集时间上与缺失数据相邻的上一个数据。在该实现方式中,提高了确定第一填补数据的准确率和效率。
在第一方面一种可能的实现方式中,利用非线性插补方法,确定第二填补数据,包括:根据水表传输的数据中包括的第三数据和第四数据,以及与第三数据和第四数据分别对应的历史数据,确定插补参数,与第三数据对应的历史数据包括:与第三数据的采集时间对应的历史数据,与第四数据对应的历史数据包括:与第四数据的采集时间对应的历史数据;根据插补参数和历史间隔用水量,确定非线性参考变化量,历史间隔用水量用于指示:在历史数据中,两个相邻的采集时间对应的用水量的差值;根据在采集时间上与缺失数据相邻的数据,以及非线性参考变化量,确定第二填补数据。在该实现方式中,在缺失数据为非尾部数据的情况下,利用非线性插补方法,在确定第二填补数据时,利用了部分历史数据,和水表传输的数据,而不全部依赖历史数据,使得对缺失数据的预测更加精确。
在第一方面一种可能的实现方式中,插补参数根据如下公式确定:
,
其中,I表示插补参数,ΔD2表示第三数据和第四数据之差,ΔH表示:第三数据对应的历史数据和第四数据对应的历史数据之差;在该实现方式中,提高了确定插补参数的准确率和效率。
非线性参考变化量根据如下公式确定:
,
其中,N表示非线性参考变化量,ΔE表示历史间隔用水量;在该实现方式中,提高了确定非线性参考变化量的准确率和效率。
第二填补数据根据如下公式确定:
,
其中,F2表示第二填补数据,A表示在采集时间上与缺失数据相邻的上一个数据。在该实现方式中,提高了确定第二填补数据的准确率和效率。
该方式提供了确定插补参数、非线性参考变化量、第二填补数据的具体公式,利用了部分历史数据,和水表传输的数据,而不全部依赖历史数据,从而减少了对历史数据的依赖,同时也使得对缺失数据的预测更加精确。
在第一方面一种可能的实现方式中,在确定缺失数据是否为尾部数据之前,该方法还包括:
确定水表传输数据的数据量大于或者等于预设阈值。在该实现方式中,通过确定水表传输的数据的数据量大于或者等于预设阈值,表示水表传输的数据的数据量足够多,此时对水表传输的数据进行预测不会造成资源浪费,也能够使得缺失数据的预测更准确。
第二方面,提供了一种水表缺失数据的补全装置,包括:用于执行以上第一方面或者第一方面中的任意一方面可能的实现方式中的方法的各个步骤的单元。
第三方面,提供了一种服务器,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,执行以上第一方面或者第一方面中的任意一方面可能的实现方式中的方法。
第四方面,提供了一种计算机可读存储介质,包括:该计算机可读存储介质中存储有计算机程序,当该计算机程序被执行时,用于执行第一方面或者第一方面中的任意可能的实现方式中的方法。
第五方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序在被处理器执行时,用于执行第一方面或者第一方面中的任意可能的实现方式中的方法。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的一例适用于本申请实施例的场景的示意图;
图2是本申请一实施例提供的一例水表缺失数据的补全方法的示例性流程图;
图3是本申请一实施例提供的利用本申请实施例提供的方法进行缺失数据补全的结果曲线与现有技术中利用历史数据进行数据补全的结果曲线的对比示意图;
图4是本申请一实施例提供的一例水表缺失数据的补全装置的示例性框图;
图5是本申请一实施例提供的另一例水表缺失数据的补全装置的示例性框图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
水表传输的数据提供了关于用户用水行为的重要信息,是水务公司管理和监控水表,管道和用户用水的核心数据。水务公司能够对水表传输的数据进行分析,从而及时发现和处理水表、管道以及用户用水的问题。然而,水表在进行数据传输的过程中,会受到信号干扰、网络故障、水表电池低电压等诸多因素的干扰,造成水表传输数据的缺失,使得水务公司得到的水表传输数据不完整,而根据不完整的水表传输数据,水务公司无法及时发现和处理水表、管道以及用户用水的问题,对水务公司进行数据监控和分析造成了难以避免的困扰。
显然,得到完整的水表传输数据,对水务公司进行数据分析十分重要。
目前,针对如何得到完整的水表传输数据,通常是利用历史数据来预测未来一天的所有时间点的用水量得到完整的水表传输数据,但是,该方法对于历史数据的完整性有严格的要求,如果历史数据不完整或者完整程度不高,则无法利用上述的方法得到完整的水表传输数据,因此,需要一种可以有效得到完整的水表传输数据的方案,减少对历史数据的依赖。
有鉴于此,本申请提供了一种水表缺失数据的补全方法,根据缺失数据在水表传输的数据中的不同位置,利用不同的插补方法,对缺失数据进行预测,得到填补数据,再使用填补数据填补水表传输的数据中的缺失数据,得到完整的数据,可以有效的得到完整的水表传输数据,提高了得到完整的水表传输数据的效率和准确性,减少了对历史数据的依赖。
下面将具体说明本申请提供的水表缺失数据的补全方法。
首先说明本申请提供的方法可以应用的场景。
图1所示为一例适用于本申请实施例的场景示意图,如图1所示,本申请实施例可以应用于水务系统中,水务系统包括:若干个水表(如图1所示的水表1、水表2、水表3以及水表N等)和服务器。若干个水表和服务器之间能够进行数据交互,从而对若干个水表实现集中管理。
其中,每个水表用于测量或者采集用水数据,并将测量得到的用水数据上传或者发送至服务器中。示例性的,每个水表可以是周期性采集数据并将采集到的数据送给服务器。当然,在本申请的其它实现方式中,水表也可以是非周期性采集数据。本申请实施例中对于水表采集数据的方式不作限制。
服务器接收到多个水表传输的数据后,可以对得到的数据进行处理。例如,服务器可以利用本申请提供的方法对数据中的缺失数据进行补全,得到完整的数据。
应理解的是,图1所示意的场景并不对适用于本申请实施例的场景造成任何限制。在本申请另一些实施例中,适用于本申请实例的场景可以包括比图1所示的更多或更少的水表或者服务器等,或者,图1中的服务器也可以替换为终端设备,例如用户使用的手机等,本申请实施例在此不作限制。
示例性的,本申请提供的方法还可以应用在其他存在数据缺失的场景中,例如,还可以应用于电力系统实现电力数据的补全,从而解决电力系统中数据缺失的问题。
下文中将以水务系统的场景为例说明本申请提供的方法。
图2所示为一例本申请提供的水表缺失数据的补全方法的示意性流程图。图2中的方法可以应用在图1所示的水务系统中。但这不应该对本申请实施例的场景造成限制。例如,下文中描述的水表还可以替换为“电表”、“气表”等其它数据采集装置。
如图2所示,该方法包括S201至S207。
S201,水表采集数据。
示例性的,水表(指的是任何一个水表)可以周期性的采集数据,也可以非周期性的采集数据。
在本申请实施例中,水表在采集数据的时候,每次采集到的数据对应一个采集时间。换句话说,水表采集的数据可以包括:采集时间和该采集时间对应的数据。示例性的,采集时间对应的数据可以包括:净累计、正向累计、反向累计、瞬时流量等参数。在一次采集的数据中,不同的参数对应数据中的不同字段。
S202,水表将采集的数据发送给服务器。
例如,水表可以通过无线或者有线的方式将采集到的数据发送给服务器。
可选的,作为一种可能的实现方式,由于通常是通过在水表中安装电池为水表提供电能,考虑到水务系统的运营成本,一般情况下,水表不会采集一次数据就将这一次采集的数据传输给服务器,而是采集多次数据后,再将多次采集到的数据一起或者统一传输给服务器。
例如:预设的水表采集数据的周期为5分钟,预设的水表数据传输的周期为6小时,则以每5分钟采集一次数据,并对采集到的数据标注对应的采集时间,将水表在6小时内采集到的数据及数据对应的采集时间进行打包发送给服务器,使得服务器获取水表传输的数据。
当然,采集数据的周期和水表数据传输的周期的时长仅仅为一种示例,还可以为其他时长,可以根据需要进行修改,本申请对此不作限定。
S203,服务器确定水表传输的数据是否存在缺失。
可选的,作为一种可能的实现方式,水表传输的数据中包括每次采集数据对应的采集时间,如果在某个采集时间没有对应的数据,则确定数据存在缺失数据。本申请正是要对缺失的数据进行预测和补全。
在一种可能的实现方式中,可以利用顺序搜索或者逆序搜索的方法,确定水表传输的数据中是否存在缺失数据。其中,顺序搜索是指第一个采集时间对应的数据开始,按照采集时间从早到晚的顺序依次搜索每一个采集时间对应的数据,直到搜索到某一采集时间没有对应的数据,确定数据存在缺失数据。逆序搜索是指从最后一个采集时间对应的数据开始,按照采集时间从后向前(从晚到早)的顺序依次搜索每一个采集时间对应的数据,直到搜索到某一采集时间没有对应的数据,确定数据存在缺失数据。具体的,以顺序搜索或者逆序搜索,依次搜索每一个采集时间是否存在对应的采集数据,直至某一采集时间未搜索到对应的采集数据,记录该采集时间点,确定该采集时间对应的数据为缺失数据。
当然,在本申请的其它实现方式中,还可以通过其它方式确定水表传输的数据是否存在缺失,本申请实施例在此不作限制。
可以理解的是,只有在数据中存在缺失数据的情况下,才需要对水表传输的数据进行数据补全,若数据中不存在缺失数据,则不需要对水表传输的数据进行补全。
S204,若数据中存在缺失数据,服务器确定该缺失数据是否为数据中的尾部数据。
其中,尾部数据指该数据之后不存在其他数据,或者说,该数据的采集时间是最晚的。
在一种可能的实现方式中,利用逆序搜索的方法,若第一个搜索的采集时间(即最后一个采集时间)对应的数据确定为缺失数据,则将该缺失数据确定为尾部数据。利用顺序搜索的方法,若最后一个搜索的采集时间(即最后一个采集时间)对应的数据确定为缺失数据,则将该缺失数据确定为尾部数据。
可以理解的是,该缺失数据不为尾部数据时,该缺失数据可以是头部数据或中部数据。
在一种可能的实现方式中,若某一采集时间(例如采集时间T)到最后一个采集时间之间,均无对应的采集数据,则采集时间T到最后一个采集时间之间的采集时间对应的数据均为缺失数据。且该缺失数据为尾部数据。
如果某一采集时间(例如采集时间T)上没有对应的数据,晚于采集时间T的下一个相邻的采集时间(例如采集时间T+1)有对应的数据,则采集时间T上的缺失数据不是尾部数据,该缺失数据可以是头部数据或中部数据。
假设预设的采集周期是5分钟,第5分钟、第10分钟、第15分钟、第20分钟、第25分钟、第30分钟、第35分钟、第40分钟、第45分钟、第50分钟、第55分钟、第60分钟分别采集一次数据。若第20分钟不存在对应的数据,则第20分钟对应的数据为缺失数据,且该缺失数据为非尾部数据;若第20、25、30分钟均不存在对应的数据,则第20、25、30分钟对应的数据为缺失数据,且该缺失数据为非尾部数据;若第60分钟不存在对应的数据,则第60分钟对应的数据为缺失数据,且该缺失数据为尾部数据,若第45、50、55、60分钟均不存在对应的数据,则第45、50、55、60分钟对应的数据为缺失数据,且该缺失数据为尾部数据。
S205,若该缺失数据为尾部数据,服务器利用线性插补方法,确定第一填补数据。
其中,该第一填补数据为与缺失数据对应的预测数据。
可选的,第一填补数据可以根据线性参考变化量和,与缺失数据相邻的数据确定。
在一种可能的实现方式中,可以根据水表传输的数据,确定线性参考变化量。
例如,线性参考变化量K根据如下公式(1)确定:
(1)
在公式(1)中,K表示线性参考变化量,ΔD1表示数据中第一数据和第二数据之差,ΔT表示第一数据和第二数据分别对应的采集时间之差,第一数据和第二数据是水表上传的数据中的任意两个采集时间对应的数据。可以理解,第一数据和第二数据均为非缺失的数据。
可选的,第一数据和第二数据可以是采集时间上相邻的两个数据,或者也可以是采集时间上不相邻的两个数据。
与缺失数据相邻的数据可以包括:在采集时间上与缺失数据相邻的数据。由于该缺失数据为尾部数据,则与缺失数据相邻的数据为在采集时间上,与缺失数据相邻的上一个数据,即在采集上早于缺失数据对应在采集时间,并且与缺失数据对应在采集时间相邻的采集时间对应的数据。例如:采集时间T上没有对应的数据,与缺失数据相邻的数据是采集时间T-1对应的数据。
在一种可能的实现方式中,针对缺失数据为不连续的尾部数据,第一填补数据F根据如下公式(2)确定:
(2)
在公式(2)中,F表示第一填补数据,A表示在采集时间上与缺失数据相邻的上一个数据。
例如,若第60分钟对应的数据为缺失数据,则第60分钟对应的填补数据等于第55分钟对应的采集数据与线性参考变化量之和。
在一种可能的实现方式中,针对缺失数据为连续的尾部数据,第一填补数据中包括多个填补数据,可以根据与缺失数据相邻的数据以及线性参考变化量,确定第一填补数据中每一个填补数据。例如,若第45、50、55、60分钟对应的数据为缺失数据,与该缺失数据相邻的上一个数据为第40分钟对应的采集数据,可以先根据第40分钟对应的采集数据和线性参考变化量,确定第45分钟对应的填补数据,再根据第45分钟对应的采集数据和线性参考变化量,确定第50分钟对应的填补数据,以此类推,依次计算出第55、60分钟对应的填补数据,从而确定第45、50、55、60分钟中每个采集时间对应的缺失数据。
在一种可能的实现方式中,针对缺失数据为连续的尾部数据,第一填补数据中包括多个填补数据,可以根据与缺失数据相邻的数据、与缺失数据相邻的数据和缺失数据之间的采集间隔,以及线性参考变化量,确定第一填补数据中每一个填补数据。其中,与缺失数据相邻的数据和缺失数据之间的采集间隔由与缺失数据相邻的数据和缺失数据分别对应的采集时间以及数据的采集周期确定。
例如,针对缺失数据为连续的尾部数据,第一填补数据可以根据以下公式(3)确定:
(3)
在公式(3)中,Fn表示第一填补数据,A表示在采集时间上与缺失数据相邻的上一个数据,K表示线性参考变化量,m表示与缺失数据相邻的数据和缺失数据之间的采集间隔,,ΔTn表示与缺失数据相邻的数据和缺失数据分别对应的采集时间之差,P表示数据的采集周期,需要说明的是,n与m对应,例如,当n为第一填补数据中的第一个填补数据,m表示第一个填补数据与缺失数据之间的采集间隔,当n为第一填补数据中的第二个填补数据,m表示第二个填补数据与缺失数据之间的采集间隔。
例如,若第45、50、55、60分钟对应的数据为缺失数据,与缺失数据相邻的上一个数据是第40分钟对应的数据,那么,第45分钟对应的缺失数据与第40分钟对应的数据之间的采集间隔为1,则第45分钟对应的填补数据等于第40分钟对应的数据与1倍的线性参考变化量之和;第50分钟对应的缺失数据与第40分钟对应的数据之间的采集间隔为2,第50分钟对应的填补数据等于第40分钟对应的数据与2倍的线性参考变化量之和;第55分钟对应的缺失数据与第40分钟对应的数据之间的采集间隔为3,第55分钟对应的填补数据等于第40分钟对应的数据与3倍的线性参考变化量之和,第60分钟对应的缺失数据与第40分钟对应的数据之间的采集间隔为4,第60分钟对应的填补数据等于第40分钟对应的数据与4倍的线性参考变化量之和。
S206,若该缺失数据不为尾部数据,利用非线性插补方法,确定第二填补数据。
其中,该第二填补数据为缺失数据对应的预测数据。
可选的,第二填补数据可以根据非线性参考变化量和与缺失数据相邻的数据确定。
在一种可能的实现方式中,非线性参考变化量可以根据插补参数和历史间隔用水量确定。
在一种可能的实现方式中,可以根据水表传输的数据中包括的第三数据和第四数据,以及与第三数据和第四数据分别对应的历史数据,确定插补参数。
其中,与第三数据对应的历史数据包括:与第三数据的采集时间对应的历史数据,与第四数据对应的历史数据包括:与第四数据的采集时间对应的历史数据。
可以理解,第三数据和第四数据均为非缺失的数据。
其中,第三数据和第四数据可以是不连续的数据,也可以是连续数据。在第三数据和第四数据为不连续的数据的情况下,第三数据和第四数据可以分别是采集时间上缺失数据之前的任意一个数据和采集时间之后的任意一个数据,可以采集时间上在缺失数据之前任意两个不相邻的数据,还可以是采集时间上在缺失数据之后任意两个不相邻的数据。优选的,可以是在采集时间上与缺失数据相邻的上一个采集数据和在采集时间上与缺失数据相邻的下一个采集数据。在第三数据和第四数据是连续数据的情况下,第三数据和第四数据可以是采集时间上在缺失数据之前两个连续的数据,还可以是采集时间上在缺失数据之后两个连续的数据。
例如,缺失数据是采集时间T对应的数据,第三数据可以是T-1、T-2、T-3等对应的数据中的任意一个数据,第四数据可以分别是T+1、T+2、T+3等对应的数据中的任意一个数据。第三数据和第四数据可以分别是T-1、T-2、T-3等对应的数据中的任意两个(例如:第三数据和第四数据分别是T-1、T-2对应的数据,或者T-2、T-n对应的数据)。第三数据和第四数据可以分别是T+1、T+2、T+3等对应的数据中的任意两个(例如:第三数据和第四数据分别是T+1、T+2对应的数据或者T+3、T+n对应的数据)。
在一种可能的实现方式中,与第三数据和第四数据分别对应的历史数据可以是在前一天(昨日)中与第三数据和第四数据的采集时间分别对应的采集数据,例如,第三数据和第四数据的采集时间是T+1、T+2,则与第三数据和第四数据分别对应的历史数据是前一天中T+1、T+2分别对应的采集数据;可以是在上个月中相同日期中与第三数据和第四数据的采集时间分别对应的数据,例如,第三数据和第四数据的采集时间是2月3日中T+1、T+2,则与第三数据和第四数据分别对应的历史数据是1月3日中T+1、T+2分别对应的采集数据;还可以是预设天数中与第三数据和第四数据的采集时间分别对应的数据,例如,预设天数是7天,与第三数据和第四数据分别对应的历史数据是7天之前对应的一天(即上一周相同星期几,比如第三数据和第四数据是对应的采集时间是在星期三,那么与第三数据和第四数据分别对应的历史数据的采集时间也是在周三)中T+1、T+2分别对应的采集数据,可以理解的是,预设天数也可以是其他数值,例如,预设天数还可以是3、10等,本申请在此不作限定。
在一种可能的方式中,插补参数I满足如下公式(4):
(4)
在公式(4)中,I表示插补参数,ΔD2表示第三数据和第四数据之差,ΔH表示:第三数据对应的历史数据和第四数据对应的历史数据之差。
还需要说明的是,第三数据和第四数据与第一数据和第二数据可以相同,也可以不同。
历史间隔用水量用于指示:在历史数据中,两个相邻采集时间对应的用水量的差值。
在一种可能的实现方式中,在历史数据为净累计量的情况下,两个相邻的净累计量相减,得到历史间隔用水量。
在一种可能的实现方式中,非线性参考变化量N可以根据如下公式(5)确定:
(5)
在公式(5)中,N表示非线性参考变化量;ΔE表示历史间隔用水量。
在另一种可能的实现方式中,若历史数据为不连续的数据,则根据历史数据之差、与历史数据对应的采集时间的间隔数,确定历史数据的间隔用水量。具体的,历史数据的间隔用水量。
其中,在采集时间上与缺失数据相邻的数据,可以是在采集时间上与缺失数据相邻的上一个数据,也可以是在采集时间上与缺失数据相邻的下一个数据。
采集时间,与缺失数据相邻的数据和第三第四数据的关系。
可选的,第二填补数据F2可以根据如下公式(6)确定:
(6)
在公式(6)中,F2表示第二填补数据,A表示在采集时间上与缺失数据相邻的上一个数据。
在另一种可能的实施方式中,第二填补数据F2根据如下公式(7)确定:
(7)
在公式(7)中,B表示在采集时间上与缺失数据相邻的下一个数据。
S207,使用第一填补数据或者第二填补数据填补缺失数据。
在一种可能的实现方式中,将第一填补数据或者第二填补数据填补至水表传输的数据中缺失数据对应的采集时间对应的数据处。可以理解的是,第一填补数据或者第二填补数据对应的采集时间与缺失数据对应的采集时间的相同。
本申请提供了一种水表缺失数据的补全方法,根据缺失数据在水表传输的数据中的不同位置,若缺失数据为尾部数据,利用线性插补方法确定第一填补数据。若缺失数据不是尾部数据,利用非线性插补方法确定第二填补数据。再使用第一填补数据和/或第二填补数据填补水表传输的数据中的缺失数据,得到完整的数据,可以有效的得到完整的水表传输数据,提高了得到完整的水表传输数据的效率和准确性,减少了对历史数据的依赖。
可选的,在一种可能的使用场景中,若传输数据的水表为处于调试阶段的水表,该水表在预设上传周期内,仅采集了部分数据,并不会采集到整个预设上传周期的全部数据,这些处于调试阶段的水表在调试后,就会被放回仓库中,受到税务系统的静态管理,而不是直接安装在水表管道中被用户正常使用,受到水务系统的动态管理,但是由于该水表的处理模块和通讯模块均能够正常工作,水务系统能够接收这些处于调试阶段的水表传输的部分数据,并判断调试阶段的水表传输的数据中存在缺失数据,然而,若是对这些处于调试阶段的水表进行数据补全,则会造成资源的浪费,或者,由于传输的数据量较少,会造成数据预测的不准确。
为了避免资源的浪费,可以通过判断水表传输的数据(即S203中的数据)的数据量(数量或者个数)是否大于或者等于预设阈值,在水表传输数据的数据量大于或者等于预设阈值的情况下,再确定水表传输的数据中是否存在缺失数据,即再执行S203。
在一种可能的实现方式中,在确定执行S203之前,若水表传输的数据的数据量小于预设阈值,则该水表可能为调试阶段的水表,不对该水表传输的数据进行预测。
优选的,预设阈值可以为水务系统应收数据量的95%对应的值。应当理解的是,预设阈值还可以是水务系统应收数据量的其他百分比对应的值。例如,预设阈值还可以是水务系统应收数据量的92%或者98%等百分比对应的值,本申请对此不作限定。
在一种可能的实现方式中,为了更准确的确定水表是否正常运行,可以对比预设传输周期更长的预设时间内传输的数据进行判断,确定是否对水表传输的数据进行预测。例如,预设时间段可以是包括预设的水表传输的数据内的一天时间(24小时)。在预设时间段内,水表实际上传的数据大于或者等于预设阈值,表示水表能够正常运行,对水表上传的数据进行首日标识操作,对标记有首日标识的数据进行缺失数据的判断。其中,水务系统应收数据量可以根据预设时间段及预设的采集周期确定,通常,在每个预设采集周期采集1条数据,若每5分钟采集一次数据,每小时能够采集12条数据,则一天(24小时)内水务系统应接收数据量为12*24=288条。
在一种可能的实现方式中,水务系统中包括计数器,可以对水表传输的数据进行计数,从而确定水表传输数据的数据量。
可选的,在另一种可能的水表使用场景中,当用户长时间不在家,关闭水管阀门,不用水的情况下,水表仍然可以传输数据,例如,上传多个相同的数据,此时,不需要对该水表进行数据预测,即不需要考虑该水表上传的数据是否完整,无需为该水表补全数据。
在一种可能的实现方式中,在预设时间段的不同时间点对应的数据都相同的情况下,放弃对该水表对应的数据进行数据补全。在预设时间段的不同时间点对应的数据都相同时,可以表示该水表已停用,则无需再对该水表进行数据补全。
可选的,在使用第一填补数据或第二填补数据对缺失数据进行填补之前,还可以对第一填补数据或第二填补数据进行校验,以确定第一填补数据或第二填补数据的可靠性。
在一种可能的实现方式,根据与缺失数据对应的采集时间对应的历史数据进行统计比较,对第一填补数据或第二填补数据进行校验。或者,作为另一种可能的实现方式,根据每周同日的历史数据进行统计比较,对第一填补数据或第二填补数据进行校验。
下面以第一填补数据为例,对这两种方式分别进行说明。
在本申请实施例中,作为一种可能的实现方式,将第一填补数据和在采集时间与缺失数据对应的历史数据进行统计比较,得到第一统计参数;根据第一统计参数与第一预设阈值的比较,确定该第一填补数据是否校验成功。
其中,第一统计参数包括一下至少之一:第一填补差值、第一填补方差。第一填补差值为第一填补数据和在采集时间与缺失数据对应的历史数据之间的差值。第一填补方差为第一填补数据和在采集时间上与缺失数据对应的历史数据之差的平方值。
在第一填补差值大于第一预设阈值的情况下,表明第一填补数据与实际数据的误差较大,第一填补数据计算失败,则再次计算第一填补数据。在第一填补差值小于或者等于第一预设阈值的情况下,表明第一填补数据与实际数据的误差较小,第一填补数据校验成功,则该第一填补数据可以用于填补水表传输的数据。
在第一填补方差大于第二预设阈值的情况下,表明第一填补数据与实际数据的误差较大,第一填补数据校验失败,则再次计算第一填补数据。在第一填补方差小于或者等于第二预设阈值的情况下,表明第一填补数据与实际数据的误差较小,第一填补数据校验成功,则该第一填补数据可以用于填补水表传输的数据。
在本申请实施例中,作为另一种可能的实现方式,根据每周同日的历史数据进行统计比较,得到第二统计参数;根据第二统计参数与第二预设阈值的比较,确定该第一填补数据是否校验成功。第二统计参数包括一下至少之一:第二填补差值、第二填补方差。
其中,第二填补差值为第一填补数据和与每周同日的历史数据的平均值之间的差值。第一填补方差为第一填补数据与每周同日的历史数据的平均值之间平方值。每周同日的历史数据可以是要第一填补数据的日期与历史传输数据选择的日期是同一天,对于这个日期不做具体限定,例如,第一填补数据是星期一的,历史传输数据可以是每周星期一的数据。
在第二填补差值大于第二预设阈值的情况下,表明第一填补数据与实际数据的误差较大,第一填补数据校验失败,则再次计算第一填补数据。在第二填补差值小于或者等于第二预设阈值的情况下,表明第一填补数据与实际数据的误差较小,第一填补数据校验成功,则该第一填补数据可以用于填补水表传输的数据。
在第二填补方差大于第二预设阈值的情况下,表明第一填补数据与实际数据的误差较大,第一填补数据校验失败,则再次计算第一填补数据。在第二填补方差小于或者等于第二预设阈值的情况下,表明第一填补数据与实际数据的误差较小,第一填补数据校验成功,则该第一填补数据可以用于填补水表传输的数据。
示例性的,图3示出了利用本申请实施例提供的方法进行缺失数据补全的结果曲线与现有技术中利用历史数据进行数据补全的结果曲线的对比示意图。利用本申请实施例提供的方法确定数据拟合度R-squared为0.93,利用本申请实施例提供的方法进行缺失数据补全的结果相比于现有技术中利用历史数据进行数据补全的结果的数据更可信。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例所述的水表缺失数据的补全方法,图4示出了本申请实施例提供的水表缺失数据的补全装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
示例性的,参照图4,该水表缺失数据的补全装置300包括:通信单元310、处理单元320;通信单元310和处理单元320通过通信接口进行连接或者通信。
通信单元310用于:获取水表传输的数据,数据包括:水表多次采集的数据以及每次采集数据对应的采集时间;
处理单元320用于:确定数据中存在缺失数据,以及缺失数据是否为数据中的尾部数据;
处理单元320还用于:若缺失数据为尾部数据,利用线性插补方法,确定第一填补数据;
处理单元320还用于:若缺失数据不为尾部数据,利用非线性插补方法,确定第二填补数据,其中,第一填补数据或者第二填补数据为与缺失数据对应的预测数据;
处理单元320还用于:使用第一填补数据或者第二填补数据填补缺失数据。
本申请实施例提供的装置,根据缺失数据在水表传输的数据中的不同位置,利用不同的插补方法,对缺失数据进行预测,得到填补数据,再使用填补数据填补水表传输的数据中的缺失数据,得到完整的数据,可以有效的得到完整的水表传输数据,提高了得到完整的水表传输数据的效率和准确性,减少了对历史数据的依赖。
可选的,在一种可能的实现方式中,处理单元320还用于:根据数据确定线性参考变化量;根据与缺失数据相邻的数据,以及线性参考变化量,确定第一填补数据。
可选的,线性参考变化量满足如下公式:
,
其中,K表示线性参考变化量;ΔD1表示数据中包括的第一数据和第二数据之差,ΔT表示第一数据和第二数据分别对应的采集时间之差,数据是周期性采集的,P表示数据采集的周期。
可选的,在一种可能的实现方式中,处理单元320还用于根据如下公式确定第一填补数据:
其中,F1表示第一填补数据,A表示在采集时间上与缺失数据相邻的上一个数据。
可选的,在一种可能的实现方式中,处理单元320还用于:根据数据中包括的第三数据和第四数据,以及与第三数据和第四数据分别对应的历史数据,确定插补参数,与第三数据对应的历史数据包括:与第三数据的采集时间对应的历史数据,与第四数据对应的历史数据包括:与第四数据的采集时间对应的历史数据;根据插补参数,和历史间隔用水量,确定非线性参考变化量,历史间隔用水量用于指示:在历史数据中,两个相邻的采集时间对应的用水量的差值;根据在采集时间上与缺失数据相邻的数据,以及非线性参考变化量,确定第二填补数据。
可选的,在一种可能的实现方式中,处理单元320还用于:根据如下公式确定插补参数:
,
其中,I表示插补参数,ΔD2表示第三数据和第四数据之差,ΔH表示两个非缺失的数据对应的历史数据之差。
可选的,在一种可能的实现方式中,处理单元320还用于:根据如下公式确定非线性参考变化量:
,
其中,N表示非线性参考变化量,ΔE表示历史间隔用水量。
可选的,在一种可能的实现方式中,处理单元320还用于:根据如下公式确定第二填补数据:
,
其中,F2表示第二填补数据,A表示在采集时间上与缺失数据相邻的上一个数据。
可选的,在一种可能的实现方式中,处理单元320还用于:确定数据的数据量大于或者等于预设阈值。
应理解,水表缺失数据的补全装置300中各模块执行上述相应步骤的具体过程请参照前文中结合图2中方法的相关实施例的相关的描述。为了简洁,这里不加赘述。
可选的,通信单元310可以是收发器、输入/输出接口或接口电路。处理单元320可由处理器实现。
图5所示的为本申请实施例提供的另一例水表缺失数据的补全装置的示意性结构如。如图5所示的,该水表缺失数据的补全装置400包括:处理器410、存储器420以及存储在所述存储器420中并可在所述处理器410上运行的计算机程序430,处理器410执行所述计算机程序430时实现上述本申请实施例提供的水表缺失数据的补全方法的步骤。例如图2所示的S201至S207。或者,处理器410执行所述计算机程序430时实现上述装置300中各模块的功能。
示例性的,计算机程序430可以被分割成一个或多个单元,一个或者多个单元被存储在存储器420中,并由处理器410执行。一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序430在水表缺失数据的补全装置400中的执行过程。例如,计算机程序430可以被分割成:获取单元、确定单元以及填补单元等。其中,获取单元、确定单元以及填补单元各自的功能可以参考上述对于装置300中各个单元功能的描述,为了简洁,这里不再赘述。
本申请实施例还提供了一种服务器,该服务器可以包括上述的装置300或者上述的装置400。或者说,上述的装置300或者上述的装置400可以为服务器。该服务器用于执行上述各个方法实施例中的步骤。
还应理解,以上装置中单元的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且装置中的单元可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分单元以软件通过处理元件调用的形式实现,部分单元以硬件的形式实现。例如,各个单元可以为单独设立的处理元件,也可以集成在装置的某一个芯片中实现,此外,也可以以程序的形式存储于存储器中,由装置的某一个处理元件调用并执行该单元的功能。这里该处理元件又可以称为处理器,可以是一种具有信号处理能力的集成电路。在该实现过程中,上述方法的各步骤或以上各个单元可以通过处理器元件中的硬件的集成逻辑电路实现或者以软件通过处理元件调用的形式实现。
在一个例子中,以上任一装置中的单元可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个专用集成电路(application specific integratedcircuit,ASIC),或,一个或多个数字信号处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(field programmable gate array,FPGA),或这些集成电路形式中至少两种的组合。再如,当装置中的单元可以通过处理元件调度程序的形式实现时,该处理元件可以是通用处理器,例如中央处理器(central processing unit,CPU)或其它可以调用程序的处理器。再如,这些单元可以集成在一起,以片上系统(system-on-a-chip,SOC)的形式实现。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在服务器上运行时,使得服务器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例还提供了一种芯片,该芯片包括:处理单元和通信单元,该处理单元,例如可以是处理器,该通信单元例如可以是输入/输出接口、管脚或电路等。该处理单元可执行计算机指令,以使该水表缺失数据的补全装置内的芯片执行上述本申请实施例提供的任一种水表缺失数据的补全方法。
可选的,上述本申请实施例中提供的任意一种水表缺失数据的补全装置可以包括该芯片。
可选的,该计算机指令被存储在存储单元中。
可选的,该存储单元为该芯片内的存储单元,如寄存器、缓存等,该存储单元还可以是该终端内的位于该芯片外部的存储单元,如ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM等。其中,上述任一处提到的处理器,可以是一个CPU,微处理器,ASIC,或一个或多个用于控制上述的主系统信息传输的方法的程序执行的集成电路。该处理单元和该存储单元可以解耦,分别设置在不同的物理设备上,通过有线或者无线的方式连接来实现该处理单元和该存储单元的各自的功能,以支持该系统芯片实现上述实施例中的各种功能。或者,该处理单元和该存储器也可以耦合在同一个设备上。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (8)
1.一种水表缺失数据的补全方法,其特征在于,包括:
获取水表传输的数据,所述数据包括:所述水表多次采集的数据以及每次采集数据对应的采集时间;
若所述数据中存在缺失数据,确定所述缺失数据是否为所述数据中的尾部数据;
若所述缺失数据为尾部数据,利用线性插补方法,确定第一填补数据,若所述缺失数据不为尾部数据,利用非线性插补方法,确定第二填补数据,所述第一填补数据或者所述第二填补数据为与所述缺失数据对应的预测数据;
使用所述第一填补数据或者所述第二填补数据填补所述数据中的缺失数据;
所述利用非线性插补方法,确定第二填补数据,包括:
根据所述数据中包括的第三数据和第四数据,以及与所述第三数据和所述第四数据分别对应的历史数据,确定插补参数,与所述第三数据对应的历史数据包括:与所述第三数据的采集时间对应的历史数据,与所述第四数据对应的历史数据包括:与所述第四数据的采集时间对应的历史数据;
根据所述插补参数和历史间隔用水量,确定非线性参考变化量,所述历史间隔用水量用于指示:在所述历史数据中,两个相邻采集时间对应的用水量的差值;
根据在采集时间上与所述缺失数据相邻的数据,以及所述非线性参考变化量,确定所述第二填补数据;
所述插补参数根据如下公式确定:
,
其中,I表示所述插补参数,ΔD2表示所述第三数据和所述第四数据之差,ΔH表示:所述第三数据对应的历史数据和所述第四数据对应的历史数据之差;
所述非线性参考变化量根据如下公式确定:
,
其中,N表示所述非线性参考变化量,ΔE表示所述历史间隔用水量;
所述第二填补数据根据如下公式确定:
,
其中,F2表示所述第二填补数据,A表示在采集时间上与所述缺失数据相邻的上一个数据。
2.如权利要求1所述的方法,其特征在于,所述利用线性插补方法,确定第一填补数据,包括:
根据所述数据确定线性参考变化量;
根据与所述缺失数据相邻的数据,以及所述线性参考变化量,确定所述第一填补数据。
3.如权利要求2所述的方法,其特征在于,所述线性参考变化量根据如下公式确定:
,
其中,K表示所述线性参考变化量,ΔD1表示所述数据中包括的第一数据和第二数据之差,ΔT表示所述第一数据和所述第二数据分别对应的采集时间之差,所述数据是周期性采集的,P表示所述数据采集的周期。
4.如权利要求3所述的方法,其特征在于,所述第一填补数据根据如下公式确定:
其中,F1表示所述第一填补数据,A表示在采集时间上与所述缺失数据相邻的上一个数据。
5.如权利要求1至4中任一所述的方法,其特征在于,在所述确定所述缺失数据是否为所述数据中的尾部数据之前,所述方法还包括:
确定所述数据的数据量大于或者等于预设阈值。
6.一种水表缺失数据的补全装置,其特征在于,包括:用于执行如权利要求1至5中任一项所述方法的各个步骤的单元。
7.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的方法。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311669236.XA CN117453696B (zh) | 2023-12-07 | 2023-12-07 | 水表缺失数据的补全方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311669236.XA CN117453696B (zh) | 2023-12-07 | 2023-12-07 | 水表缺失数据的补全方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117453696A CN117453696A (zh) | 2024-01-26 |
CN117453696B true CN117453696B (zh) | 2024-04-12 |
Family
ID=89583888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311669236.XA Active CN117453696B (zh) | 2023-12-07 | 2023-12-07 | 水表缺失数据的补全方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117453696B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109445972A (zh) * | 2018-09-21 | 2019-03-08 | 深圳供电局有限公司 | 数据修复方法、装置、设备和存储介质 |
WO2019075599A1 (zh) * | 2017-10-16 | 2019-04-25 | 深圳乐信软件技术有限公司 | 数据填补方法和装置 |
CN111667123A (zh) * | 2020-06-17 | 2020-09-15 | 上海积成能源科技有限公司 | 一种电力负荷预测中应用多重插补补充缺失值的方法 |
CN113672871A (zh) * | 2021-08-23 | 2021-11-19 | 广东电网有限责任公司 | 一种高比例缺失数据填补方法及相关装置 |
CN115809237A (zh) * | 2023-02-07 | 2023-03-17 | 河北建投水务投资有限公司 | 用户水表缺失数据补齐方法及系统 |
-
2023
- 2023-12-07 CN CN202311669236.XA patent/CN117453696B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019075599A1 (zh) * | 2017-10-16 | 2019-04-25 | 深圳乐信软件技术有限公司 | 数据填补方法和装置 |
CN109445972A (zh) * | 2018-09-21 | 2019-03-08 | 深圳供电局有限公司 | 数据修复方法、装置、设备和存储介质 |
CN111667123A (zh) * | 2020-06-17 | 2020-09-15 | 上海积成能源科技有限公司 | 一种电力负荷预测中应用多重插补补充缺失值的方法 |
CN113672871A (zh) * | 2021-08-23 | 2021-11-19 | 广东电网有限责任公司 | 一种高比例缺失数据填补方法及相关装置 |
CN115809237A (zh) * | 2023-02-07 | 2023-03-17 | 河北建投水务投资有限公司 | 用户水表缺失数据补齐方法及系统 |
Non-Patent Citations (2)
Title |
---|
电网历史数据缺失及补录研究;谢翘楚;姚毅;;四川理工学院学报(自然科学版);20170420(02);47-52 * |
顺序敏感的多源感知数据填补技术;马茜;谷峪;李芳芳;于戈;;软件学报;20160915(09);152-167 * |
Also Published As
Publication number | Publication date |
---|---|
CN117453696A (zh) | 2024-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11636379B2 (en) | Distributed cluster training method and apparatus | |
CN104811344A (zh) | 网络动态业务监控方法及装置 | |
CN104137078A (zh) | 操作管理设备、操作管理方法和程序 | |
CN106598822B (zh) | 一种用于容量评估的异常数据检测方法及装置 | |
CN110209560A (zh) | 数据异常检测方法及检测装置 | |
CN110769452A (zh) | 基站经纬度异常识别方法、系统、服务器和存储介质 | |
CN116345700B (zh) | 一种用于储能电站的能耗监测方法及监测系统 | |
CN108072858B (zh) | 电能表质量管理方法、系统及终端设备 | |
CN116187552A (zh) | 异常检测方法、计算设备及计算机存储介质 | |
CN111309502A (zh) | 固态硬盘寿命预测方法 | |
US9019122B2 (en) | Information retrieval for boundary reading processing | |
CN111192123A (zh) | 一种基于混合云计算平台的对账系统及其对账方法 | |
CN117453696B (zh) | 水表缺失数据的补全方法和装置 | |
CN112526905B (zh) | 一种针对指标异常的处理方法及系统 | |
US12007751B2 (en) | Methods for smart gas data management, internet of things systems, and storage media | |
CN114154122B (zh) | 测流数据质量评估方法、装置及应用 | |
Kumar et al. | Battery health estimation for iot devices using v-edge dynamics | |
US9635441B2 (en) | Information retrieval for service point channels | |
CN115222278A (zh) | 一种机器人智慧巡检的方法和系统 | |
CN117529732A (zh) | 用于发现目标设备存在的经训练的模型 | |
CN113590608A (zh) | 一种基于数据流处理的用户用电信息即采即校方法 | |
CN114691443A (zh) | 一种截面数据发送方法、装置、电子设备及存储介质 | |
CN111328038A (zh) | 一种nb网络下数据传输方法及装置 | |
CN110659824A (zh) | 电量平衡测算方法和装置 | |
ElKalamawy et al. | Effect of mobile device profiling in mobile computation offloading |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |