CN112464139A - 一种基于单分类器的风、浪要素数据质量控制方法 - Google Patents
一种基于单分类器的风、浪要素数据质量控制方法 Download PDFInfo
- Publication number
- CN112464139A CN112464139A CN202011367107.1A CN202011367107A CN112464139A CN 112464139 A CN112464139 A CN 112464139A CN 202011367107 A CN202011367107 A CN 202011367107A CN 112464139 A CN112464139 A CN 112464139A
- Authority
- CN
- China
- Prior art keywords
- wind
- data
- wave
- quality control
- observation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003908 quality control method Methods 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 claims abstract description 18
- 230000002159 abnormal effect Effects 0.000 claims abstract description 14
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 14
- 230000009471 action Effects 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims abstract description 4
- 230000003993 interaction Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 4
- 230000001133 acceleration Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000013145 classification model Methods 0.000 claims description 3
- 230000005484 gravity Effects 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 239000004576 sand Substances 0.000 claims description 3
- 238000006467 substitution reaction Methods 0.000 claims description 3
- 238000012706 support-vector machine Methods 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims description 2
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D21/00—Measuring or testing not otherwise provided for
- G01D21/02—Measuring two or more variables by means not covered by a single other subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
- G06F17/13—Differential equations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- General Engineering & Computer Science (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及海洋观测数据技术领域,具体涉及一种基于单分类器的风、浪要素数据质量控制方法,包括风、浪要素传感器和浮标,所述浮标和风、浪要素传感器测得风、浪的观测数据,将其与风‑浪作用不变量理论曲线进行比对,通过两者之间的曲线偏离度判断数据的质量。本方法以风‑浪作用不变量理论为基本理论依据,通过单分类器算法由计算机模拟风‑浪作用关系并判断数据的质量,在已验数据的应用中可由数据用户指出异常数据即人工订正,并将人工订正后的数据通过本方法迭代训练获得新的质量控制模型,从而提升质量控制的准确性。
Description
技术领域
本发明涉及海洋观测数据技术领域,具体涉及一种基于单分类器的风、 浪要素数据质量控制方法。
背景技术
海洋观测仪器由于工作环境恶劣,其测得的数据中通常存在异常值,观 测数据质量控制并剔除其中的异常值,是数据应用中的基础环节,业务应用 对质量控制环节的要求为准确和高效,准确性要求是防止被异常数据污染的 资料误导用户或污染后续派生数据,高效性是要求为保证数据质控处理具有 较强的应用时效。
现有海洋观测数据质控方法采用数据质控常用的3σ法和格拉布斯等方 法作为判据,采用风、浪参数互斥法进行相关性检验,该方法主要从数据完 备性和仪器工作状态等角度,分别检验风、浪要素数据中是否存在异常值, 现有海洋观测数据质量控制方法是通用型数据质量控制方法,从实现原理方 面主要侧重于仪器异常属性等角度判别,风、浪要素相关性判据为互斥型判 据,该判据中未有效利用风-浪相互作用的不变性关系,编程实现和计算效率 方面现有方法具有编程复杂和计算效率低的问题,因此,设计出一种基于单分类器的风、浪要素数据质量控制方法,对于目前海洋观测数据技术领域来 说是迫切需要的。
发明内容
本发明提供一种基于单分类器的风、浪要素数据质量控制方法,以解决 现有技术存在的问题。
为了实现上述目的,本发明实施例提供如下技术方案:
根据本发明的实施例,一种基于单分类器的风、浪要素数据质量控制方 法,包括风、浪要素传感器和浮标,所述浮标和风、浪要素传感器测得风、 浪的观测数据,将其与风-浪作用不变量理论曲线进行比对,通过两者之间的 曲线偏离度判断数据的质量,其中,海面风和浪之间通过观测资料表明其存 在以下不变性关系:
海-气界面过程处于局地平衡态,具备良好的不变性,上述不 变性关系为正常风、浪的数据点分布位置,即观测的风、浪数据点应均匀紧 密的分布在该理论曲线附近,反之则违背了风-浪不变性关系,可以判定其为 异常值,由于我国实际风速观测中少有摩擦风速U*数据,而多为10米高风速 U10的数据,且h米高风速Uh与U*呈非线性正相关关系,可写为:
U*=f(h)·Uh (2)
其中h为风速观测高度,而式(2)中的正相关关系会因各测点地理因素 不同而不同,因此,式(1)中的α会随着风速观测高度和测点地理情况不同 而不同,令α=g(h),即有:
本方法将指定观测点历史风-浪数据对数化、无因次化,在训练阶段,以 单分类模型代替理论曲线,设在N维空间中的超球面,半径为R,球心为a, 该控件中的样本点为{xi,i=1,2,…,M},我们可以得到:
(xi-a)(xi-a)T≤R2 (4)
由于我们要使超球面的半径最小,因此由(4)式得到:
F(R,a)=R2 (5)
并使其半径最小;
引入拉格朗日算子,构建一个拉格朗日函数:
其中的拉格朗日算子αi≥0,对(6)式进行求偏导,并令其导数为0,可以 得到以下条件:
将(7)、(8)带入(6)中可以得到:
至此,我们可以通过二次规划算法得到最优的αi使(9)式最小,在此种情况 下,待验数据点较多时将会对空间区域描述的性能带来较大损失,因此,我 们引入松弛因子εi,将(4)式更改为:
(xi-a)(xi-a)T≤R2+εi
εi≥0 (10)
引入一个常数C作为惩罚系数,可以控制超球面发生误接受与误拒绝的 概率:
构建拉格朗日函数:
对其求偏导,并令导数为0,可得:
将(13)代回(12)中,可得:
通过二次规划算法得到最优的αi使上式最小,以满足半径最小的目的,从 而得到质量控制模型。
在质量控制时,将经过对数化、无因次化的待验数据(Z)以及质控模型 通过下式进行检测:
若待验数据满足上式时接受该数据,否则质疑该数据,从而生成已验数 据,之后可对已验数据进行人工纠错,并将最后获得的模型更新,利用更新 之后的模型对后续待验数据进行质量控制。
进一步地,所述不变性关系的理论基础上通过单分类器算法即可有效判 别风、浪要素观测数据中的异常值。
进一步地,所述摩擦风速U*数据在实际风速观测中较为少见,多用10米 高风速U10数据进行替代计算,且h米高风速Uh与U*呈如下非线性正相关关系:
U*=f(h)·Uh
其中h为风速观测高度,而U*=f(h)·Uh的正相关关系会因各测点地理因素 不同而不同,因此,权利要求1中的α会随着风速观测高度和测点地理情况不 同而不同,令α=g(h),即有:
通过基于一分类支持向量机算法学习指定观测点历史风-浪相互作用关 系,可以从统计学角度模拟指定测点的风-浪相互作用关系,从而建立质量控 制模型。
本发明具有如下优点:
该基于单分类器的风、浪要素数据质量控制方法以风-浪作用不变量理论 为依据,通过机器学习算法判断风、浪观测数据与风-浪作用不变量理论曲线 之间偏离度来判断数据的质量,由于气象资料浮标的风、浪要素分别由独立 工作的自动气象站和测波模块测得,其中任意一部设备工作状态异常或观测 结果异常均可由本方法检测出来,本发明的方法更符合风-浪相互作用物理规 律,编程实现更简单。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将 对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地, 下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付 出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的 内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限 定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大 小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落 在本发明所揭示的技术内容能涵盖的范围内。
图1为本发明的处理流程示意图;
图2为本发明的测试数据对数化无量纲有效周期与波高关系分布示意图;
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可 由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描 述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的 实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其 他实施例,都属于本发明保护的范围。
本说明书中所引用的如“上”、“下”、“左”、“右”、“中间”等的用语, 亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的 改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
本发明提供一种技术方案:
一种基于单分类器的风、浪要素数据质量控制方法,包括风、浪要素传 感器和浮标,所述浮标和风、浪要素传感器测得风、浪的观测数据,将其与 风-浪作用不变量理论曲线进行比对,通过两者之间的曲线偏离度判断数据的 质量,其中,海面风和浪之间通过观测资料表明其存在以下不变性关系:
海-气界面过程处于局地平衡态,具备良好的不变性,上述不 变性关系为正常风、浪的数据点分布位置,即观测的风、浪数据点应均匀紧 密的分布在该理论曲线附近,反之则违背了风-浪不变性关系,可以判定其为 异常值,由于我国实际风速观测中少有摩擦风速U*数据,而多为10米高风速 U10的数据,且h米高风速Uh与U*呈非线性正相关关系,可写为:
U*=f(h)·Uh (2)
其中h为风速观测高度,而式(2)中的正相关关系会因各测点地理因素 不同而不同,因此,式(1)中的α会随着风速观测高度和测点地理情况不同 而不同,令α=g(h),即有:
本方法将指定观测点历史风-浪数据对数化、无因次化,在训练阶段,以 单分类模型代替理论曲线,设在N维空间中的超球面,半径为R,球心为a, 该控件中的样本点为{xi,i=1,2,…,M},我们可以得到:
(xi-a)(xi-a)T≤R2 (4)
由于我们要使超球面的半径最小,因此由(4)式得到:
F(R,a)=R2 (5)
并使其半径最小;
引入拉格朗日算子,构建一个拉格朗日函数:
其中的拉格朗日算子αi≥0,对(6)式进行求偏导,并令其导数为0,可以 得到以下条件:
将(7)、(8)带入(6)中可以得到:
至此,我们可以通过二次规划算法得到最优的αi使(9)式最小,在此种情况 下,待验数据点较多时将会对空间区域描述的性能带来较大损失,因此,我 们引入松弛因子εi,将(4)式更改为:
(xi-a)(xi-a)T≤R2+εi
εi≥0 (10)
引入一个常数C作为惩罚系数,可以控制超球面发生误接受与误拒绝的 概率:
构建拉格朗日函数:
对其求偏导,并令导数为0,可得:
将(13)代回(12)中,可得:
通过二次规划算法得到最优的αi使上式最小,以满足半径最小的目的,从 而得到质量控制模型。
在质量控制时,将经过对数化、无因次化的待验数据(Z)以及质控模型 通过下式进行检测:
若待验数据满足上式时接受该数据,否则质疑该数据,从而生成已验数 据,之后可对已验数据进行人工纠错,并将最后获得的模型更新,利用更新 之后的模型对后续待验数据进行质量控制。
本发明中:所述不变性关系的理论基础上通过单分类器算法即可有效判 别风、浪要素观测数据中的异常值。
本发明中:所述摩擦风速U*数据在实际风速观测中较为少见,多用10米 高风速U10数据进行替代计算,且h米高风速Uh与U*呈如下非线性正相关关系:
U*=f(h)·Uh
其中h为风速观测高度,而U*=f(h)·Uh的正相关关系会因各测点地理因素 不同而不同,因此,权利要求1中的α会随着风速观测高度和测点地理情况不 同而不同,令α=g(h),即有:
通过基于一分类支持向量机算法学习指定观测点历史风-浪相互作用关 系,可以从统计学角度模拟指定测点的风-浪相互作用关系,从而建立质量控 制模型。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述, 但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言 是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进, 均属于本发明要求保护的范围。
Claims (3)
1.一种基于单分类器的风、浪要素数据质量控制方法,包括风、浪要素传感器和浮标,其特征在于:所述浮标和风、浪要素传感器测得风、浪的观测数据,将其与风-浪作用不变量理论曲线进行比对,通过两者之间的曲线偏离度判断数据的质量,其中,海面风和浪之间通过观测资料表明其存在以下不变性关系:
海-气界面过程处于局地平衡态,具备良好的不变性,上述不变性关系为正常风、浪的数据点分布位置,即观测的风、浪数据点应均匀紧密的分布在该理论曲线附近,反之则违背了风-浪不变性关系,可以判定其为异常值,由于我国实际风速观测中少有摩擦风速U*数据,而多为10米高风速U10的数据,且h米高风速Uh与U*呈非线性正相关关系,可写为:
U*=f(h)·Uh (2)
其中h为风速观测高度,而式(2)中的正相关关系会因各测点地理因素不同而不同,因此,式(1)中的α会随着风速观测高度和测点地理情况不同而不同,令α=g(h),即有:
本方法将指定观测点历史风-浪数据对数化、无因次化,在训练阶段,以单分类模型代替理论曲线,设在N维空间中的超球面,半径为R,球心为a,该控件中的样本点为{xi,i=1,2,…,M},我们可以得到:
(xi-a)(xi-a)T≤R2 (4)
由于我们要使超球面的半径最小,因此由(4)式得到:
F(R,a)=R2 (5)
并使其半径最小;
引入拉格朗日算子,构建一个拉格朗日函数:
其中的拉格朗日算子αi≥0,对(6)式进行求偏导,并令其导数为0,可以得到以下条件:
将(7)、(8)带入(6)中可以得到:
至此,我们可以通过二次规划算法得到最优的αi使(9)式最小,在此种情况下,待验数据点较多时将会对空间区域描述的性能带来较大损失,因此,我们引入松弛因子εi,将(4)式更改为:
(xi-a)(xi-a)T≤R2+εi
εi≥0 (10)
引入一个常数C作为惩罚系数,可以控制超球面发生误接受与误拒绝的概率:
构建拉格朗日函数:
对其求偏导,并令导数为0,可得:
0≤αi≤C (13)
将(13)代回(12)中,可得:
通过二次规划算法得到最优的αi使上式最小,以满足半径最小的目的,从而得到质量控制模型;
在质量控制时,将经过对数化、无因次化的待验数据(Z)以及质控模型通过下式进行检测:
若待验数据满足上式时接受该数据,否则质疑该数据,从而生成已验数据,之后可对已验数据进行人工纠错,并将最后获得的模型更新,利用更新之后的模型对后续待验数据进行质量控制。
2.根据权利要求1所述的一种基于单分类器的风、浪要素数据质量控制方法,其特征在于:所述不变性关系的理论基础上通过单分类器算法即可有效判别风、浪要素观测数据中的异常值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011367107.1A CN112464139A (zh) | 2020-11-27 | 2020-11-27 | 一种基于单分类器的风、浪要素数据质量控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011367107.1A CN112464139A (zh) | 2020-11-27 | 2020-11-27 | 一种基于单分类器的风、浪要素数据质量控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112464139A true CN112464139A (zh) | 2021-03-09 |
Family
ID=74809409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011367107.1A Pending CN112464139A (zh) | 2020-11-27 | 2020-11-27 | 一种基于单分类器的风、浪要素数据质量控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112464139A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102006614A (zh) * | 2010-11-19 | 2011-04-06 | 暨南大学 | 一种移动核心网异常数据线性判别方法 |
CN105787281A (zh) * | 2016-03-24 | 2016-07-20 | 国家海洋环境预报中心 | 一种海浪有效波高场的融合反演方法和装置 |
CN108363676A (zh) * | 2018-01-11 | 2018-08-03 | 中国科学院海洋研究所 | 一种高度计风浪和涌浪有效波高分离方法 |
CN111881978A (zh) * | 2020-07-24 | 2020-11-03 | 国家海洋技术中心 | 海洋定点浮标设备故障诊断方法、装置及电子设备 |
-
2020
- 2020-11-27 CN CN202011367107.1A patent/CN112464139A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102006614A (zh) * | 2010-11-19 | 2011-04-06 | 暨南大学 | 一种移动核心网异常数据线性判别方法 |
CN105787281A (zh) * | 2016-03-24 | 2016-07-20 | 国家海洋环境预报中心 | 一种海浪有效波高场的融合反演方法和装置 |
CN108363676A (zh) * | 2018-01-11 | 2018-08-03 | 中国科学院海洋研究所 | 一种高度计风浪和涌浪有效波高分离方法 |
CN111881978A (zh) * | 2020-07-24 | 2020-11-03 | 国家海洋技术中心 | 海洋定点浮标设备故障诊断方法、装置及电子设备 |
Non-Patent Citations (3)
Title |
---|
李飞 等: "初探支持向量机算法在海洋站观测数据 质量控制中的应用", 海洋预报, vol. 33, no. 2, 30 April 2016 (2016-04-30), pages 66 - 73 * |
管长龙 等: "风浪成长关系的分析及其对3/2指数律的支持", 青岛海洋大学学报, vol. 31, no. 5, 30 September 2001 (2001-09-30), pages 633 - 639 * |
赵栋梁;李明明;马昕;: "风浪对海-气界面动量通量估计的影响", 中国海洋大学学报(自然科学版), vol. 38, no. 6, 15 November 2008 (2008-11-15), pages 861 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111062282B (zh) | 基于改进yolov3模型的变电站指针式仪表识别方法 | |
CN107590498B (zh) | 一种基于字符分割级联二分类器的自适应汽车仪表检测方法 | |
CN110728411B (zh) | 一种基于卷积神经网络的高低空区域联合降雨预测方法 | |
CN108124487A (zh) | 云端抄表方法及装置 | |
CN108629452A (zh) | 一种基于多模式多参数集合预报的气象风险决策方法 | |
CN104239899B (zh) | 一种用于无人机巡检的输电线路间隔棒识别方法 | |
CN112801332B (zh) | 一种基于灰度共生矩阵的短期风速预测方法 | |
CN113610069A (zh) | 基于知识蒸馏的目标检测模型训练方法 | |
CN112801094A (zh) | 一种指针式仪表图像倾斜校正方法 | |
CN112651849A (zh) | 基于不平衡数据集的电压监测异常数据识别方法及系统 | |
CN111008641A (zh) | 一种基于卷积神经网络的输电线路杆塔外力破坏检测方法 | |
CN115293424A (zh) | 一种新能源最大发电能力计算方法、终端及存储介质 | |
CN116154972A (zh) | 一种分布式电网电能质量监测方法及系统 | |
CN110826498A (zh) | 基于hht的暂态电能质量检测方法 | |
CN108574290B (zh) | 受迫振荡的振荡源定位方法、装置、终端及可读存储介质 | |
CN112464139A (zh) | 一种基于单分类器的风、浪要素数据质量控制方法 | |
Lai et al. | A novel scale recognition method for pointer meters adapted to different types and shapes | |
CN102521874B (zh) | 一种基于图像重建三维数据的法线重采样方法 | |
CN116702005A (zh) | 一种基于神经网络的数据异常诊断方法和电子设备 | |
CN112528566A (zh) | 基于AdaBoost训练模型的空气质量数据实时校准方法及系统 | |
CN108073934A (zh) | 近重复图像检测方法与装置 | |
CN108983313B (zh) | 一种定量探测海面风场的方法 | |
CN111401624A (zh) | 一种风功率预测的方法、装置及计算机可读存储介质 | |
CN112699824A (zh) | 电能表仪表常数检测方法、设备及存储介质 | |
CN117798654B (zh) | 汽轮机轴系中心智能调整系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |