CN105653521A - 数据校验方法和装置 - Google Patents

数据校验方法和装置 Download PDF

Info

Publication number
CN105653521A
CN105653521A CN201610029388.7A CN201610029388A CN105653521A CN 105653521 A CN105653521 A CN 105653521A CN 201610029388 A CN201610029388 A CN 201610029388A CN 105653521 A CN105653521 A CN 105653521A
Authority
CN
China
Prior art keywords
data
input
user
service
prediction algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610029388.7A
Other languages
English (en)
Inventor
魏志尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dt Dream Technology Co Ltd
Original Assignee
Hangzhou Dt Dream Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dt Dream Technology Co Ltd filed Critical Hangzhou Dt Dream Technology Co Ltd
Priority to CN201610029388.7A priority Critical patent/CN105653521A/zh
Publication of CN105653521A publication Critical patent/CN105653521A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种数据校验方法和装置,其中,该数据校验方法,包括以下步骤:接收用户输入的数据,并获取用户输入的数据的业务类型;根据业务类型选择对应的预测算法,其中,预测算法是根据业务类型的历史输入数据训练得到的;根据预测算法预测业务类型对应的输入区间;判断用户输入的数据是否在输入区间之中;如果不在输入区间之中,则确定用户输入的数据异常。本发明的数据校验方法,能够加强不同应用场景下对用户输入的数据的合法性的检查,减少因为输入过程中误操作导致的一些错误,提高数据校验的精度,提高输入数据的可靠性,减少较少通过人工进行异常数据检查的工作量。

Description

数据校验方法和装置
技术领域
本发明涉及数据处理技术领域,特别涉及一种数据校验方法和装置。
背景技术
在一些数据处理系统中需要对用户输入的数据进行校验,以避免因用户输入错误的数据影响后续数据处理。例如,对于大数据应用来说,数据的采集是系统不可缺少的组成部分。例如,在大数据分析系统中,数据的采集位于系统的最前端,也是后续分析和展示的基础。因此,数据的有效性直接关系到后续的分析和处理。
然而,对于数据采集系统来说,如何确定用户的输入数据或者采集数据是否正确,十分困难。目前大多系统只是对采集数据做一个非常粗范的有效性检查,例如,对数据格式(如只能输入数字或者小数格式),或者对数据取值范围进行限定。但是,对于一些采集指标,比如:经济指标等,由于季节因素或者其他因素等,指标取值波动变化较大。如果对指标的取值范围定义过小,会引起误报,如果取值范围定义过大,又会因范围过大导致无法准确检测到用户输入的错误数据。
特别是在指标多、需要用户手动输入数据的情况,输入数据的准确性更加难以保证。因此,如何对用户输入的数据进行一个有效性的校验,是一个有待解决的难题。
发明内容
本发明旨在至少在一定程度上解决上述技术问题。
为此,本发明的第一个目的在于提出一种数据校验方法,能够提高数据校验的精度,提高输入数据的可靠性。
本发明的第二个目的在于提出一种数据校验装置。
为达上述目的,根据本发明第一方面实施例提出了一种数据校验方法,包括以下步骤:接收用户输入的数据,并获取所述用户输入的数据的业务类型;根据所述业务类型选择对应的预测算法,其中,所述预测算法是根据所述业务类型的历史输入数据训练得到的;根据所述预测算法预测所述业务类型对应的输入区间;判断所述用户输入的数据是否在所述输入区间之中;如果不在所述输入区间之中,则确定所述用户输入的数据异常。
本发明实施例的数据校验方法,在接收到用户输入的数据之后,可获取该数据的业务类型,并根据业务类型选择对应的预测算法预测输入区间,如果用户输入的数据不在该输入区间之中,则确定该数据异常,,由此,能够加强不同应用场景下对用户输入的数据的合法性的检查,减少因为输入过程中误操作导致的一些错误,提高数据校验的精度,提高输入数据的可靠性,减少较少通过人工进行异常数据检查的工作量。
本发明第二方面实施例提出了一种数据校验装置,包括:接收模块,用于接收用户输入的数据,并获取所述用户输入的数据的业务类型;选择模块,用于根据所述业务类型选择对应的预测算法,其中,所述预测算法是根据所述业务类型的历史输入数据训练得到的;预测模块,用于根据所述预测算法预测所述业务类型对应的输入区间;判断模块,用于判断所述用户输入的数据是否在所述输入区间之中;确定模块,用于当所述用户输入的数据不在所述输入区间之中时,确定所述用户输入的数据异常。
本发明实施例的数据校验装置,在接收到用户输入的数据之后,可获取该数据的业务类型,并根据业务类型选择对应的预测算法预测输入区间,如果用户输入的数据不在该输入区间之中,则确定该数据异常,,由此,能够加强不同应用场景下对用户输入的数据的合法性的检查,减少因为输入过程中误操作导致的一些错误,提高数据校验的精度,提高输入数据的可靠性,减少较少通过人工进行异常数据检查的工作量。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的数据校验方法的流程图;
图2为根据本发明一个实施例中训练预测算法的示意图;
图3为根据本发明一个具体实施例的数据校验方法的流程图;
图4为根据本发明另一个实施例的数据校验方法的流程图;
图5为根据本发明一个实施例的数据校验装置的结构示意图;
图6为根据本发明另一个实施例的数据校验装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“多个”指两个或两个以上;术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
下面参考附图描述根据本发明实施例的数据校验方法和装置。
图1为根据本发明一个实施例的数据校验方法的流程图。
如图1所示,根据本发明实施例的数据校验方法,包括:
S101,接收用户输入的数据,并获取用户输入的数据的业务类型。
数据录入系统可提供输入界面,输入界面中可包括与不同业务对应的输入框。当用户在输入框中输入数据时,可根据输入框对应的业务类型确定用户输入的数据的业务类型。
S102,根据业务类型选择对应的预测算法,其中,预测算法是根据业务类型的历史输入数据训练得到的。
具体地,可根据业务类型在预先建立的算法库中查找对应的预测算法。
其中,算法库中存储了预先分别针对各个业务类型训练的预测算法。因此,可根据用户输入的数据的业务类型从算法库中选择对应的预测算法。
在本发明的实施例中,还可包括训练上述预测算法的过程。图2为根据本发明一个实施例中训练预测算法的示意图。
具体地,首先可分别获取各个业务类型对应的历史输入数据。由于各个业务类型对应的历史输入数据具有不同的取值特征,因此,可根据各个业务类型对应的的数据特征选择相应的预测算法。对于一种业务类型,可根据该业务类型对应的历史输入数据分析出该业务类型的输入数据的数据特征,即输入数据的取值随时间的变换规律。例如,随时间变化不大、取值较稳定的特征,或者周期性变化特征,或者季节性变换特征等。
进而,可根据各个业务类型对应的数据特征,分别选择适合该数据特征的时间序列算法。举例来说,对于输入数据变化不大、取值区间较稳定的业务类型,可选择简单序时平均数法;而对于具有周期性变换或季节性变化特征的业务类型,则可选择季节趋势预测法。
然后,对于各个业务类型,可从各自的历史输入数据中选择一部分数据作为训练数据,并根据各个业务类型的训练数据分别进行训练,以得到各个业务类型对应的时间序列算法的算法参数。
最后,对于各个业务类型,从各自的历史输入数据中选择一部分数据作为验证数据,并根据各个业务类型的验证数据验证各自对应的时间序列算法的算法参数的可靠性。如果验证通过,则可将验证通过的算法作为相应业务类型的对应的预测算法,否者重新选择算法并进行训练和验证。
对于得到的预测算法可存储至预设算法库,以供后续数据输入时进行调用。
其中,上述时间序列算法可包括以下算法中的中的一种或多种:
1)简单序时平均数法,即将若干历史时期的统计数值作为观察值,然后求出观察值的算术平均数,并作为下期预测值。该算法可适用于变化不大的趋势预测。如果数据呈现某种上升或下降的趋势,则不宜采用此算。
2)加权序时平均数法,即把各个时期的历史数据按近期和远期影响程度进行加权,求出平均值,作为下期预测值。
3)简单移动平均法,即相继移动计算若干时期的算术平均数作为下期预测值,也就是说,对由移动期数的连续移动所形成的各组数据,使用算术平均法计算各组数据的移动平均值,并将其作为下一期预测值。
4)加权移动平均法,即将简单移动平均数进行加权计算。其中,在确定权数时,近期观察值的权数相对于远期观察值的权数较大。
5)指数平滑法,即根据历史资料的上期实际数和预测值,用指数加权的办法进行预测。此法实质是由内加权移动平均法演变而来的一种方法,优点是只要有上期实际数和上期预测值,就可计算下期的预测值,这样可以节省很多数据和处理数据的时间,减少数据的存储量,方法简便。是一种广泛使用的短期预测方法。
6)季节趋势预测法,即根据经济事物每年重复出现的周期性季节变动指数,预测其季节性变动趋势。
S103,根据预测算法预测所述业务类型对应的输入区间。
在本发明的一个实施例中,根据预测算法预测所述业务类型对应的输入区间可具体包括:采用预测算法对历史输入数据进行处理以业务类型对应的输入区间。具体地,可在历史输入数据中随机选择部分数据,并使用预测算法对选择的数据进行计算,得到输入区间。
S104,判断用户输入的数据是否在输入区间之中。
S105,如果不在输入区间之中,则确定用户输入的数据异常。
如果用户输入的不在输入区间中,则表明该数据与为输入异常的数据。例如,可能是由于用户误操作或者其他原因导致的输入错误。
S106,如果在输入区间之中,则接受用户输入的数据。
如果输入数据在输入区间中,则表明该数据符合历史输入规律,则接受该输入数据。
本发明实施例的数据校验方法,在接收到用户输入的数据之后,可获取该数据的业务类型,并根据业务类型选择对应的预测算法预测输入区间,如果用户输入的数据不在该输入区间之中,则确定该数据异常,,由此,能够加强不同应用场景下对用户输入的数据的合法性的检查,减少因为输入过程中误操作导致的一些错误,提高数据校验的精度,提高输入数据的可靠性,减少较少通过人工进行异常数据检查的工作量。
图3为根据本发明一个具体实施例的数据校验方法的流程图。
如图3所示,根据本发明实施例的数据校验方法,包括:
S1,接收待校验数据。
待校验数据即用户输入的数据。
S2,获取预测算法。
根据用户输入的数据的业务类型从算法库获取预测算法。
S3,计算预测值(输入区间)。
S4,将预测值与输入数据进行比较。
S5,根据比较结果判断输入数据是否正在输入区间中。
如果是,则执行S6,如果否,则执行S7。
S6,接受用户输入,校验通过。
S7,提醒用户进行确认。
当提醒用户输入数据异常时,用户可对输入数据进行判断,如果输入错误,可对输入数据进行修改,如果输入数据没有问题,则可对输入数据进行确认。
S8,判断用户是否确认输入数据正确。
如果是,则执行S6,否则执行S9。
S9,提示用户重新输入。
图4为根据本发明另一个实施例的数据校验方法的流程图。
如图4所示,该数据校验方法,在确定用户输入的数据异常之后,还可包括:
S107,对用户进行数据异常提醒。
在确定用户输入的数据异常之后,可提醒用户输入数据异常,以便由用户确认输入数据是否正确。
本发明实施例中对提醒方式不做限定,可以通过语音、提示窗口、弹出文字、特殊标记(如高亮标记)等方式进行数据异常提醒。
S108,接收用户的确认输入信息,并记录确认次数。
当提醒用户输入的数据异常时,用户可对输入的数据进行判断,如果输入错误,可对输入的数据进行修改,如果输入饿数据没有问题,则可确认输入。
在每次接收到用户的确认输入信息后,可进行记录,由此可记录用户对判断异常的数据的确认次数。
S109,当确认次数大于预设阈值时,对预测算法进行调整。
当记录的确认次数大于预设阈值时,表明根据当前选择的预测算法生成的输入区间并不准确,因此,需要对预测算法进行调整。具体地,可根据记录的用户确认输入的数据调整所述预测算法的参数。也就是说,对于每次用户将判断异常的数据确认输入时,可记录该数据,并作为相应业务类型的历史数据。当对该业务类型的预测算法进行调整时,可根据增加新数据的历史输入数据重新确定预测算法的算法参数。具体的,可通过图2所示过程中对算法的参数或者模型进行优化,以提高预测算法的可靠性,从而提高数据校验的精度和可靠性。
本发明实施例的数据校验方法,能够在对用户进行异常输入提醒,并在用户对异常的数据确认输入时,记录用户的确认输入次数,并在用户的确认输入次数超重预设阈值时,对预测算法进行调整,从而进一步提高数据校验的精度和可靠性。
为了实现上述实施例,本发明还提出一种数据校验装置。
图5为根据本发明一个实施例的数据校验装置的结构示意图。
如图5所示,根据本发明实施例的数据校验装置,包括:接收模块10、选择模块20、预测模块30、判断模块40和确定模块50。
具体地,接收模块10用于接收用户输入的数据,并获取用户输入的数据的业务类型。
数据录入系统可提供输入界面,输入界面中可包括与不同业务对应的输入框。当接收模块10接收到用户在输入框中输入数据时,可根据输入框对应的业务类型确定用户输入的数据的业务类型。
选择模块20用于根据业务类型选择对应的预测算法,其中,预算法是根据业务类型的历史输入数据训练得到的。
具体地,选择模块20可根据业务类型在预先建立的算法库中查找对应的预测算法。
其中,算法库中存储了预先分别针对各个业务类型训练的预测算法。因此,选择模块20可根据用户输入的数据的业务类型从算法库中选择对应的预测算法。
在本发明的实施例中,还可包括训练上述预测算法的过程。图2为根据本发明一个实施例中训练预测算法的示意图。
具体地,首先可分别获取各个业务类型对应的历史输入数据。由于各个业务类型对应的历史输入数据具有不同的取值特征,因此,可根据各个业务类型对应的的数据特征选择相应的预测算法。对于一种业务类型,可根据该业务类型对应的历史输入数据分析出该业务类型的输入数据的数据特征,即输入数据的取值随时间的变换规律。例如,随时间变化不大、取值较稳定的特征,或者周期性变化特征,或者季节性变换特征等。
进而,可根据各个业务类型对应的数据特征,分别选择适合该数据特征的时间序列算法。举例来说,对于输入数据变化不大、取值区间较稳定的业务类型,可选择简单序时平均数法;而对于具有周期性变换或季节性变化特征的业务类型,则可选择季节趋势预测法。
然后,对于各个业务类型,可从各自的历史输入数据中选择一部分数据作为训练数据,并根据各个业务类型的训练数据分别进行训练,以得到各个业务类型对应的时间序列算法的算法参数。
最后,对于各个业务类型,从各自的历史输入数据中选择一部分数据作为验证数据,并根据各个业务类型的验证数据验证各自对应的时间序列算法的算法参数的可靠性。如果验证通过,则可将验证通过的算法作为相应业务类型的对应的预测算法,否者重新选择算法并进行训练和验证。
对于得到的预测算法可存储至预设算法库,以供后续数据输入时进行调用。
其中,上述时间序列算法可包括以下算法中的中的一种或多种:
1)简单序时平均数法,即将若干历史时期的统计数值作为观察值,然后求出观察值的算术平均数,并作为下期预测值。该算法可适用于变化不大的趋势预测。如果数据呈现某种上升或下降的趋势,则不宜采用此算。
2)加权序时平均数法,即把各个时期的历史数据按近期和远期影响程度进行加权,求出平均值,作为下期预测值。
3)简单移动平均法,即相继移动计算若干时期的算术平均数作为下期预测值,也就是说,对由移动期数的连续移动所形成的各组数据,使用算术平均法计算各组数据的移动平均值,并将其作为下一期预测值。
4)加权移动平均法,即将简单移动平均数进行加权计算。其中,在确定权数时,近期观察值的权数相对于远期观察值的权数较大。
5)指数平滑法,即根据历史资料的上期实际数和预测值,用指数加权的办法进行预测。此法实质是由内加权移动平均法演变而来的一种方法,优点是只要有上期实际数和上期预测值,就可计算下期的预测值,这样可以节省很多数据和处理数据的时间,减少数据的存储量,方法简便。是一种广泛使用的短期预测方法。
6)季节趋势预测法,即根据经济事物每年重复出现的周期性季节变动指数,预测其季节性变动趋势。
预测模块30用于根据预测算法预测所述业务类型对应的输入区间。
在本发明的一个实施例中,预测模块30可具体用于:采用预测算法对历史输入数据进行处理以生成所述业务类型对应的输入区间。具体地,预测模块30可在历史输入数据中随机选择部分数据,并使用预测算法对选择的数据进行计算,得到输入区间。
判断模块40用于判断用户输入的数据是否在输入区间之中。
确定模块50用于当用户输入的数据不在输入区间之中时,确定用户输入的数据异常。
如果用户输入的不在输入区间中,则表明该数据与为输入异常的数据。例如,可能是由于用户误操作或者其他原因导致的输入错误。
本发明实施例的数据校验装置,在接收到用户输入的数据之后,可获取该数据的业务类型,并根据业务类型选择对应的预测算法预测输入区间,如果用户输入的数据不在该输入区间之中,则确定该数据异常,,由此,能够加强不同应用场景下对用户输入的数据的合法性的检查,减少因为输入过程中误操作导致的一些错误,提高数据校验的精度,提高输入数据的可靠性,减少较少通过人工进行异常数据检查的工作量。
图6为根据本发明一个实施例的数据校验装置的结构示意图。
如图6所示,根据本发明实施例的数据校验装置,包括:接收模块10、选择模块20、预测模块30、判断模块40、确定模块50、接受模块60、提醒模块70、记录模块80和调整模块90。
具体地,接收模块10、选择模块20、预测模块30、判断模块40和确定模块50与图5所示实施例中相同。
接受模块60用于当输入数据在输入区间之中时,接受用户输入的数据。
如果输入数据在输入区间中,则表明该数据符合历史输入规律,则可接受该输入数据。
提醒模块70用于在确定用户输入的数据异常之后,对用户进行数据异常提醒。
在确定用户输入的数据异常之后,提醒模块70可提醒用户输入数据异常,以便由用户确认输入数据是否正确。
本发明实施例中对提醒方式不做限定,提醒模块70可以通过语音、提示窗口、弹出文字、特殊标记(如高亮标记)等方式进行数据异常提醒。
记录模块80用于在对用户进行数据异常提醒之后,接收用户的确认输入信息,并记录确认次数。
当提醒模块70提醒用户输入的数据异常时,用户可对输入的数据进行判断,如果输入错误,可对输入的数据进行修改,如果输入饿数据没有问题,则可确认输入。
记录模块80在每次接收到用户的确认输入信息后,可进行记录,由此可记录用户对判断异常的数据的确认次数。
调整模块90用于当确认次数大于预设阈值时,对预测算法进行调整。
当记录的确认次数大于预设阈值时,表明根据当前选择的预测算法生成的输入区间并不准确,因此,需要对预测算法进行调整。具体地,调整模块90可用于根据记录的用户确认输入的数据调整所述预测算法的参数。也就是说,对于每次用户将判断异常的数据确认输入时,可记录该数据,并作为相应业务类型的历史数据。当对该业务类型的预测算法进行调整时,调整模块90可根据增加新数据的历史输入数据重新确定预测算法的算法参数。具体的,调整模块90可通过图2所示过程中对算法的参数或者模型进行优化,以提高预测算法的可靠性,从而提高数据校验的精度和可靠性。
本发明实施例的数据校验装置,能够在对用户进行异常输入提醒,并在用户对异常的数据确认输入时,记录用户的确认输入次数,并在用户的确认输入次数超重预设阈值时,对预测算法进行调整,从而进一步提高数据校验的精度和可靠性。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种数据校验方法,其特征在于,包括以下步骤:
接收用户输入的数据,并获取所述用户输入的数据的业务类型;
根据所述业务类型选择对应的预测算法,其中,所述预测算法是根据所述业务类型的历史输入数据训练得到的;
根据所述预测算法预测所述业务类型对应的输入区间;
判断所述用户输入的数据是否在所述输入区间之中;
如果不在所述输入区间之中,则确定所述用户输入的数据异常。
2.如权利要求1所述的数据校验方法,其特征在于,在确定所述用户输入的数据异常之后,还包括:
对所述用户进行数据异常提醒。
3.如权利要求2所述的数据校验方法,其特征在于,在对所述用户进行数据异常提醒之后,还包括:
接收所述用户的确认输入信息,并记录确认次数;
当所述确认次数大于预设阈值时,对所述预测算法进行调整。
4.如权利要求3所述的数据校验方法,其特征在于,所述对所述预测算法进行调整包括:
根据记录的用户确认输入的数据调整所述预测算法的参数。
5.如权利要求1所述的数据校验方法,其特征在于,所述根据所述预测算法预测所述业务类型对应的输入区间具体包括:
采用预测算法对所述历史输入数据进行处理以生成所述业务类型对应的输入区间。
6.一种数据校验装置,其特征在于,包括:
接收模块,用于接收用户输入的数据,并获取所述用户输入的数据的业务类型;
选择模块,用于根据所述业务类型选择对应的预测算法,其中,所述预测算法是根据所述业务类型的历史输入数据训练得到的;
预测模块,用于根据所述预测算法预测所述业务类型对应的输入区间;
判断模块,用于判断所述用户输入的数据是否在所述输入区间之中;
确定模块,用于当所述用户输入的数据不在所述输入区间之中时,确定所述用户输入的数据异常。
7.如权利要求6所述的数据校验装置,其特征在于,还包括:
提醒模块,用于在确定所述用户输入的数据异常之后,对所述用户进行数据异常提醒。
8.如权利要求7所述的数据校验装置,其特征在于,还包括:
记录模块,用于在对所述用户进行数据异常提醒之后,接收所述用户的确认输入信息,并记录确认次数;
调整模块,用于当所述确认次数大于预设阈值时,对所述预测算法进行调整。
9.如权利要求8所述的数据校验装置,其特征在于,所述调整模块具体用于:
根据记录的用户确认输入的数据调整所述预测算法的参数。
10.如权利要求6所述的数据校验装置,其特征在于,所述预测模块具体用于:
采用预测算法对所述历史输入数据进行处理以生成所述业务类型对应的输入区间。
CN201610029388.7A 2016-01-15 2016-01-15 数据校验方法和装置 Pending CN105653521A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610029388.7A CN105653521A (zh) 2016-01-15 2016-01-15 数据校验方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610029388.7A CN105653521A (zh) 2016-01-15 2016-01-15 数据校验方法和装置

Publications (1)

Publication Number Publication Date
CN105653521A true CN105653521A (zh) 2016-06-08

Family

ID=56487529

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610029388.7A Pending CN105653521A (zh) 2016-01-15 2016-01-15 数据校验方法和装置

Country Status (1)

Country Link
CN (1) CN105653521A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108228635A (zh) * 2016-12-19 2018-06-29 北京奇虎科技有限公司 财务数据的导入方法、装置及财务系统
WO2018233117A1 (zh) * 2017-06-21 2018-12-27 平安科技(深圳)有限公司 业务数据表修正危险度的评估方法、装置及存储介质
CN109308226A (zh) * 2018-08-22 2019-02-05 中国平安人寿保险股份有限公司 数据异常确定方法及装置、存储介质和电子设备
CN110245778A (zh) * 2019-05-07 2019-09-17 阿里巴巴集团控股有限公司 分摊数据检测方法以及装置
CN111311014A (zh) * 2020-02-27 2020-06-19 广州酷旅旅行社有限公司 业务数据处理方法、装置、计算机设备和存储介质
CN112910086A (zh) * 2021-01-18 2021-06-04 国网山东省电力公司青岛供电公司 一种智能变电站数据校验方法及系统
CN116187716A (zh) * 2023-04-23 2023-05-30 中关村科学城城市大脑股份有限公司 农业设备调度方法、装置、电子设备和计算机可读介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101727466A (zh) * 2008-10-31 2010-06-09 北大方正集团有限公司 一种业务对象数据的验证方法及其装置
CN103489033A (zh) * 2013-09-27 2014-01-01 南京理工大学 融合自组织映射与概率神经网络的增量式学习方法
CN104008158A (zh) * 2014-05-27 2014-08-27 青岛海信移动通信技术股份有限公司 数据校验方法、校验装置及移动终端
CN104359565A (zh) * 2014-10-17 2015-02-18 中国农业大学 一种冷链运输温度监测与预警的方法及系统
CN105204449A (zh) * 2014-06-13 2015-12-30 广东兴发铝业有限公司 铝型材挤压机实时能耗监测及能耗异常检测系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101727466A (zh) * 2008-10-31 2010-06-09 北大方正集团有限公司 一种业务对象数据的验证方法及其装置
CN103489033A (zh) * 2013-09-27 2014-01-01 南京理工大学 融合自组织映射与概率神经网络的增量式学习方法
CN104008158A (zh) * 2014-05-27 2014-08-27 青岛海信移动通信技术股份有限公司 数据校验方法、校验装置及移动终端
CN105204449A (zh) * 2014-06-13 2015-12-30 广东兴发铝业有限公司 铝型材挤压机实时能耗监测及能耗异常检测系统
CN104359565A (zh) * 2014-10-17 2015-02-18 中国农业大学 一种冷链运输温度监测与预警的方法及系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108228635A (zh) * 2016-12-19 2018-06-29 北京奇虎科技有限公司 财务数据的导入方法、装置及财务系统
WO2018233117A1 (zh) * 2017-06-21 2018-12-27 平安科技(深圳)有限公司 业务数据表修正危险度的评估方法、装置及存储介质
CN109308226A (zh) * 2018-08-22 2019-02-05 中国平安人寿保险股份有限公司 数据异常确定方法及装置、存储介质和电子设备
CN110245778A (zh) * 2019-05-07 2019-09-17 阿里巴巴集团控股有限公司 分摊数据检测方法以及装置
CN110245778B (zh) * 2019-05-07 2023-10-31 创新先进技术有限公司 分摊数据检测方法以及装置
CN111311014A (zh) * 2020-02-27 2020-06-19 广州酷旅旅行社有限公司 业务数据处理方法、装置、计算机设备和存储介质
CN111311014B (zh) * 2020-02-27 2024-04-12 广州酷旅旅行社有限公司 业务数据处理方法、装置、计算机设备和存储介质
CN112910086A (zh) * 2021-01-18 2021-06-04 国网山东省电力公司青岛供电公司 一种智能变电站数据校验方法及系统
CN112910086B (zh) * 2021-01-18 2024-05-31 国网山东省电力公司青岛供电公司 一种智能变电站数据校验方法及系统
CN116187716A (zh) * 2023-04-23 2023-05-30 中关村科学城城市大脑股份有限公司 农业设备调度方法、装置、电子设备和计算机可读介质

Similar Documents

Publication Publication Date Title
CN105653521A (zh) 数据校验方法和装置
CN111401609B (zh) 车流量时间序列的预测方法及预测装置
CN109274309B (zh) 马达控制方法、装置、电子设备及存储介质
CN108803576A (zh) 一种温控系统的故障预警方法及相关装置
CN111639798A (zh) 智能的预测模型选择方法及装置
CN106598822B (zh) 一种用于容量评估的异常数据检测方法及装置
CN107357764B (zh) 数据分析方法、电子设备及计算机存储介质
CN113672600A (zh) 一种异常检测方法及系统
CN111833594A (zh) 车流量预测方法、装置、电子设备及存储介质
CN104077192A (zh) 测试系统及方法
CN110399903B (zh) 异常数据的检测方法及装置、计算机可读存储介质
JP6274127B2 (ja) 不揮発性半導体記憶装置の評価システム、評価方法、及び評価プログラム
CN110188793B (zh) 数据异常分析方法及装置
CN114781128A (zh) 一种利用人工智能技术的芯片寿命预测系统及方法
CN110222905A (zh) 一种预测人流量的方法及装置
CN114066089A (zh) 批量作业运行耗时区间确定方法及装置
CN110580218A (zh) 软件代码复杂度的检测方法、装置及电子设备
CN117034076A (zh) 基于多维感知融合的干扰排除方法
CN114623799B (zh) 结构健康监测数据异常预警方法、系统、装置及存储介质
CN114004276A (zh) 时间特征的处理方法、处理装置
CN112949951A (zh) 数据预测方法、装置、电子设备及存储介质
CN116796030B (zh) 一种用于工作票中规范的动作流程播报及语音交互的系统
JP2022035829A (ja) 情報処理装置、情報処理方法、コンピュータプログラム及び情報処理システム
CN111179084A (zh) 一种预测期货市场交易指标的方法及装置
CN112149833A (zh) 基于机器学习的预测方法、装置、设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160608

RJ01 Rejection of invention patent application after publication