CN113407593A - 数据抽检方法、装置、电子设备和可读存储介质 - Google Patents

数据抽检方法、装置、电子设备和可读存储介质 Download PDF

Info

Publication number
CN113407593A
CN113407593A CN202110663012.2A CN202110663012A CN113407593A CN 113407593 A CN113407593 A CN 113407593A CN 202110663012 A CN202110663012 A CN 202110663012A CN 113407593 A CN113407593 A CN 113407593A
Authority
CN
China
Prior art keywords
data
user
result
random
spot check
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110663012.2A
Other languages
English (en)
Inventor
罗研朝
武卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tianxing Huitong Information Technology Co ltd
Original Assignee
Beijing Tianxing Huitong Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tianxing Huitong Information Technology Co ltd filed Critical Beijing Tianxing Huitong Information Technology Co ltd
Priority to CN202110663012.2A priority Critical patent/CN113407593A/zh
Publication of CN113407593A publication Critical patent/CN113407593A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/58Random or pseudo-random number generators
    • G06F7/588Random number generators, i.e. based on natural stochastic processes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Storage Device Security (AREA)

Abstract

本发明提供了数据抽检的方法、装置、电子设备和可读存储介质,涉及数据处理技术领域。本发明提供的一种数据抽检的方法,该方法包括:获取数据,对所述数据进行处理得到随机种子,其中,所述随机种子由密码散列函数值获得;将所述随机种子进行处理,生成序列信息;在所述序列信息中进行抽取,得到数据抽检结果。本发明能够使用所述数据的密码散列函数值作为随机种子,避免了双方因人为因素的影响出现不利于准确评价数据质量的问题。

Description

数据抽检方法、装置、电子设备和可读存储介质
技术领域
本发明涉及数据处理技术领域,特别是涉及数据抽检方法、装置、电子设备和可读存储介质。
背景技术
随着数据验收技术的发展,例如在对小语种人工翻译结果进行验收时,第一用户和第二用户双方分别可以对小语种人工翻译结果通过多次的随机抽取,选取对各自最有利的一次抽取结果进行验收,会出现不能准确评价数据的质量的问题。
为了避免在对小语种人工翻译结果进行验收时出现不能准确评价数据质量的问题,现有技术将随机种子输入计算机编程语言中,运行代码得到随机序列,在随机序列中进行抽取得到抽取结果,对抽取结果进行验收。如果不设置随机种子的值,系统根据时间选择随机种子的值,那么每次生成的随机序列因时间差异而不同。
然而,在实际应用过程中,现有技术中的随机种子不固定,运行代码生成的随机序列也不固定,会导致第一用户和第二用户分别在随机序列中抽取到的结果也不一样,会出现交付通过率低的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据抽检方法、装置、电子设备和可读存储介质。
依据本发明的第一方面,提供了一种数据抽检的方法,该方法包括:
获取数据,对所述数据进行处理得到随机种子,其中,所述随机种子由密码散列函数值获得;
将所述随机种子进行处理,生成序列信息;
在所述序列信息中进行抽取,得到数据抽检结果。
可选地,对所述数据进行处理得到随机种子包括:
对所述数据利用密码散列函数进行运算,得到密码散列函数值。
可选地,将所述随机种子进行处理,生成序列信息包括:
将所述随机种子输入到计算机编程语言,运行所述计算机编程语言得到随机序列,所述随机序列由所述序列信息获得。
可选地,所述得到数据抽检结果包括:
第一用户对所述数据抽检结果进行验收,得到验收结果,所述验收结果通过,所述第一用户将所述验收结果反馈给第二用户,第二用户再进行验收,验收可以一次性通过。
可选地,所述得到数据抽检结果还包括:
所述验收结果不通过,所述第一用户将所述验收结果反馈给所述第二用户。
可选地,所述得到数据抽检结果包括:
若所述第一用户和所述第二用户基于可信合作状态下,所述第一用户先对所述数据抽检结果进行验收,得到验收结果,所述第一用户将所述验收结果反馈给所述第二用户。
可选地,所述得到数据抽检结果还包括:
若所述第一用户和所述第二用户没有基于可信合作状态下,所述第一用户和所述第二用户每次交付时,各提供一个额外全新数据,并附在交接单上,其中,所述额外全新数据包括交付人姓名、时间、签字图像但不限于这些;其中,所述交接单是所述第二用户确认收到所述第一用户对所述数据抽检结果进行验收的数据的证明。
依据本发明的第二方面,提供了一种数据抽检的装置,该装置包括:
接收模块,用于获取所述数据,对所述数据进行处理得到随机种子,其中,所述随机种子由密码散列函数值获得;
生成模块,用于将所述随机种子进行处理,生成序列信息;
抽取模块,用于在所述序列信息中进行抽取,得到数据抽检结果。
依据本发明的第三方面,提供了一种数据抽检的电子设备,该电子设备包括:
处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现如第一方面所述的方法的步骤。
依据本发明的第四方面,提供了一种数据抽检的可读存储介质,该可读存储介质包括:
所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法的步骤。
本发明实施例提供的数据抽检的方法、装置、电子设备和可读存储介质,通过在双方进行验收前,所述第一用户和所述第二用户先确认所述待抽验数据,由所述第一用户对数据抽检得到的所述数据抽检结果进行验收,得到验收结果,所述第一用户将所述验收结果反馈给所述第二用户,所述第二用户再进行验收,这样不仅可以减少双方的交互成本,还能提高验收效率。利用所述密码散列函数对所述待抽验数据进行计算密码散列函数值,所述随机种子由所述密码散列函数值获得,将所述随机种子进行处理,生成序列信息,在所述序列信息中进行抽取,得到数据抽检结果;这样固定了所述随机种子,所述随机序列是固定的,所述数据抽检结果也是固定的有利于对数据质量进行准确的评价,提高交付的通过率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例提供的一种数据抽检方法的步骤流程图;
图2是本发明实施例提供的一种数据抽检装置的框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的数据抽检方法、装置、电子设备及可读存储介质进行详细的说明。
本发明的第一实施方式涉及一种数据抽检方法,其流程图如图1所示,包括:
步骤101,获取数据,对所述数据进行处理得到随机种子,其中,所述随机种子由密码散列函数值获得;
需要说明的是,在本申请实施例中,乙方向甲方提供数据,甲方要对乙方提供的数据进行抽验,双方在进行抽验之前,需要先确认好要对哪些数据进行抽验,利用密码散列函数对待抽验的数据进行运算得到密码散列函数值,将密码散列函数值作为随机种子,利用计算机编程语言实现生成随机序列。
在本发明实施例中,数据可以是文本数据、音频数据、图像数据,包括但不限于这些。
在本发明实施例中,密码散列函数可以是MD5等具体的密码散列函数,本申请对此不做限定。
其中,密码散列函数的运算模型是:h=H(M)。其中,M是待处理的数据;H是单向散列函数,h是生成的密码散列函数值。其中H具有以下的单项性质:给定H和M,很容易计算h;给定h和H,很难计算M;给定H,要找两个不同的M,使得计算的h相同,在计算上是不可行的。
步骤102,将所述随机种子进行处理,生成序列信息;
需要说明的是,本申请实施例中,将所述随机种子输入到计算机编程语言中,运行所述计算机编程语言,将得到随机序列,这样固定了随机种子,那么生成的随机序列也是固定的。
其中,在实际的使用过程中,实现将随机种子生成随机序列的计算机编程语言有很多都可以支持,上述示例只是举例说明,本申请对此不做限定。
步骤103,在所述序列信息中进行抽取,得到数据抽检结果;
需要说明的是,本申请实施例中,假设要再10000条中抽取10条进行验收,则要生成长度为10000的随机序列,再从中选取前10大的数字,这样,每条数据被抽到的概率才是均等的。在此只是通过某种方式抽选出N个数据,抽选的方式可以是任意方式,上述示例只是举例说明,本申请对此不做限定。
本申请实施例中,某次小语种人工翻译,由于参与翻译人员过多、水平参差不齐,培训管理沟通成本高,在甲方要对乙方小语种的翻译结果进行数据抽验之前,双方需要先确认好要对哪些小语种翻译结果进行验收,之后由乙方进行数据的抽检,对得到的数据抽检结果进行验收,得到验收结果,验收结果是通过的,则甲方验收可以一次性通过。
其中,验收结果是不通过的,乙方将验收结果反馈给甲方。
本申请实施例中,以上操作基于甲乙双方互为可信的合作状态。
其中,甲乙双方没有基于互为可信的合作状态时,例如乙方对数据抽检结果进行验收,得到验收结果是不通过的,乙方对验收未通过的数据进行修改并重新提交,那么乙方再次重复数据抽检的步骤得到的将会是全新的数据抽检结果。
本发明实施例通过在双方进行验收前,所述第一用户和所述第二用户先确认所述待抽验数据,由所述第一用户对数据抽检得到的所述数据抽检结果进行验收,得到验收结果,所述第一用户将所述验收结果反馈给所述第二用户,所述第二用户再进行验收,这样不仅可以减少双方的交互成本,还能提高验收效率。利用所述密码散列函数对所述待抽验数据进行计算密码散列函数值,所述随机种子由所述密码散列函数值获得,将所述随机种子进行处理,生成序列信息,在所述序列信息中进行抽取,得到数据抽检结果;这样固定了所述随机种子,所述随机序列是固定的,所述数据抽检结果也是固定的有利于对数据质量进行准确的评价,提高交付的通过率。
本发明的第二实施方式涉及一种数据抽检装置,其流程图如图2所示,包括:
接收模块201,用于获取数据,对所述数据进行处理得到随机种子,其中,所述随机种子由密码散列函数值获得;
生成模块202,用于将所述随机种子进行处理,生成序列信息;
抽取模块203,用于在所述序列信息中进行抽取,得到数据抽检结果。
本发明实施例通过在双方进行验收前,确认所述待抽验数据,这样不仅可以减少双方的交互成本,还能提高验收效率。利用所述密码散列函数对所述待抽验数据进行计算密码散列函数值,所述随机种子由所述密码散列函数值获得,这样固定了所述随机种子,所述随机序列是固定的,所述数据抽检结果也是固定的有利于对数据质量进行准确的评价,提高交付的通过率。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种数据抽检的方法,其特征在于,所述方法包括:
获取数据,对所述数据进行处理得到随机种子,其中,所述随机种子由密码散列函数值获得;
将所述随机种子进行处理,生成序列信息;
在所述序列信息中进行抽取,得到数据抽检结果。
2.根据权利要求1所述的方法,其特征在于,对所述数据进行处理得到随机种子包括:
对所述数据利用密码散列函数进行运算,得到密码散列函数值。
3.根据权利要求1所述的方法,其特征在于,将所述随机种子进行处理,生成序列信息包括:
将所述随机种子输入到计算机编程语言,运行所述计算机编程语言得到随机序列,所述随机序列由所述序列信息获得。
4.根据权利要求1所述的方法,其特征在于,所述得到数据抽检结果,包括:
第一用户对所述数据抽检结果进行验收,得到验收结果,所述验收结果通过,所述第一用户将所述验收结果反馈给第二用户,第二用户再进行验收,验收可以一次性通过。
5.根据权利要求4所述的方法,其特征在于,所述所述得到数据抽检结果,还包括:
所述验收结果不通过,所述第一用户将所述验收结果反馈给所述第二用户。
6.根据权利要求1所述的方法,其特征在于,所述所述得到数据抽检结果,包括:
若所述第一用户和所述第二用户基于可信合作状态下,所述第一用户先对所述数据抽检结果进行验收,得到验收结果,所述第一用户将所述验收结果反馈给所述第二用户。
7.根据权利要求6所述的方法,其特征在于,所述所述得到数据抽检结果,还包括:
若所述第一用户和所述第二用户没有基于可信合作状态下,所述第一用户和所述第二用户每次交付时,各提供一个额外全新数据,并附在交接单上,其中,所述额外全新数据包括交付人姓名、时间、签字图像但不限于这些;其中,所述交接单是所述第二用户确认收到所述第一用户对所述数据抽检结果进行验收的数据的证明。
8.一种数据抽检的装置,其特征在于,所述装置包括:
接收模块,用于获取数据,对所述数据进行处理得到随机种子,其中,所述随机种子由密码散列函数值获得;
生成模块,用于将所述随机种子进行处理,生成序列信息;
抽取模块,用于在所述序列信息中进行抽取,得到数据抽检结果。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的抽检方法的步骤。
CN202110663012.2A 2021-06-15 2021-06-15 数据抽检方法、装置、电子设备和可读存储介质 Pending CN113407593A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110663012.2A CN113407593A (zh) 2021-06-15 2021-06-15 数据抽检方法、装置、电子设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110663012.2A CN113407593A (zh) 2021-06-15 2021-06-15 数据抽检方法、装置、电子设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN113407593A true CN113407593A (zh) 2021-09-17

Family

ID=77684123

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110663012.2A Pending CN113407593A (zh) 2021-06-15 2021-06-15 数据抽检方法、装置、电子设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN113407593A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114812653A (zh) * 2022-04-27 2022-07-29 浙江光特科技有限公司 一种自动测试线性度的测试方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105162760A (zh) * 2015-07-28 2015-12-16 郝孟一 随机抽取方法、装置以及系统
CN112527244A (zh) * 2020-12-18 2021-03-19 上海万向区块链股份公司 基于可验证延迟函数的分布式抽签系统和方法
CN112712632A (zh) * 2020-11-17 2021-04-27 中科扶云(杭州)科技有限公司 随机摇号的处理方法、装置、电子装置和存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105162760A (zh) * 2015-07-28 2015-12-16 郝孟一 随机抽取方法、装置以及系统
CN112712632A (zh) * 2020-11-17 2021-04-27 中科扶云(杭州)科技有限公司 随机摇号的处理方法、装置、电子装置和存储介质
CN112527244A (zh) * 2020-12-18 2021-03-19 上海万向区块链股份公司 基于可验证延迟函数的分布式抽签系统和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘章瑜: "《工程项目施工质量管理》", 31 October 2012, 华中科技大学出版社, pages: 193 *
吴晓刚: "《计算机网络技术与网络安全》", 30 September 2016, 光明日报出版社, pages: 128 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114812653A (zh) * 2022-04-27 2022-07-29 浙江光特科技有限公司 一种自动测试线性度的测试方法

Similar Documents

Publication Publication Date Title
US10796244B2 (en) Method and apparatus for labeling training samples
CN108768654B (zh) 基于声纹识别的身份验证方法、服务器及存储介质
CN110378749B (zh) 客户端相似性的评估方法、装置、终端设备及存储介质
CN108256591B (zh) 用于输出信息的方法和装置
CN111177005A (zh) 业务应用的测试方法、装置、服务器和存储介质
CN106557747B (zh) 识别保险单号码的方法及装置
CN109345417B (zh) 基于身份认证的业务人员的在线考核方法及终端设备
CN108777141B (zh) 测试装置、测试的方法及存储介质
CN104767714B (zh) 一种用户标识与用户资源信息的关联方法、终端及系统
CN106713370B (zh) 一种身份认证方法、服务器和移动终端
CN105955890B (zh) 一种功能测试案例的生成方法及装置
CN110634471B (zh) 一种语音质检方法、装置、电子设备和存储介质
CN111198815B (zh) 用户界面的兼容性测试方法及装置
CN110221948A (zh) 测试脚本生成方法、装置、计算机装置及存储介质
CN107729928A (zh) 信息获取方法和装置
CN112559923A (zh) 网址资源推荐方法、装置、电子设备及计算机存储介质
CN110460617A (zh) 机考考试系统及相关产品
CN113407593A (zh) 数据抽检方法、装置、电子设备和可读存储介质
CN109088793B (zh) 用于检测网络故障的方法和装置
CN110908892A (zh) 接口数据测试方法、装置及可读存储介质
CN107483208A (zh) 验证码图片的生成、验证方法及装置
CN111210328A (zh) 凭证生成方法和装置、存储介质和电子设备
CN110992044B (zh) 数据处理方法、装置、电子设备及可读存储介质
CN108229127A (zh) 预先产生验证数据以区分客户端的系统及其方法
CN106547818B (zh) 考勤结果验证方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100193 room 2115, 1st floor, incubator building 2, Zhongguancun Software Park, Dongbeiwang, Haidian District, Beijing

Applicant after: Beijing Jietong Digital Intelligence Technology Co.,Ltd.

Address before: 100193 room 2115, 1st floor, incubator building 2, Zhongguancun Software Park, Dongbeiwang, Haidian District, Beijing

Applicant before: Beijing Tianxing Huitong Information Technology Co.,Ltd.