CN113656372A - 标准指标库数据集市架构模型及方法 - Google Patents
标准指标库数据集市架构模型及方法 Download PDFInfo
- Publication number
- CN113656372A CN113656372A CN202110927944.3A CN202110927944A CN113656372A CN 113656372 A CN113656372 A CN 113656372A CN 202110927944 A CN202110927944 A CN 202110927944A CN 113656372 A CN113656372 A CN 113656372A
- Authority
- CN
- China
- Prior art keywords
- real
- time information
- standard
- information
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种标准指标库数据集市架构模型及方法,其中该架构模型包括采集模块,用以采集实时发布的实时信息;比较模块,根据比较结果确定实时信息的可信度;挑选模块,将实时信息的可信度高于标准可信度的实时信息挑选至数据集市内;修正模块,根据数据集市内的信息总量修正标准指标库内的参数;中控模块,根据比较模块内的可信度和挑选模块内的挑选数量来调整标准指标库内的参数基准值,以使经过修正的标准指标库内的参数值满足标准指标库的参数要求。通过采集实时信息,并根据实时信息的可信度选择是否将实时信息选入数据集市,以使得标准指标库内的数据符合实际需要,提高标准指标库内的参数精度,提高标准指标库的参考价值。
Description
技术领域
本发明涉及大数据处理技术领域,尤其涉及一种标准指标库数据集市架构模型及方法。
背景技术
随着经济的不断发展,技术也在不断地更新迭代,大数据通常成为人们进行决策和分析的数据基础,大数据通常指在一定时间范围内用软件工具捕捉管理和处理的数据集合,近年来,随着互联网、物联网以及人工智能融合信息技术的发展,数据的快速增长成为企业严峻的挑战和宝贵的机遇。
在实际的生产制造过程中,在加工过程中会产生很多数据,随着生产质量的稳定性越来越强,会在生产工艺过程中建立标准指标库,标准指标库中的数据为生产质量合格的产品过程中的指标参数,基于生产过程中对于指标参数的控制,实现对产品加工质量的严格把控,但是随着生产设备的使用时间和环境因素的影响,生产设置也处在一个动态变化过程中,其对生产质量的影响不言而喻,如果一直基于标准指标库中的指标参数进行控制,生产得到的产品质量也可能是不合格的,因此如何在生产过程中持续保证产品质量成为亟待解决的问题。
发明内容
为此,本发明提供一种标准指标库数据集市架构模型及方法,可以解决持续保障产品质量的问题。
为实现上述目的,本发明提供一种标准指标库数据集市架构模型及方法,其中标准指标库数据集市架构模型包括:
采集模块,用以采集实时发布的实时信息;
比较模块,用以将实时信息与预设的标准信息进行对比,根据比较结果确定实时信息的可信度;
挑选模块,其内预设有标准可信度,将实时信息的可信度高于标准可信度的实时信息挑选至数据集市内;
修正模块,根据数据集市内的信息总量修正标准指标库内的参数,以使标准指标数据库内的参数更为精准;
中控模块,分别与所述比较模块、挑选模块和修正模块连接,用以根据所述比较模块内的可信度和挑选模块内的挑选数量来调整标准指标库内的参数基准值,以使经过修正的标准指标库内的参数值满足标准指标库的参数要求;
所述中控模块内设置有第一参数群组、第二参数群组和第三参数群组,根据采集的实时信息的领域选择参数群组,若采集的实时信息属于第一领域,则选择第一参数群组,若采集的实时信息属于第二领域,则选择第二参数群组,若采集的实时信息属于第三领域,则选择第三参数群组,所述第一参数群组、第二参数群组和第三参数群组均包括多个参数;
所述中控模块包括获取单元和调整单元,其中所述获取单元用于获取实时信息的可信度和被选中的实时信息的数量;
所述调整单元与所述获取单元连接,用以根据所述获取单元获取的数据信息调整标准指标库内的参数基准值。
进一步地,所述将实时信息与预设的标准信息进行对比,根据比较结果确定实时信息的可信度包括:
当将实时信息与预设的标准信息进行对比时,中控模块内设置有关键字相似度K0,设定0.75<K0<0.95;
比较模块将实时信息中提取出的关键字与标准信息中的关键字进行比较,若实时信息中提取出的关键字与标准信息中的关键字的相似度K<关键字相似度K0,则表示实时信息中的关键字与标准信息中的关键字的相似性较低,此时实时信息的可信度较低;
若实时信息中提取出的关键字与标准信息中的关键字的相似度K≥关键字相似度K0,则表示实时信息中的关键字与标准信息中的关键字的相似性较高,此时实时信息的可信度较高。
进一步地,所述将实时信息的可信度高于标准可信度的实时信息挑选至数据集市内包括:
若实时信息中提取出的关键字与标准信息中的关键字的相似度K≥关键字相似度K0后,表示实时信息与标准信息中的关键字的相似度较高,进一步对符合相似度要求的实时信息进行进一步筛选;
中控单元内设置有标准可信度I0,实时信息的可信度基于相似度差值,实时信息的可信度I的计算方法为(K-K0)/K0;
若实时信息的可信度I≥标准可信度I0,则将该实时信息挑选至数据集市进行存储备用;
若实时信息的可信度I<标准可信度I0,则不对该实时信息进行挑选,使该实时信息留在比较模块内;
若在比较模块内保留的实时信息过多时,则对关键字相似度K0进行调整,提高关键字相似度K0为1.5×K0,以保证比较模块内存储的实时信息更为精简。
进一步地,所述根据数据集市内的信息总量修正标准指标库内的参数包括:
所述中控模块中设有预设信息数量差值△N0、第一预设参数修正系数α1和第二预设参数修正系数α2,其中,1<α1<α2<1.1;当所述中控模块判定N>1且N>N0时,中控模块计算N与N0之间的差值△N,设定△N=N-N0,计算完成后,中控模块将△N与△N0进行比对:
若△N<△N0,中控模块使用第一预设参数修正系数α1对标准指标库内的第一参数数值P1进行修正;
若△N≥△N0,中控模块使用第二预设参数修正系数α2对标准指标库内的第一参数数值P1进行修正;
当所述中控模块选用第i预设参数修正系数αi对P1进行修正时,设定i=1,2,修正后的预设参数记为P1′,P1′=P1×αi,其中N为数据集市内的信息总量,N0为数据集市内的信息标准总量。
进一步地,所述根据所述获取单元获取的数据信息调整标准指标库内的参数基准值包括:
中控单元内预先设置有参数基准值L0,采用第一系数m1或第二系数m3或第三系数m3对进行调整;
所述第一系数m1是以满足标准可信度要求的信息数量来决定的;
所述第二系数m2是以满足数据集市内的信息标准总量的信息数量决定的;
所述第三系数m3是以既满足标准可信度要求又满足数据集市内的信息标准总量的信息数量决定;
采用第一系数m1对参数基准值L0进行调整后得到的为L0×(1+m1);
采用第二系数m2对参数基准值L0进行调整后得到的为L0×(1+m2);
采用第三系数m3对参数基准值L0进行调整后得到的为L0×(1+m3)。
本发明另一方面提供的架构模型中的标准指标库数据集市架构方法,包括:
采集实时发布的实时信息;
将实时信息与预设的标准信息进行对比,根据比较结果确定实时信息的可信度;
预设有标准可信度,将实时信息的可信度高于标准可信度的实时信息挑选至数据集市内;
根据数据集市内的信息总量修正标准指标库内的参数,以使标准指标数据库内的参数更为精准;
根据所述比较模块内的可信度和挑选模块内的挑选数量来调整标准指标库内的参数基准值,以使经过修正的标准指标库内的参数值满足标准指标库的参数要求;
预先设置有第一参数群组、第二参数群组和第三参数群组,根据采集的实时信息的领域选择参数群组,若采集的实时信息属于第一领域,则选择第一参数群组,若采集的实时信息属于第二领域,则选择第二参数群组,若采集的实时信息属于第三领域,则选择第三参数群组,所述第一参数群组、第二参数群组和第三参数群组均包括多个参数;
获取实时信息的可信度和被选中的实时信息的数量;
根据所述获取单元获取的数据信息调整标准指标库内的参数基准值。
进一步地,所述将实时信息与预设的标准信息进行对比,根据比较结果确定实时信息的可信度包括:
当将实时信息与预设的标准信息进行对比时,中控模块内设置有关键字相似度K0,设定0.75<K0<0.95;
比较模块将实时信息中提取出的关键字与标准信息中的关键字进行比较,若实时信息中提取出的关键字与标准信息中的关键字的相似度K<关键字相似度K0,则表示实时信息中的关键字与标准信息中的关键字的相似性较低,此时实时信息的可信度较低;
若实时信息中提取出的关键字与标准信息中的关键字的相似度K≥关键字相似度K0,则表示实时信息中的关键字与标准信息中的关键字的相似性较高,此时实时信息的可信度较高。
进一步地,所述将实时信息的可信度高于标准可信度的实时信息挑选至数据集市内包括:
若实时信息中提取出的关键字与标准信息中的关键字的相似度K≥关键字相似度K0后,表示实时信息与标准信息中的关键字的相似度较高,进一步对符合相似度要求的实时信息进行进一步筛选;
中控单元内设置有标准可信度I0,实时信息的可信度基于相似度差值,实时信息的可信度I的计算方法为(K-K0)/K0;
若实时信息的可信度I≥标准可信度I0,则将该实时信息挑选至数据集市进行存储备用;
若实时信息的可信度I<标准可信度I0,则不对该实时信息进行挑选,使该实时信息留在比较模块内;
若在比较模块内保留的实时信息过多时,则对关键字相似度K0进行调整,提高关键字相似度K0为1.5×K0,以保证比较模块内存储的实时信息更为精简。
进一步地,所述根据数据集市内的信息总量修正标准指标库内的参数包括:
所述中控模块中设有预设信息数量差值△N0、第一预设参数修正系数α1和第二预设参数修正系数α2,其中,0<α1<α2<1;当所述中控模块判定N>1且N>N0时,中控模块计算N与N0之间的差值△N,设定△N=N-N0,计算完成后,中控模块将△N与△N0进行比对:
若△N<△N0,中控模块使用第一预设参数修正系数α1对标准指标库内的第一参数数值P1进行修正;
若△N≥△N0,中控模块使用第二预设参数修正系数α2对标准指标库内的第一参数数值P1进行修正;
当所述中控模块选用第i预设参数修正系数αi对P1进行修正时,设定i=1,2,修正后的第一参数数值记为P1′,P1′=P1×αi,其中N为数据集市内的信息总量,N0为数据集市内的信息标准总量。
进一步地,所述根据所述获取单元获取的数据信息调整标准指标库内的参数基准值包括:
中控单元内预先设置有参数基准值L0,采用第一系数m1或第二系数m3或第三系数m3对进行调整;
所述第一系数m1是以满足标准可信度要求的信息数量来决定的;
所述第二系数m2是以满足数据集市内的信息标准总量的信息数量决定的;
所述第三系数m3是以既满足标准可信度要求又满足数据集市内的信息标准总量的信息数量决定;
采用第一系数m1对参数基准值L0进行调整后得到的为L0×(1+m1);
采用第二系数m2对参数基准值L0进行调整后得到的为L0×(1+m2);
采用第三系数m3对参数基准值L0进行调整后得到的为L0×(1+m3)。
与现有技术相比,本发明的有益效果在于,通过采集实时信息,并根据实时信息的领域确定对应的参数群组,确定参数群组内的参数,将由选定的确定的参数群组内的参数构成标准指标库内的参数,并根据实时信息的可信度选择是否将实时信息选入数据集市,并根据实时信息的选入率和信息的可信度对标准指标库内的参数基准值进行调整,以使得标准指标库内的数据符合实际需要,提高标准指标库内的参数精度,提高标准指标库的参考价值,使得基于标准指标库内的指标参数进行控制,生产得到的产品质量得到有效的改进和提高,精进产品质量。
尤其,通过设置关键字相似度K0,便于对实时信息中提取出的关键字与标准信息中的关键字的相似度K与关键字相似度K0进行对比,实现对实时信息中提取的关键字标准信息中的关键字的相似性进行定性比较,提高对于实时信息的可信度的判定准确性,进而提高对于数据集市内数据选择的精确性,进而提高对于标准指标库内的基准参数修正精度,使得标准指标库内的参数更为精确,提高标准指标库内参数的参考价值。
尤其,通过对于数据集市内的数据进行进一步选择使得数据集市内的信息的参考性更强,提高数据集市内实时信息的精度,保证数据集市内的实时信息的可信度满足标准可信度,在实际应用过程中,若是不被选入数据集市内的实时信息过多,则需要对关键字相似度K0进行调整,以使得比较模块内的实时信息的数量在一定范围内,以防止数据过量,增加实时信息处理的难度,保证比较模块的信息处理效率。
尤其,通过对于标准指标库内的第一参数数值进行修正,使得标准指标库内的数据更为精确,提高标准指标库的参考价值,提高标准指标库的利用效率,在实际应用过程中,若数据集市内的信息总量过多,且在预设差值范围内,则采用较小的修正系数对标准指标库内的第一参数数值,使得指标数据库内的第一参数数值体现参考数据的数量,提升标准指标库内的参数精确度;若数据集市内的信息总量过多,且超出预设差值范围内,则采用较大的修正系数对标准指标库内的第一参数数值,使得指标数据库内的第一参数数值体现参考数据的数量,提升标准指标库内的参数精确度。
尤其,通过利用第一系数、第二系数和第三系数对参数基准值L0进行调整,提高标准指标库内的参数的准确性,提高标准指标库内的参数的参考价值,进而提高生产质量。
附图说明
图1为本发明实施例提供的标准指标库数据集市架构模型的结构示意图;
图2为本发明实施例提供的标准指标库数据集市架构方法的流程图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1所示,本发明实施例提供的标准指标库数据集市架构模型包括:
采集模块10,用以采集实时发布的实时信息;
比较模块20,用以将实时信息与预设的标准信息进行对比,根据比较结果确定实时信息的可信度;
挑选模块30,其内预设有标准可信度,将实时信息的可信度高于标准可信度的实时信息挑选至数据集市内;
修正模块40,根据数据集市内的信息总量修正标准指标库内的参数,以使标准指标数据库内的参数更为精准;
中控模块50,分别与所述比较模块、挑选模块和修正模块连接,用以根据所述比较模块内的可信度和挑选模块内的挑选数量来调整标准指标库内的参数基准值,以使经过修正的标准指标库内的参数值满足标准指标库的参数要求;
所述中控模块内设置有第一参数群组、第二参数群组和第三参数群组,根据采集的实时信息的领域选择参数群组,若采集的实时信息属于第一领域,则选择第一参数群组,若采集的实时信息属于第二领域,则选择第二参数群组,若采集的实时信息属于第三领域,则选择第三参数群组,所述第一参数群组、第二参数群组和第三参数群组均包括多个参数;
所述中控模块50包括获取单元51和调整单元52,其中所述获取单元用于获取实时信息的可信度和被选中的实时信息的数量;
所述调整单元与所述获取单元连接,用以根据所述获取单元获取的数据信息调整标准指标库内的参数基准值。
具体而言,本发明实施例提供的标准指标库数据集市架构模型通过采集实时信息,并根据实时信息的领域确定对应的参数群组,确定参数群组内的参数,将由选定的确定的参数群组内的参数构成标准指标库内的参数,并根据实时信息的可信度选择是否将实时信息选入数据集市,并根据实时信息的选入率和信息的可信度对标准指标库内的参数基准值进行调整,以使得标准指标库内的数据符合实际需要,提高标准指标库内的参数精度,提高标准指标库的参考价值,使得基于标准指标库内的指标参数进行控制,生产得到的产品质量得到有效的改进和提高,精进产品质量。
具体而言,所述将实时信息与预设的标准信息进行对比,根据比较结果确定实时信息的可信度包括:
当将实时信息与预设的标准信息进行对比时,中控模块内设置有关键字相似度K0,设定0.75<K0<0.95;
比较模块将实时信息中提取出的关键字与标准信息中的关键字进行比较,若实时信息中提取出的关键字与标准信息中的关键字的相似度K<关键字相似度K0,则表示实时信息中的关键字与标准信息中的关键字的相似性较低,此时实时信息的可信度较低;
若实时信息中提取出的关键字与标准信息中的关键字的相似度K≥关键字相似度K0,则表示实时信息中的关键字与标准信息中的关键字的相似性较高,此时实时信息的可信度较高;
所述关键字相似度K0可以是0.76、可以是0.8,可以是0.85、可以是0.9,还可以是0.94。
具体而言,本发明实施例通过设置关键字相似度K0,便于对实时信息中提取出的关键字与标准信息中的关键字的相似度K与关键字相似度K0进行对比,实现对实时信息中提取的关键字标准信息中的关键字的相似性进行定性比较,提高对于实时信息的可信度的判定准确性,进而提高对于数据集市内数据选择的精确性,进而提高对于标准指标库内的基准参数修正精度,使得标准指标库内的参数更为精确,提高标准指标库内参数的参考价值。
具体而言,所述将实时信息的可信度高于标准可信度的实时信息挑选至数据集市内包括:
若实时信息中提取出的关键字与标准信息中的关键字的相似度K≥关键字相似度K0后,表示实时信息与标准信息中的关键字的相似度较高,进一步对符合相似度要求的实时信息进行进一步筛选;
中控单元内设置有标准可信度I0,实时信息的可信度基于相似度差值,实时信息的可信度I的计算方法为(K-K0)/K0;
若实时信息的可信度I≥标准可信度I0,则将该实时信息挑选至数据集市进行存储备用;
若实时信息的可信度I<标准可信度I0,则不对该实时信息进行挑选,使该实时信息留在比较模块内;
若在比较模块内保留的实时信息过多时,则对关键字相似度K0进行调整,提高关键字相似度K0为1.5×K0,以保证比较模块内存储的实时信息更为精简。
具体而言,本发明实施例通过对于数据集市内的数据进行进一步选择使得数据集市内的信息的参考性更强,提高数据集市内实时信息的精度,保证数据集市内的实时信息的可信度满足标准可信度,在实际应用过程中,若是不被选入数据集市内的实时信息过多,则需要对关键字相似度K0进行调整,以使得比较模块内的实时信息的数量在一定范围内,以防止数据过量,增加实时信息处理的难度,保证比较模块的信息处理效率。
具体而言,所述根据数据集市内的信息总量修正标准指标库内的参数包括:
所述中控模块中设有预设信息数量差值△N0、第一预设参数修正系数α1和第二预设参数修正系数α2,其中,0<α1<α2<1;当所述中控模块判定N>1且N>N0时,中控模块计算N与N0之间的差值△N,设定△N=N-N0,计算完成后,中控模块将△N与△N0进行比对:
若△N<△N0,中控模块使用第一预设参数修正系数α1对标准指标库内的第一参数数值P1进行修正;
若△N≥△N0,中控模块使用第二预设参数修正系数α2对标准指标库内的第一参数数值P1进行修正;
当所述中控模块选用第i预设参数修正系数αi对P1进行修正时,设定i=1,2,修正后的第一参数数值记为P1′,P1′=P1×αi,其中N为数据集市内的信息总量,N0为数据集市内的信息标准总量。
具体而言,本发明实施例通过对于标准指标库内的第一参数数值进行修正,使得标准指标库内的数据更为精确,提高标准指标库的参考价值,提高标准指标库的利用效率,在实际应用过程中,若数据集市内的信息总量过多,且在预设差值范围内,则采用较小的修正系数对标准指标库内的第一参数数值,使得指标数据库内的第一参数数值体现参考数据的数量,提升标准指标库内的参数精确度;若数据集市内的信息总量过多,且超出预设差值范围内,则采用较大的修正系数对标准指标库内的第一参数数值,使得指标数据库内的第一参数数值体现参考数据的数量,提升标准指标库内的参数精确度。
具体而言,所述根据所述获取单元获取的数据信息调整标准指标库内的参数基准值包括:
中控单元内预先设置有参数基准值L0,采用第一系数m1或第二系数m3或第三系数m3对进行调整;
所述第一系数m1是以满足标准可信度要求的信息数量来决定的;
所述第二系数m2是以满足数据集市内的信息标准总量的信息数量决定的;
所述第三系数m3是以既满足标准可信度要求又满足数据集市内的信息标准总量的信息数量决定;
采用第一系数m1对参数基准值L0进行调整后得到的为L0×(1+m1);
采用第二系数m2对参数基准值L0进行调整后得到的为L0×(1+m2);
采用第三系数m3对参数基准值L0进行调整后得到的为L0×(1+m3)。
具体而言,本发明实施例通过利用第一系数、第二系数和第三系数对参数基准值L0进行调整,提高标准指标库内的参数的准确性,提高标准指标库内的参数的参考价值,进而提高生产质量。
如图2所示,本发明实施例还提供一种标准指标库数据集市架构方法,该方法包括:
步骤S100:采集实时发布的实时信息;
步骤S200:将实时信息与预设的标准信息进行对比,根据比较结果确定实时信息的可信度;
步骤S300:预设有标准可信度,将实时信息的可信度高于标准可信度的实时信息挑选至数据集市内;
步骤S400:根据数据集市内的信息总量修正标准指标库内的参数,以使标准指标数据库内的参数更为精准;
步骤S500:根据所述比较模块内的可信度和挑选模块内的挑选数量来调整标准指标库内的参数基准值,以使经过修正的标准指标库内的参数值满足标准指标库的参数要求;
在步骤S100中,预先设置有第一参数群组、第二参数群组和第三参数群组,根据采集的实时信息的领域选择参数群组,若采集的实时信息属于第一领域,则选择第一参数群组,若采集的实时信息属于第二领域,则选择第二参数群组,若采集的实时信息属于第三领域,则选择第三参数群组,所述第一参数群组、第二参数群组和第三参数群组均包括多个参数;
在步骤S500中具体包括:获取实时信息的可信度和被选中的实时信息的数量;根据所述获取单元获取的数据信息调整标准指标库内的参数基准值。
具体而言,所述将实时信息与预设的标准信息进行对比,根据比较结果确定实时信息的可信度包括:
当将实时信息与预设的标准信息进行对比时,中控模块内设置有关键字相似度K0,设定0.75<K0<0.95;
比较模块将实时信息中提取出的关键字与标准信息中的关键字进行比较,若实时信息中提取出的关键字与标准信息中的关键字的相似度K<关键字相似度K0,则表示实时信息中的关键字与标准信息中的关键字的相似性较低,此时实时信息的可信度较低;
若实时信息中提取出的关键字与标准信息中的关键字的相似度K≥关键字相似度K0,则表示实时信息中的关键字与标准信息中的关键字的相似性较高,此时实时信息的可信度较高。
具体而言,所述将实时信息的可信度高于标准可信度的实时信息挑选至数据集市内包括:
若实时信息中提取出的关键字与标准信息中的关键字的相似度K≥关键字相似度K0后,表示实时信息与标准信息中的关键字的相似度较高,进一步对符合相似度要求的实时信息进行进一步筛选;
中控单元内设置有标准可信度I0,实时信息的可信度基于相似度差值,实时信息的可信度I的计算方法为(K-K0)/K0;
若实时信息的可信度I≥标准可信度I0,则将该实时信息挑选至数据集市进行存储备用;
若实时信息的可信度I<标准可信度I0,则不对该实时信息进行挑选,使该实时信息留在比较模块内;
若在比较模块内保留的实时信息过多时,则对关键字相似度K0进行调整,提高关键字相似度K0为1.5×K0,以保证比较模块内存储的实时信息更为精简。
具体而言,所述根据数据集市内的信息总量修正标准指标库内的参数包括:
所述中控模块中设有预设信息数量差值△N0、第一预设参数修正系数α1和第二预设参数修正系数α2,其中,0<α1<α2<1;当所述中控模块判定N>1且N>N0时,中控模块计算N与N0之间的差值△N,设定△N=N-N0,计算完成后,中控模块将△N与△N0进行比对:
若△N<△N0,中控模块使用第一预设参数修正系数α1对标准指标库内的第一参数数值P1进行修正;
若△N≥△N0,中控模块使用第二预设参数修正系数α2对标准指标库内的第一参数数值P1进行修正;
当所述中控模块选用第i预设参数修正系数αi对P1进行修正时,设定i=1,2,修正后的第一参数数值记为P1′,P1′=P1×αi,其中N为数据集市内的信息总量,N0为数据集市内的信息标准总量。
具体而言,所述根据所述获取单元获取的数据信息调整标准指标库内的参数基准值包括:
中控单元内预先设置有参数基准值L0,采用第一系数m1或第二系数m3或第三系数m3对进行调整;
所述第一系数m1是以满足标准可信度要求的信息数量来决定的;
所述第二系数m2是以满足数据集市内的信息标准总量的信息数量决定的;
所述第三系数m3是以既满足标准可信度要求又满足数据集市内的信息标准总量的信息数量决定;
采用第一系数m1对参数基准值L0进行调整后得到的为L0×(1+m1);
采用第二系数m2对参数基准值L0进行调整后得到的为L0×(1+m2);
采用第三系数m3对参数基准值L0进行调整后得到的为L0×(1+m3)。
本发明实施例提供的标准指标库数据集市架构方法,应用于标准指标库数据集市架构模型,实施与标准指标库数据集市架构模型相同的技术方案,达到相同的技术效果,在此不再赘述。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种标准指标库数据集市架构模型,其特征在于,包括:
采集模块,用以采集实时发布的实时信息;
比较模块,用以将实时信息与预设的标准信息进行对比,根据比较结果确定实时信息的可信度;
挑选模块,其内预设有标准可信度,将实时信息的可信度高于标准可信度的实时信息挑选至数据集市内;
修正模块,根据数据集市内的信息总量修正标准指标库内的参数,以使标准指标数据库内的参数更为精准;
中控模块,分别与所述比较模块、挑选模块和修正模块连接,用以根据所述比较模块内的可信度和挑选模块内的挑选数量来调整标准指标库内的参数基准值,以使经过修正的标准指标库内的参数值满足标准指标库的参数要求;
所述中控模块内设置有第一参数群组、第二参数群组和第三参数群组,根据采集的实时信息的领域选择参数群组,若采集的实时信息属于第一领域,则选择第一参数群组,若采集的实时信息属于第二领域,则选择第二参数群组,若采集的实时信息属于第三领域,则选择第三参数群组,所述第一参数群组、第二参数群组和第三参数群组均包括多个参数;
所述中控模块包括获取单元和调整单元,其中所述获取单元用于获取实时信息的可信度和被选中的实时信息的数量;
所述调整单元与所述获取单元连接,用以根据所述获取单元获取的数据信息调整标准指标库内的参数基准值。
2.根据权利要求1所述的标准指标库数据集市架构模型,其特征在于,
所述将实时信息与预设的标准信息进行对比,根据比较结果确定实时信息的可信度包括:
当将实时信息与预设的标准信息进行对比时,中控模块内设置有关键字相似度K0,设定0.75<K0<0.95;
比较模块将实时信息中提取出的关键字与标准信息中的关键字进行比较,若实时信息中提取出的关键字与标准信息中的关键字的相似度K<关键字相似度K0,则表示实时信息中的关键字与标准信息中的关键字的相似性较低,此时实时信息的可信度较低;
若实时信息中提取出的关键字与标准信息中的关键字的相似度K≥关键字相似度K0,则表示实时信息中的关键字与标准信息中的关键字的相似性较高,此时实时信息的可信度较高。
3.根据权利要求2所述的标准指标库数据集市架构模型,其特征在于,
所述将实时信息的可信度高于标准可信度的实时信息挑选至数据集市内包括:
若实时信息中提取出的关键字与标准信息中的关键字的相似度K≥关键字相似度K0后,表示实时信息与标准信息中的关键字的相似度较高,进一步对符合相似度要求的实时信息进行进一步筛选;
中控单元内设置有标准可信度I0,实时信息的可信度基于相似度差值,实时信息的可信度I的计算方法为(K-K0)/K0;
若实时信息的可信度I≥标准可信度I0,则将该实时信息挑选至数据集市进行存储备用;
若实时信息的可信度I<标准可信度I0,则不对该实时信息进行挑选,使该实时信息留在比较模块内;
若在比较模块内保留的实时信息过多时,则对关键字相似度K0进行调整,提高关键字相似度K0为1.5×K0,以保证比较模块内存储的实时信息更为精简。
4.根据权利要求3所述的标准指标库数据集市架构模型,其特征在于,
所述根据数据集市内的信息总量修正标准指标库内的参数包括:
所述中控模块中设有预设信息数量差值△N0、第一预设参数修正系数α1和第二预设参数修正系数α2,其中,1<α1<α2<1.1;当所述中控模块判定N>1且N>N0时,中控模块计算N与N0之间的差值△N,设定△N=N-N0,计算完成后,中控模块将△N与△N0进行比对:
若△N<△N0,中控模块使用第一预设参数修正系数α1对标准指标库内的第一参数数值P1进行修正;
若△N≥△N0,中控模块使用第二预设参数修正系数α2对标准指标库内的第一参数数值P1进行修正;
当所述中控模块选用第i预设参数修正系数αi对P1进行修正时,设定i=1,2,修正后的预设参数记为P1′,P1′=P1×αi,其中N为数据集市内的信息总量,N0为数据集市内的信息标准总量。
5.根据权利要求4所述的标准指标库数据集市架构模型,其特征在于,
所述根据所述获取单元获取的数据信息调整标准指标库内的参数基准值包括:
中控单元内预先设置有参数基准值L0,采用第一系数m1或第二系数m3或第三系数m3对进行调整;
所述第一系数m1是以满足标准可信度要求的信息数量来决定的;
所述第二系数m2是以满足数据集市内的信息标准总量的信息数量决定的;
所述第三系数m3是以既满足标准可信度要求又满足数据集市内的信息标准总量的信息数量决定;
采用第一系数m1对参数基准值L0进行调整后得到的为L0×(1+m1);
采用第二系数m2对参数基准值L0进行调整后得到的为L0×(1+m2);
采用第三系数m3对参数基准值L0进行调整后得到的为L0×(1+m3)。
6.一种应用在权利要求1-5中任意项的架构模型中的标准指标库数据集市架构方法,其特征在于,
采集实时发布的实时信息;
将实时信息与预设的标准信息进行对比,根据比较结果确定实时信息的可信度;
预设有标准可信度,将实时信息的可信度高于标准可信度的实时信息挑选至数据集市内;
根据数据集市内的信息总量修正标准指标库内的参数,以使标准指标数据库内的参数更为精准;
根据所述比较模块内的可信度和挑选模块内的挑选数量来调整标准指标库内的参数基准值,以使经过修正的标准指标库内的参数值满足标准指标库的参数要求;
预先设置有第一参数群组、第二参数群组和第三参数群组,根据采集的实时信息的领域选择参数群组,若采集的实时信息属于第一领域,则选择第一参数群组,若采集的实时信息属于第二领域,则选择第二参数群组,若采集的实时信息属于第三领域,则选择第三参数群组,所述第一参数群组、第二参数群组和第三参数群组均包括多个参数;
获取实时信息的可信度和被选中的实时信息的数量;
根据所述获取单元获取的数据信息调整标准指标库内的参数基准值。
7.根据权利要求6所述的标准指标库数据集市架构方法,其特征在于,
所述将实时信息与预设的标准信息进行对比,根据比较结果确定实时信息的可信度包括:
当将实时信息与预设的标准信息进行对比时,中控模块内设置有关键字相似度K0,设定0.75<K0<0.95;
比较模块将实时信息中提取出的关键字与标准信息中的关键字进行比较,若实时信息中提取出的关键字与标准信息中的关键字的相似度K<关键字相似度K0,则表示实时信息中的关键字与标准信息中的关键字的相似性较低,此时实时信息的可信度较低;
若实时信息中提取出的关键字与标准信息中的关键字的相似度K≥关键字相似度K0,则表示实时信息中的关键字与标准信息中的关键字的相似性较高,此时实时信息的可信度较高。
8.根据权利要求7所述的标准指标库数据集市架构方法,其特征在于,所述将实时信息的可信度高于标准可信度的实时信息挑选至数据集市内包括:
若实时信息中提取出的关键字与标准信息中的关键字的相似度K≥关键字相似度K0后,表示实时信息与标准信息中的关键字的相似度较高,进一步对符合相似度要求的实时信息进行进一步筛选;
中控单元内设置有标准可信度I0,实时信息的可信度基于相似度差值,实时信息的可信度I的计算方法为(K-K0)/K0;
若实时信息的可信度I≥标准可信度I0,则将该实时信息挑选至数据集市进行存储备用;
若实时信息的可信度I<标准可信度I0,则不对该实时信息进行挑选,使该实时信息留在比较模块内;
若在比较模块内保留的实时信息过多时,则对关键字相似度K0进行调整,提高关键字相似度K0为1.5×K0,以保证比较模块内存储的实时信息更为精简。
9.根据权利要求8所述的标准指标库数据集市架构方法,其特征在于,所述根据数据集市内的信息总量修正标准指标库内的参数包括:
所述中控模块中设有预设信息数量差值△N0、第一预设参数修正系数α1和第二预设参数修正系数α2,其中,0<α1<α2<1;当所述中控模块判定N>1且N>N0时,中控模块计算N与N0之间的差值△N,设定△N=N-N0,计算完成后,中控模块将△N与△N0进行比对:
若△N<△N0,中控模块使用第一预设参数修正系数α1对标准指标库内的第一参数数值P1进行修正;
若△N≥△N0,中控模块使用第二预设参数修正系数α2对标准指标库内的第一参数数值P1进行修正;
当所述中控模块选用第i预设参数修正系数αi对P1进行修正时,设定i=1,2,修正后的第一参数数值记为P1′,P1′=P1×αi,其中N为数据集市内的信息总量,N0为数据集市内的信息标准总量。
10.根据权利要求9所述的标准指标库数据集市架构方法,其特征在于,所述根据所述获取单元获取的数据信息调整标准指标库内的参数基准值包括:
中控单元内预先设置有参数基准值L0,采用第一系数m1或第二系数m3或第三系数m3对进行调整;
所述第一系数m1是以满足标准可信度要求的信息数量来决定的;
所述第二系数m2是以满足数据集市内的信息标准总量的信息数量决定的;
所述第三系数m3是以既满足标准可信度要求又满足数据集市内的信息标准总量的信息数量决定;
采用第一系数m1对参数基准值L0进行调整后得到的为L0×(1+m1);
采用第二系数m2对参数基准值L0进行调整后得到的为L0×(1+m2);
采用第三系数m3对参数基准值L0进行调整后得到的为L0×(1+m3)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110927944.3A CN113656372B (zh) | 2021-08-13 | 2021-08-13 | 标准指标库数据集市架构装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110927944.3A CN113656372B (zh) | 2021-08-13 | 2021-08-13 | 标准指标库数据集市架构装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113656372A true CN113656372A (zh) | 2021-11-16 |
CN113656372B CN113656372B (zh) | 2022-06-21 |
Family
ID=78479664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110927944.3A Active CN113656372B (zh) | 2021-08-13 | 2021-08-13 | 标准指标库数据集市架构装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113656372B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114676222A (zh) * | 2022-03-29 | 2022-06-28 | 北京国信网联科技有限公司 | 快速对进出内部网络数据审计方法 |
CN118411083A (zh) * | 2024-07-01 | 2024-07-30 | 浙江省标准化研究院(金砖国家标准化(浙江)研究中心、浙江省物品编码中心) | 一种基于产品标准的指标体系构建方法和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104915897A (zh) * | 2015-06-24 | 2015-09-16 | 国家电网公司 | 一种电网规划评价业务的计算机实现方法 |
CN107679096A (zh) * | 2017-09-08 | 2018-02-09 | 北京京东尚科信息技术有限公司 | 数据集市间指标共享的方法和装置 |
CN109033113A (zh) * | 2017-06-12 | 2018-12-18 | 北京京东尚科信息技术有限公司 | 数据仓库和数据集市的管理方法及装置 |
US20190317938A1 (en) * | 2016-03-31 | 2019-10-17 | Smart Insight Corporation | Method, program, and system for automatic discovery of relationship between fields in environment where different types of data sources coexist |
CN111367499A (zh) * | 2019-12-10 | 2020-07-03 | 中国航空综合技术研究所 | 一种基于标准指标库的产品需求定义和追溯方法 |
CN112084182A (zh) * | 2020-09-10 | 2020-12-15 | 重庆富民银行股份有限公司 | 一种用于数据集市和数据仓库的数据建模方法 |
CN112632168A (zh) * | 2020-12-23 | 2021-04-09 | 深圳迅策科技有限公司 | 一种基于大数据技术架构的数据中台服务体系 |
-
2021
- 2021-08-13 CN CN202110927944.3A patent/CN113656372B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104915897A (zh) * | 2015-06-24 | 2015-09-16 | 国家电网公司 | 一种电网规划评价业务的计算机实现方法 |
US20190317938A1 (en) * | 2016-03-31 | 2019-10-17 | Smart Insight Corporation | Method, program, and system for automatic discovery of relationship between fields in environment where different types of data sources coexist |
CN109033113A (zh) * | 2017-06-12 | 2018-12-18 | 北京京东尚科信息技术有限公司 | 数据仓库和数据集市的管理方法及装置 |
CN107679096A (zh) * | 2017-09-08 | 2018-02-09 | 北京京东尚科信息技术有限公司 | 数据集市间指标共享的方法和装置 |
CN111367499A (zh) * | 2019-12-10 | 2020-07-03 | 中国航空综合技术研究所 | 一种基于标准指标库的产品需求定义和追溯方法 |
CN112084182A (zh) * | 2020-09-10 | 2020-12-15 | 重庆富民银行股份有限公司 | 一种用于数据集市和数据仓库的数据建模方法 |
CN112632168A (zh) * | 2020-12-23 | 2021-04-09 | 深圳迅策科技有限公司 | 一种基于大数据技术架构的数据中台服务体系 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114676222A (zh) * | 2022-03-29 | 2022-06-28 | 北京国信网联科技有限公司 | 快速对进出内部网络数据审计方法 |
CN114676222B (zh) * | 2022-03-29 | 2022-12-02 | 北京国信网联科技有限公司 | 快速对进出内部网络数据审计方法 |
CN118411083A (zh) * | 2024-07-01 | 2024-07-30 | 浙江省标准化研究院(金砖国家标准化(浙江)研究中心、浙江省物品编码中心) | 一种基于产品标准的指标体系构建方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113656372B (zh) | 2022-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113656372B (zh) | 标准指标库数据集市架构装置及方法 | |
CN112801091A (zh) | 一种基于深度学习的增材制造制件成形质量监控与预测方法 | |
CN112990420A (zh) | 一种用于卷积神经网络模型的剪枝方法 | |
CN112749840A (zh) | 一种火电机组能效特征指标基准值的获取方法 | |
CN107808209B (zh) | 基于加权kNN距离的风电场异常数据辨识方法 | |
CN116050249A (zh) | 一种回流焊焊点形貌预测方法 | |
CN115115107A (zh) | 光伏功率的预测方法、预测装置和计算机设备 | |
CN108537249B (zh) | 一种密度峰值聚类的工业过程数据聚类方法 | |
CN113359435A (zh) | 用于火电机组动态工况数据的修正方法 | |
CN115880101B (zh) | 一种基于大数据的水利数据管理系统 | |
CN116882272A (zh) | 一种压气机叶片加工误差统计分析方法 | |
CN116911734A (zh) | 一种基于大数据的冲压模具管理方法 | |
CN115834424A (zh) | 配电网线损异常数据的辨识与修正方法 | |
CN110175705B (zh) | 一种负荷预测方法及包含该方法的存储器、系统 | |
CN108595843B (zh) | 一种动态自适应的众创设计方案数据寻优方法 | |
CN111933226A (zh) | 一种基于分级分类模型的人工智能筛选材料方法 | |
CN114118855B (zh) | 一种基于cnn的台区线损率标杆值计算方法 | |
CN109491345A (zh) | 一种基于关键工序质量控制的研究方法 | |
CN115914225B (zh) | 一种针对Raft共识算法选举阶段的优化方法 | |
CN115718877A (zh) | 一种基于负荷变化特征的电力负荷曲线聚类算法 | |
CN113887804B (zh) | 一种基于改进局部异常因子算法的短期风电功率预测方法 | |
CN115688034B (zh) | 数值型和类别型的混合资料的提取和缩减方法 | |
CN117952971B (zh) | 一种热喷涂超细粉末用等离子重熔监测方法及系统 | |
CN118348868A (zh) | 一种基于物联网的建筑数据管理系统 | |
CN113128535B (zh) | 一种聚类模型的选取方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230807 Address after: 518000 building 501, 502, 601, 602, building D, wisdom Plaza, Qiaoxiang Road, Gaofa community, Shahe street, Nanshan District, Shenzhen City, Guangdong Province Patentee after: China Southern Power Grid Digital Platform Technology (Guangdong) Co.,Ltd. Address before: 510700 building C, Yunsheng Science Park, No. 11, spectrum Middle Road, Huangpu District, Guangzhou City, Guangdong Province Patentee before: Southern Power Grid Digital Grid Research Institute Co.,Ltd. |