CN110119364A - 一种输入/输出批量提交的方法和系统 - Google Patents
一种输入/输出批量提交的方法和系统 Download PDFInfo
- Publication number
- CN110119364A CN110119364A CN201810116396.4A CN201810116396A CN110119364A CN 110119364 A CN110119364 A CN 110119364A CN 201810116396 A CN201810116396 A CN 201810116396A CN 110119364 A CN110119364 A CN 110119364A
- Authority
- CN
- China
- Prior art keywords
- dimension
- parameter
- data
- submitted
- numerical value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/448—Execution paradigms, e.g. implementations of programming paradigms
- G06F9/4482—Procedural
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/20—Handling requests for interconnection or transfer for access to input/output bus
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种输入/输出批量提交的方法和系统,涉及计算机技术领域。该方法的一具体实施方式包括:获取当前时段至少一个维度的数据;根据提交参数的基准值分析所述维度的数据,以确定出提交参数的数值;根据所述确定出的提交参数的数值,进行输入/输出的批量提交。本发明实施例能够提高输入/输出IO批量提交的性能,减少了CPU的占用和IO提交线程数,解决了现有技术中提交参数不能调整导致的系统资源浪费以及提交性能和稳定性低的问题。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种输入/输出批量提交的方法和系统。
背景技术
现有技术中,输入/输出(Input/Output,IO)提交的方法主要包括同步的阻塞式流形式、NIO和Netty的方式。同步的阻塞式流形式是先向缓冲区写数据,缓冲区满后向IO系统批量提交数据。但是在该过程中,是采用固定大小的的数据包批量提交,不仅只能一收一发,而且采用的数据包也比较小。NIO是通过程序查询每个通道是否有到达事件,如果没有事件,则一直阻塞在那里,因此这种方式会导致用户线程的阻塞。Netty是一个开源框架,对New IO的封装,采用哈希轮的方式对New IO的多线程进行调度,以提高IO系统的性能。
上述方法在实施过程中,存在以下问题:提交的数据包的大小一直是固定的,而且对于同步的阻塞式流形式只能进行一收一发,虽然NIO和Netty的方式,可同时处理多线程异步数据,但是对于利用多线程占满IO系统的带宽,不仅可能会降低IO系统的性能,而且发包频率等提交参数的数值都是固定的,不能进行智能调整。
发明内容
有鉴于此,本发明实施例提供一种输入/输出批量提交的方法和系统,能够提高输入/输出IO批量提交的性能,减少了CPU占用和IO提交线程数,解决了现有技术中提交参数不能调整导致系统资源浪费以及提交性能和稳定性低的问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种输入/输出批量提交的方法。
本发明实施例的输入/输出批量提交的方法包括:获取当前时段至少一个维度的数据;根据提交参数的基准值分析所述维度的数据,以确定出提交参数的数值;根据所述确定出的提交参数的数值,进行输入/输出的批量提交。
可选地,根据提交参数的基准值分析所述维度的数据,以确定出提交参数的数值的步骤包括:对获取到的每个维度的数据进行分析,以确定出该维度所对应的提交参数的基准值;根据每个维度的加权值,确定出加权基准值;将提交参数的数值调整为所述加权基准值。
可选地,在确定出提交参数的数值之前,还包括:通过第一训练模型对第一样本数据进行学习,以确定出所述维度的各个区间,以及各个区间中每个提交参数的基准值;其中,所述第一样本数据包括:维度的样本数据以及该维度的样本数据所对应的提交参数的数值。
可选地,在根据所述确定出的提交参数的数值,进行输入/输出的批量提交之后,还包括:获取批量提交时的维度的数据,并且记录该维度的数据以及所述确定出的提交参数的数值;则,将所述记录的数据作为所述第一样本数据。
可选地,在根据所述确定出的提交参数的数值,进行输入/输出的批量提交之后,还包括:按照预设的时间段统计掉包率;以及,根据所述掉包率和调整范围,调整提交参数的数值。
可选地,在根据所述掉包率和调整范围,调整提交参数的数值之前,还包括:通过第二模型对第二样本数据进行学习,以确定出掉包率的各个区间,以及各个区间中每个提交参数的基准值的调整范围;其中,所述第二样本数据包括:维度的样本数据以及该维度的样本数据所对应的提交参数的数值和掉包率。
可选地,所述维度至少包括以下一种:时间段、网络传输速度、内部线程、带宽和延迟大小、CPU和内存;
所述提交参数至少包括以下一种:缓存大小、数据包大小、提交线程数量以及发包频率。
为实现上述目的,根据本发明实施例的另一个方面,提供了一种输入/输出批量提交的系统。
本发明实施例的输入/输出批量提交的系统包括:获取模块,用于获取当前时段至少一个维度的数据;确定模块,用于根据提交参数的基准值分析所述维度的数据,以确定出提交参数的数值;提交模块,用于根据所述确定出的提交参数的数值,进行输入/输出的批量提交。
可选地,所述确定模块还用于,对所述获取模块获取到的每个维度的数据进行分析,以确定出该维度所对应的提交参数的基准值;并且根据每个维度的加权值,确定出加权基准值;将提交参数的数值调整为所述加权基准值。
可选地,还包括第一训练模块,用于通过第一训练模型对第一样本数据进行学习,以确定出所述维度的各个区间,以及各个区间中每个提交参数的基准值;其中,所述第一样本数据包括:维度的样本数据以及该维度的样本数据所对应的提交参数的数值。
可选地,所述第一训练模块还用于,获取批量提交时的维度的数据,并且记录该维度的数据以及所述确定出的提交参数的数值;并且,将所述记录的数据作为所述第一样本数据。
可选地,还包括调整模块,用于按照预设的时间段统计掉包率;以及,根据所述掉包率和调整范围,调整提交参数的数值。
可选地,还包括第二训练模块,用于通过第二模型对第二样本数据进行学习,以确定出掉包率的各个区间,以及各个区间中每个提交参数的基准值的调整范围;其中,所述第二样本数据包括:维度的样本数据以及该维度的样本数据所对应的提交参数的数值和掉包率。
可选地,所述维度至少包括以下一种:时间段、网络传输速度、内部线程、带宽和延迟大小、CPU和内存;
所述提交参数至少包括以下一种:缓存大小、数据包大小、提交线程数量以及发包频率。
为实现上述目的,根据本发明实施例的再一个方面,提供了一种输入/输出批量提交的电子设备。
本发明实施例的输入/输出批量提交的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一项的输入/输出批量提交的方法。
为实现上述目的,根据本发明实施例的再一个方面,提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现上述任一项的输入/输出批量提交的方法。
上述发明中的一个实施例具有如下优点或有益效果:能够根据提交参数的基准值分析获取到的实时的数据,确定出该提交参数的数值,提高了输入/输出IO批量提交的性能,减少了CPU占用和IO并发线程数,解决了现有技术中提交参数不能调整导致系统资源浪费以及提交性能和稳定性低的问题。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的输入/输出批量提交的方法的主要流程的示意图;
图2是根据本发明实施例的输入/输出批量提交的方法的示意图;
图3是根据本发明实施例输入/输出批量提交的系统的主要模块的示意图;
图4是本发明实施例可以应用于其中的示例性系统架构图;
图5是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的输入/输出批量提交的方法的主要流程的示意图,如图1所示,本发明实施例的输入/输出批量提交的方法主要包括:
步骤S101:获取当前时段至少一个维度的数据。其中,该维度至少包括以下一种:时间段、网络传输速度、内部线程、带宽和延迟大小、CPU和内存。通过对维度的历史数据进行统计分析,对于每个维度可将其划分为几个区间,可根据需求将时间段这个维度分为几个区间,例如将时间段这个维度分为忙和不忙两个时段区间。在比较忙的时段,全网流量比较大,采用较小的数据包并且较高的发包频率,则更能保证提交效率;对于非忙时,比如说半夜0点,使用较大的数据包占满带宽,则可提高IO的批量提交性能并且减小延迟。对于网络传输速度这个维度,在单位时间需要传输较大数据量时,即网络传输速度较大,如果将预设内存缓冲区加大,并且将数据包的大小增大,可保证提交过程中传输的稳定性。对于IO批量提交中的客户端和服务器中的任意一台设备,内部线程越多,一般需要的内存缓冲区越大、需要发送的数据包越大,而且需要的提交线程数量越多,以提高传输速度。对于带宽和延迟大小这个维度,如果机械硬盘带宽大、延迟极高,为提高传输性能和保证稳定性,可采用较大的数据包以减少传输频率。而对于SSD,延迟较低,则可降低发包频率。而网络带宽有提高的话,内存缓冲区也可以大幅度提高,进而加快了数据传输。对于设备的CPU和内存,CPU指cpu的核数和频率,cpu越强,则可以使用更多的线程处理,内存指内存大小,内存越大,则可以使用更大的缓冲区提供给批量发包程序,则其CPU和内存处理能力越高,在保证传输稳定性的前提下,可通过提高线程数加快数据传输。时间段、网络传输速度、内部线程、带宽和延迟大小、CPU和内存对IO的批量提交的性能和稳定性都有影响,因此为提高提交的性能和稳定性至少从上述一个维度对提交参数进行调整。
步骤S102:根据提交参数的基准值分析维度的数据,以确定出提交参数的数值。在IO的批量提交的过程中,涉及的参数至少包括缓存大小、数据包大小、提交线程数量以及发包频率,因此本发明实施例中的提交参数至少包括以下一种:缓存大小、数据包大小、提交线程数量以及发包频率。
在步骤S102中,通过对获取到的每个维度的数据进行分析,确定出该维度所对应的提交参数的基准值,并且根据每个维度的加权值,确定出加权基准值;将提交参数的数值调整为加权基准值。在步骤S101中,获取到的可能为多个维度的数据,针对每个维度,可确定出该维度所对应的一组提交参数的基准值,进而对所有的维度的数据进行分析之后,得到的是维度和参数的数据矩阵。可根据应用场景和项目需求设置每个维度的加权值,则根据每个维度的加权值,最终确定出提交参数的一组加权基准值,并且将提交参数的值分别调整为该加权基准值。
上述过程中的提交参数的基准值,是根据对样本数据进行数据统计确定出的。所以在该步骤S102之前,可通过第一训练模型对第一样本数据进行学习,以确定出维度的各个区间,以及各个区间中每个提交参数的基准值;其中,第一样本数据包括:维度的样本数据以及该维度的样本数据所对应的提交参数的数值。该维度的样本数据所对应的提交参数的数值是指,系统产生该维度的样本数据时提交参数的数值。则在根据提交参数的基准值分析所述维度的数据,以确定出提交参数的数值的过程中,对于一个维度,分析获取到的该维度的数据,判断该维度的数据所在的区间,该区间为上述通过第一训练模型对第一样本数据进行学习确定出的。在确定该维度的数据所在的区间之后,则该区间中每个提交参数的基准值则为该维度所对应的提交参数的基准值。
并且,在每次提交之后,可获取批量提交时的每个维度的数据,并且记录该维度的数据以及上述确定出的提交参数的数值,将记录的数据作为第一样本数据。其中,记录的数据中包括当前时段IO的批量提交时的各个维度的数据,以及当前时段IO的批量提交时的提交参数的数值。即,将提交过程中的数据作为模型学习的样本数据,可实现根据提交的状况实时调整提交参数的基准值。
支持向量机SVM(Support Vector Machine)是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题.简单地说,就是升维和线性化。一般的升维都会带来计算的复杂化,而SVM可通过核函数的展开定理,在高维特征空间中建立线性学习机,所以与线性模型相比,不但几乎不增加计算的复杂性,而且在某种程度上避免了“维数灾难”。进而本发明实施例为保证确定出的基准值的准确性,该第一训练模型可采用SVM。例如对于时间段维度,可通过SVM对第一样本数据进行学习,将时间段分为忙和不忙两个区间,并且确定出在忙这个区间中,缓存大小、数据包大小、提交线程数量以及发包频率的基准值分别为5G、100字节、200以及2000。因此,如果获取到时间段维度的数据在忙这个区间中的话,则该维度所对应的提交参数的基准值的数值确定为5G、100字节、200以及2000。
步骤S103:根据确定出的提交参数的数值,进行输入/输出的批量提交。将提交参数的数值调整为上述确定出的数值之后,则可按照该数值进行IO的批量提交。由于该提交参数的数值是根据当前时段的维度的数据确定出的,进而,实现IO的批量提交过程中对提交参数的调整,不仅可提高IO提交的性能,而且可保证IO系统的稳定性。
在步骤S103之后,可按照预设的时间段统计IO的批量提交过程中掉包率;以及,根据掉包率和调整范围,调整提交参数的数值。掉包率,是指测试中所丢失数据包数量占所发送数据包的比率,通常在吞吐量范围内测试。该调整范围可在进行该过程之前进行设置,也可通过模型学习动态获取到。如果动态获取的话,可通过第二模型对第二样本数据进行学习,以确定出掉包率的各个区间,以及各个区间中每个提交参数的基准值的调整范围;其中,第二样本数据不仅包括维度的样本数据以及每个维度的样本数据所对应的提交参数的数值,还包括每个维度的数据所对应的掉包率。在本发明实施例中,第二模型也可为SVM。
图2是根据本发明实施例的输入/输出批量提交的示意图,如图2所示,本发明实施例的输入/输出批量提交的步骤包括:
步骤S201:模型学习,以确定出每个维度的各个区间,以及各个区间中每个提交参数的基准值。例如,通过模型学习的过程,可确定出一天哪些时间段为忙的时段,以及确定该时段的缓存大小、数据包大小、提交线程数量以及发包频率。通过该过程,可确定出每个维度的提交参数的基准值。并且,采用机器学习的方式,智能确定提交参数的基准值,提高批量提交IO的性能。
步骤S202:获取当前时段至少一个维度的数据。实时获取数据,进而根据该实时的数据确定出提交参数的数值,使得更能在IO提交的过程中提升IO系统的性能。在本发明实施例中,获取数据的时间可进行设置,例如每隔5分值获取一次维度的数据,也可设置获取机制来获取维度的数据,例如在发现掉包率大于0.01%时获取一次维度的数据。
步骤S203:对获取到的每个维度的数据进行分析,以确定出该维度的数据所在的维度区间。在模型学习的过程中,可确定出每个维度的各个区间,以及各个区间中每个提交参数的基准值,进而在获取到数据之后,对获取到的每个维度的数据进行分析,以确定出该维度的数据所在的维度区间,该区间对应一组提交参数的基准值,进而根据获取到的维度的数据确定出该维度所对应的提交参数的基准值。
步骤S204:根据每个维度的加权值,确定出加权基准值。通过步骤S203确定出每个维度对应的一组提交参数的基准值,根据预设的每个维度的加权值,计算得到加权基准值。例如,获取到的维度的数据包括:时间段、网络传输速度、内部线程、带宽和延迟大小、CPU和内存的数据,则对获取到的维度的数据分析之后,确定出时间段、网络传输速度、内部线程、带宽和延迟大小、CPU和内存分别对应的5组提交参数的基准值,根据时间段、网络传输速度、内部线程、带宽和延迟大小、CPU和内存的加权值,最终确定出一组加权基准值。
步骤S205:对提交参数的数值进行调整,并进行IO的批量提交。通过步骤S204确定出加权基准值之后,将该提交参数的数值调整为该加权基准值,并根据该调整后的加权基准值进行IO的批量提交。该过程实时动态完成,可保证批量提交的吞吐量(性能)和稳定性,解决了现有技术中提交参数不能调整导致系统资源浪费以及提交性能和稳定性低的问题。
步骤S206:记录提交后维度的数据以及其对应的提交参数的数值。提交之后,可记录该提交后的维度的数据,以及提交时的提交参数的数值,该提交时的提交参数的数值即为该记录的维度的数据对应的提交参数的数据。记录上述数据之后,执行上述步骤S201,采用异步线程用SVM将记录的数据作为样本数据进行模型学习,进而可得到一个更精确的基准值,实现实时调整上述确定出的基准值,将调整后的基准值记为动态基准值。在通过SVM确定动态基准值时,采用多项式核函数K(x,y)=[(x·y)+1]^d,采用的开源框架为Libsvm。重复执行上述步骤S201确定出动态基准值值之后,步骤S202获取再次获取到维度的数据之后,可根据该动态基准值确定出提交参数的基准值。
步骤S207:统计掉包率。对于IO提交系统的掉包率进行调整,并且根据该掉包率实时调整提交参数的数值。则在保证IO提交的传输速率的同时,保证提交的掉包率,例如掉包率维持在0.01%以下,如果当前时段的提交参数不能满足该要求,则可根据调整范围(调整的幅度)对提交参数的数值进行调整。
图3是根据本发明实施例输入/输出批量提交的系统的主要模块的示意图,如图3所示,本发明实施例输入/输出批量提交的系统30主要0包括获取模块301、确定模块302和提交模块303。
获取模块301用于,获取当前时段至少一个维度的数据。
确定模块302用于,根据维度所对应的提交参数的基准值,确定出提交参数的数值。确定模块还用于,对获取模块获取到的每个维度的数据进行分析,以确定出该维度所对应的提交参数的基准值;并且根据每个维度的加权值,确定出加权基准值;将提交参数的数值调整为加权基准值。
提交模块303用于,根据确定出的提交参数的数值,进行输入/输出的批量提交。
本发明实施例输入/输出批量提交的系统还包括第一训练模块,用于通过第一训练模型对第一样本数据进行学习,以确定出维度的各个区间,以及各个区间中每个提交参数的基准值;其中,第一样本数据包括:维度的数据以及该维度的数据对应的提交参数的数值。第一训练模块还用于,获取批量提交时的维度的数据,并且记录该维度的数据以及确定出的提交参数的数值;并且,将记录的数据作为第一样本数据。
本发明实施例输入/输出批量提交的系统还包括调整模块,用于按照预设的时间段统计掉包率;以及,根据掉包率以及调整范围,调整提交参数的数值。本发明实施例输入/输出批量提交的系统还包括第二训练模块,用于通过第二模型对第二样本数据进行学习,以确定出掉包率的各个区间,以及各个区间中每个提交参数的基准值的调整范围;其中,第二样本数据包括:维度的数据以及该维度的数据对应的提交参数的数值和掉包率。
维度至少包括以下一种:时间段、网络传输速度、内部线程、带宽和延迟大小、CPU和内存;提交参数至少包括以下一种:缓存大小、数据包大小、提交线程数量以及发包频率。
根据本发明实施例的输入/输出批量提交的系统,可根据提交参数的基准值分析获取到的实时的数据,确定出该提交参数的数值。其中,该提交参数的基准值是通过模型学习确定出的,对于一个维度来说,维度的数值不同,其对应的提交参数的基准值可能会不同。因此能够根据获取的数据实时调整提交参数,提高了输入/输出IO批量提交的性能,减少了CPU占用和IO并发线程数,解决了现有技术中提交参数不能调整导致系统资源浪费以及提交性能和稳定性低的问题。
图4示出了可以应用本发明实施例的输入/输出批量提交的方法或输入/输出批量提交的系统的示例性系统架构400。
如图4所示,系统架构400可以包括终端设备401、402、403,网络404和服务器405。网络404用以在终端设备401、402、403和服务器405之间提供通信链路的介质。网络404可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备401、402、403通过网络404与服务器405交互,以接收或发送消息等。终端设备401、402、403上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备401、402、403可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器405可以是提供各种服务的服务器,例如对用户利用终端设备401、402、403所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果反馈给终端设备。
需要说明的是,本发明实施例所提供的输入/输出批量提交的方法一般由服务器405执行,相应地,输入/输出批量提交的系统一般设置于服务器405中。
应该理解,图4中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图5,其示出了适于用来实现本发明实施例的终端设备的计算机系统500的结构示意图。图5示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、确定模块和提交模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“获取当前时段至少一个维度的数据的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取当前时段至少一个维度的数据;根据提交参数的基准值分析所述维度的数据,以确定出提交参数的数值;根据所述确定出的提交参数的数值,进行输入/输出的批量提交。
根据本发明实施例,可根据提交参数的基准值分析获取到的实时的数据,确定出该提交参数的数值。其中,该提交参数的基准值是通过模型学习确定出的,对于一个维度来说,维度的数值不同,其对应的提交参数的基准值可能会不同。因此能够根据获取的数据实时调整提交参数,提高了输入/输出IO批量提交的性能,减少了CPU占用和IO并发线程数,解决了现有技术中提交参数不能调整导致系统资源浪费以及提交性能和稳定性低的问题。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (16)
1.一种输入/输出批量提交的方法,其特征在于,包括:
获取当前时段至少一个维度的数据;
根据提交参数的基准值分析所述维度的数据,以确定出提交参数的数值;
根据所述确定出的提交参数的数值,进行输入/输出的批量提交。
2.根据权利要求1所述的方法,其特征在于,根据提交参数的基准值分析所述维度的数据,以确定出提交参数的数值的步骤包括:
对获取到的每个维度的数据进行分析,以确定出该维度所对应的提交参数的基准值;
根据每个维度的加权值,确定出加权基准值;
将提交参数的数值调整为所述加权基准值。
3.根据权利要求1所述的方法,其特征在于,在确定出提交参数的数值之前,还包括:
通过第一训练模型对第一样本数据进行学习,以确定出所述维度的各个区间,以及各个区间中每个提交参数的基准值;其中,所述第一样本数据包括:维度的样本数据以及该维度的样本数据所对应的提交参数的数值。
4.根据权利要求3所述的方法,其特征在于,在根据所述确定出的提交参数的数值,进行输入/输出的批量提交之后,还包括:获取批量提交时的维度的数据,并且记录该维度的数据以及所述确定出的提交参数的数值;
则,将所述记录的数据作为所述第一样本数据。
5.根据权利要求1所述的方法,其特征在于,在根据所述确定出的提交参数的数值,进行输入/输出的批量提交之后,还包括:按照预设的时间段统计掉包率;以及,根据所述掉包率和调整范围,调整提交参数的数值。
6.根据权利要求5所述的方法,其特征在于,在根据所述掉包率和调整范围,调整提交参数的数值之前,还包括:
通过第二模型对第二样本数据进行学习,以确定出掉包率的各个区间,以及各个区间中每个提交参数的基准值的调整范围;其中,所述第二样本数据包括:维度的样本数据以及该维度的样本数据所对应的提交参数的数值和掉包率。
7.根据权利要求1-6任一项所述的方法,其特征在于,
所述维度至少包括以下一种:时间段、网络传输速度、内部线程、带宽和延迟大小、CPU和内存;
所述提交参数至少包括以下一种:缓存大小、数据包大小、提交线程数量以及发包频率。
8.一种输入/输出批量提交的系统,其特征在于,包括:
获取模块,用于获取当前时段至少一个维度的数据;
确定模块,用于根据提交参数的基准值分析所述维度的数据,以确定出提交参数的数值;
提交模块,用于根据所述确定出的提交参数的数值,进行输入/输出的批量提交。
9.根据权利要求8所述的系统,其特征在于,所述确定模块还用于,对所述获取模块获取到的每个维度的数据进行分析,以确定出该维度所对应的提交参数的基准值;并且根据每个维度的加权值,确定出加权基准值;将提交参数的数值调整为所述加权基准值。
10.根据权利要求8所述的系统,其特征在于,还包括第一训练模块,用于通过第一训练模型对第一样本数据进行学习,以确定出所述维度的各个区间,以及各个区间中每个提交参数的基准值;其中,所述第一样本数据包括:维度的样本数据以及该维度的样本数据所对应的提交参数的数值。
11.根据权利要求10所述的系统,其特征在于,所述第一训练模块还用于,获取批量提交时的维度的数据,并且记录该维度的数据以及所述确定出的提交参数的数值;并且,将所述记录的数据作为所述第一样本数据。
12.根据权利要求8所述的系统,其特征在于,还包括调整模块,用于按照预设的时间段统计掉包率;以及,根据所述掉包率和调整范围,调整提交参数的数值。
13.根据权利要求12所述的系统,其特征在于,还包括第二训练模块,用于通过第二模型对第二样本数据进行学习,以确定出掉包率的各个区间,以及各个区间中每个提交参数的基准值的调整范围;其中,所述第二样本数据包括:维度的样本数据以及该维度的样本数据所对应的提交参数的数值和掉包率。
14.根据权利要求8-13任一项所述的系统,其特征在于,
所述维度至少包括以下一种:时间段、网络传输速度、内部线程、带宽和延迟大小、CPU和内存;
所述提交参数至少包括以下一种:缓存大小、数据包大小、提交线程数量以及发包频率。
15.一种输入/输出批量提交的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
16.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810116396.4A CN110119364B (zh) | 2018-02-06 | 2018-02-06 | 一种输入/输出批量提交的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810116396.4A CN110119364B (zh) | 2018-02-06 | 2018-02-06 | 一种输入/输出批量提交的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110119364A true CN110119364A (zh) | 2019-08-13 |
CN110119364B CN110119364B (zh) | 2023-04-07 |
Family
ID=67519419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810116396.4A Active CN110119364B (zh) | 2018-02-06 | 2018-02-06 | 一种输入/输出批量提交的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110119364B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114816711A (zh) * | 2022-05-13 | 2022-07-29 | 湖南长银五八消费金融股份有限公司 | 批量任务处理方法、装置、计算机设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020152290A1 (en) * | 2001-04-16 | 2002-10-17 | Ritche Scott D. | Software delivery method with enhanced batch redistribution for use in a distributed computer network |
CN101924728A (zh) * | 2009-09-30 | 2010-12-22 | 南通大学 | 一种基于信道环境判决的传送数据包大小分割方法 |
CN102045765A (zh) * | 2010-12-07 | 2011-05-04 | 南京邮电大学 | 认知的无线网络视频流传输方法 |
CN102929935A (zh) * | 2012-09-25 | 2013-02-13 | 上海证券交易所 | 一种基于事务的大容量数据读写方法 |
CN104679575A (zh) * | 2013-11-28 | 2015-06-03 | 阿里巴巴集团控股有限公司 | 输入输出流的控制系统及其方法 |
CN106571959A (zh) * | 2016-10-26 | 2017-04-19 | 广西瀚特信息产业股份有限公司 | 一种基于云服务的网络分析方法及系统 |
CN106991174A (zh) * | 2017-04-05 | 2017-07-28 | 广东浪潮大数据研究有限公司 | 一种Smart Rack系统数据库的优化方法 |
-
2018
- 2018-02-06 CN CN201810116396.4A patent/CN110119364B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020152290A1 (en) * | 2001-04-16 | 2002-10-17 | Ritche Scott D. | Software delivery method with enhanced batch redistribution for use in a distributed computer network |
CN101924728A (zh) * | 2009-09-30 | 2010-12-22 | 南通大学 | 一种基于信道环境判决的传送数据包大小分割方法 |
CN102045765A (zh) * | 2010-12-07 | 2011-05-04 | 南京邮电大学 | 认知的无线网络视频流传输方法 |
CN102929935A (zh) * | 2012-09-25 | 2013-02-13 | 上海证券交易所 | 一种基于事务的大容量数据读写方法 |
CN104679575A (zh) * | 2013-11-28 | 2015-06-03 | 阿里巴巴集团控股有限公司 | 输入输出流的控制系统及其方法 |
CN106571959A (zh) * | 2016-10-26 | 2017-04-19 | 广西瀚特信息产业股份有限公司 | 一种基于云服务的网络分析方法及系统 |
CN106991174A (zh) * | 2017-04-05 | 2017-07-28 | 广东浪潮大数据研究有限公司 | 一种Smart Rack系统数据库的优化方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114816711A (zh) * | 2022-05-13 | 2022-07-29 | 湖南长银五八消费金融股份有限公司 | 批量任务处理方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110119364B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109523187A (zh) | 任务调度方法、装置和设备 | |
CN109189835A (zh) | 实时生成数据宽表的方法和装置 | |
CN110019087A (zh) | 数据处理方法及其系统 | |
CN103970604A (zh) | 基于MapReduce架构实现图处理的方法和装置 | |
CN108959399A (zh) | 分布式数据删除流控方法、装置、电子设备及存储介质 | |
CN110413812A (zh) | 神经网络模型的训练方法、装置、电子设备及存储介质 | |
CN109388654A (zh) | 一种查询数据表的方法和装置 | |
CN109669774A (zh) | 硬件资源的量化方法、编排方法、装置及网络设备 | |
CN109002925A (zh) | 业务量预测方法和装置 | |
CN110427304A (zh) | 用于银行系统的运维方法、装置、电子设备以及介质 | |
CN109582452A (zh) | 一种容器调度方法、调度装置及电子设备 | |
US20220391780A1 (en) | Method of federated learning, electronic device, and storage medium | |
WO2021109665A1 (zh) | 一种数据处理装置、方法、基站和存储介质 | |
CN110389812A (zh) | 用于管理虚拟机的方法、设备和计算机可读存储介质 | |
CN110019367A (zh) | 一种统计数据特征的方法和装置 | |
CN110309142A (zh) | 规则管理的方法和装置 | |
Li et al. | Hone: Mitigating stragglers in distributed stream processing with tuple scheduling | |
CN109960212A (zh) | 任务发送方法和装置 | |
US20220413906A1 (en) | Method, device, and program product for managing multiple computing tasks based on batch | |
CN108090018A (zh) | 数据交换方法及系统 | |
CN108959636A (zh) | 数据处理方法、装置、系统、计算机可读介质 | |
CN110472190A (zh) | 填充有序序列的方法和装置 | |
CN110119364A (zh) | 一种输入/输出批量提交的方法和系统 | |
CN113890842A (zh) | 一种信息传输时延上界计算方法、系统、设备和存储介质 | |
CN108762684A (zh) | 热点数据迁移流控方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |