WO2021179170A1

WO2021179170A1 - 数据推送方法、装置、服务器及存储介质

Info

Publication number: WO2021179170A1
Application number: PCT/CN2020/078634
Authority: WO
Inventors: 程际
Original assignee: 深圳市欢太科技有限公司; Oppo广东移动通信有限公司
Priority date: 2020-03-10
Filing date: 2020-03-10
Publication date: 2021-09-16
Also published as: CN115004168A

Abstract

本申请公开了一种数据推送方法、装置、服务器及存储介质，该数据推送方法包括：获取业务端发送的数据查询请求；根据所述数据查询请求，获取数据查询结果对应的多个查询句柄；将所述多个查询句柄中的每个查询句柄分配给一个线程，每个查询句柄对应的线程不同；每个线程根据对应的查询句柄，拉取数据查询结果的同时将所述数据查询结果发送至所述业务端。本方法可以实现快速的推送查询结果至业务端。

Description

数据推送方法、装置、服务器及存储介质

技术领域

本申请涉及数据处理技术领域，更具体地，涉及一种数据推送方法、装置、服务器及存储介质。

背景技术

随着网络信息技术的快速发展，基于大数据技术的信息推荐技术也应运而生。信息推荐技术中主要依据用户的标签数据而进行相关信息的推荐，在信息推荐中通常会存在业务方对标签数据进行查询，而从数据库中拉取和发送数据时需要花费较多时间。

发明内容

鉴于上述问题，本申请提出了一种数据推送方法、装置、服务器及存储介质。

第一方面，本申请实施例提供了一种数据推送方法，所述方法包括：获取业务端发送的数据查询请求；根据所述数据查询请求，获取数据查询结果对应的多个查询句柄；将所述多个查询句柄中的每个查询句柄分配给一个线程，每个查询句柄对应的线程不同；每个线程根据对应的查询句柄，拉取数据查询结果的同时将所述数据查询结果发送至所述业务端。

第二方面，本申请实施例提供了一种数据推送装置，所述装置包括：请求获取模块、句柄获取模块、句柄分配模块以及数据发送模块，其中，所述请求获取模块用于获取业务端发送的数据查询请求；所述句柄获取模块用于根据所述数据查询请求，获取数据查询结果对应的多个查询句柄；所述句柄分配模块用于将所述多个查询句柄中的每个查询句柄分配给一个线程，每个查询句柄对应的线程不同；所述数据发送模块用于每个线程根据对应的查询句柄，拉取数据查询结果的同时将所述数据查询结果发送至所述业务端。

第三方面，本申请实施例提供了一种服务器，包括：一个或多个处理器；存储器；一个或多个应用程序，其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序配置用于执行上述第一方面提供的数据推送方法。

第四方面，本申请实施例提供了一种计算机可读取存储介质，所述计算机可读取存储介质中存储有程序代码，所述程序代码可被处理器调用执行上述第一方面提供的数据推送方法。

本申请提供的方案，通过获取业务端发送的数据查询请求，根据该查询请求，获取数据查询结果对应的多个查询句柄，将多个查询句柄中的每个查询句柄分配给一个线程，其中，每个查询句柄对应的线程不同，然后每个线程根据对应的查询句柄，拉取数据查询结果的同时将数据查询结果发送至业务端，从而可以实现并行的拉取和发送数据，提升数据推送的速度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了根据本申请一个实施例的数据推送方法流程图。

图2示出了根据本申请另一个实施例的数据推送方法流程图。

图3示出了根据本申请又一个实施例的数据推送方法流程图。

图4示出了根据本申请再一个实施例的数据推送方法流程图。

图5示出了根据本申请一个实施例的数据推送装置的一种框图。

图6是本申请实施例的用于执行根据本申请实施例的数据推送方法的服务器的框图。

图7是本申请实施例的用于保存或者携带实现根据本申请实施例的数据推送方法的程序代码的存储单元。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

在信息推送中，通常存在业务方对标签数据进行查询的情况，数据端根据业务方的数据需求，从数据库中拉取数据并发送至业务方。从而业务方可以根据获得的数据，进行推送内容的确定、推送对象的确定等。

在传统的数据拉取和发送的方案中，通常会将所有数据从数据库中读取到内存，再从内存发送到业务方。这样的方案简单明了，实现了数据的导出。

发明人经过长期研究发现，在传统的数据导出的方案中，随着业务方数量和需求的持续增长，业务方需求的数据越来越多，数据端将海量的查询结果读取到内存，不仅非常耗时，而且容易触发内存溢出。例如：某业务方需要导出同时安装了应用A和应用B的用户，这样的条件是非常容易圈取到2亿多的用户的，这样的亿级数量级的用户信息的导出，目前的技术方案发送速度很慢且有宕机风险。

针对上述问题，发明人提出了本申请实施例提供的数据推送方法、装置、服务器以及存储介质，通过将数据查询结果对应的多个查询句柄，分片至不同线程，每个线程根据分片的查询句柄，并行的拉取数据的同时将数据发送至业务端。其中，具体的数据推送方法在后续的实施例中进行详细的说明。

请参阅图1，图1示出了本申请一个实施例提供的数据推送方法的流程示意图。在具体的实施例中，所述数据推送方法应用于如图5所示的数据推送装置400以及配置有所述数据推送装置400的服务器100(图6)。下面将以服务器为例，说明本实施例的具体流程，当然，可以理解的，本实施例所应用的服务器可以为传统服务器、云服务器等，在此不做限定。下面将针对图1所示的流程进行详细的阐述，所述数据推送方法具体可以包括以下步骤：

步骤S110：获取业务端发送的数据查询请求。

在本申请实施例中，业务端在需要进行数据的查询时，可以向服务器发送数据查询请求。对应的，服务器可以接收业务端发送数据查询请求，并且对数据查询请求进行响应，将相应的数据返回至业务端。

在一些实施方式中，数据查询请求中可以携带有业务端对应的业务方的数据需求，例如可以携带有查询条件。查询条件中可以包括一个或多个条件。例如，业务方想对同时安装了应用1和应用2，但未安装应用3的用户进行广告投放，设置的查询条件为同时安装了应用1和应用2，但未安装应用3的用户；又例如，游戏公司向提升近期的比较活跃的游戏玩家的留存率，想要对近期比较活跃的游戏玩家投放游戏奖励，设置的查询条件为最近一周内游戏时长超过24小时或者登陆次数超过10次的用户。

在一些实施方式中，业务端发送的数据查询请求可以是用于获取标签数据的请求，也可以是用于获取其他类型的数据的请求，例如，获取文档数据等。数据查询请求用于获取的数据的类型可以不作为限定。

步骤S120：根据所述数据查询请求，获取数据查询结果对应的多个查询句柄。

在本申请实施例中，服务器在获取到数据查询请求之后，可以根据数据查询请求，确定数据查询结果。其中，数据查询结果可以包括数据查询请求对应的数据。也就是说，服务器可以根据数据查询请求中携带的需求信息，确定哪些数据满足该需求信息。例如，数据查询请求为用于查询标签数据的请求，且数据查询请求中携带有安装有应用A和应用B的用户，则服务器可以确定出安装有应用A和应用B的用户有哪些。又例如，数据查询请求为用于查询文档数据的请求，且数据查询请求中携带有包括关键词A和B，则服务器可以确定出哪些文档包括关键词A和B。

在本申请实施例中，服务器在根据数据查询请求确定出数据查询结果之后，可以根据数据查询结果，确定数据查询结果所对应的查询句柄。其中，查询句柄可以为用于读取数据查询结果的信息。查询句柄可以包括存储位置、数据的标识、字段等。根据查询句柄，可以读取到相应的数据查询结果。服务器中可以预先存储有各个数据对应的查询句柄，服务器可以根据数据查询结果中包括的数据，确定数据查询结果对应的查询句柄。

在一些实施方式中，服务器可以根据数据查询结果，将数据查询结果分为多部分的数据查询结果，并确定各个部分的数据查询结果所对应的查询句柄，从而可以获得数据查询结果对应的多个查询句柄。可以理解的，获得的多个查询句柄，可以分别用于读取数据，根据多个查询句柄读取的数据，可以构成完整的数据查询结果。

作为一种实施方式，服务器可以根据数据查询结果中数据分布的位置，而将数据查询结果分为多个部分，并确定各个部分所对应的查询句柄。例如，数据查询结果对应的数据存储于数据库集群，因此可以确定出存储有数据查询结果的多个数据库，并根据多个数据库中包括的数据查询结果，确定查询句柄。又例如，数据查询结果对应的数据存储于数据库中的不同分片中，因此可以确定出数据查询结果所在的多个分片，并根据多个分片中存在的数据查询结果，确定查询句柄。

作为另一种实施方式，服务器也可以根据数据查询结果中不同的类型的数据，对数据查询结果进行划分，并根据划分的结果，确定各个部分的数据查询结果所对应的查询句柄。

当然，具体获取数据查询结果对应的多个查询句柄的方式可以不作为限定。

步骤S130：将所述多个查询句柄中的每个查询句柄分配给一个线程，每个查询句柄对应的线程不同。

在本申请实施例中，服务器在确定出数据查询结果对应的多个查询句柄之后，可以针对每个查询句柄，分配一个不同的线程，以便从数据库中读取数据后发送至业务端。

在一些实施方式中，服务器中可以创建有线程池，服务器可以从线程池中为每个查询句柄分配一个不同的线程，每个线程用于单独的从数据库读取其分配的查询句柄所对应的数据查询结果的数据。

步骤S140：每个线程根据对应的查询句柄，拉取数据查询结果的同时将所述数据查询结果发送至所述业务端。

在本申请实施例中，服务器在对每个查询句柄分配一个线程之后，每个线程可以根据其分配的查询句柄，从数据库中拉取数据查询结果，并且在边拉取数据的同时，将数据发送至业务端，避免一次性拉取完数据之后再进行发送，导致占用的内存过多，而引起内存溢出。例如，业务端为kafka时，每个线程拉取数据之后，将数据发送至kafka。

本申请实施例提供的数据推送方法，通过获取业务端发送的数据查询请求，根据该查询请求，获取数据查询结果对应的多个查询句柄，将多个查询句柄中的每个查询句柄分配给一个线程，其中，每个查询句柄对应的线程不同，然后每个线程根据对应的查询句柄，拉取数据查询结果的同时将数据查询结果发送至业务端，从而可以实现并行的拉取和发送数据，提升数据推送的速度。并且，各个线程在拉取和发送数据时，采用边拉取边发送的方式，可以不占用过多的内存，保证程序的稳定运行。

请参阅图2，图2示出了本申请另一个实施例提供的数据推送方法的流程示意图。该数据推送方法可应用于上述服务器，下面将针对图2所示的流程进行详细的阐述，所述数据推送方法具体可以包括以下步骤：

步骤S210：获取业务端发送的数据查询请求。

在本申请实施例中，步骤S210可以参阅前述实施例的内容，在此不再赘述。

步骤S220：根据所述数据查询请求，确定数据查询结果所对应的多个分片。

在本申请实施例中，在存储数据到数据库时，可以对数据进行分片。具体地，可以利用ElasticSearch(ES)的分片功能进行数据的分片。其中，ElasticSearch(ES)是一种分布式的搜索引擎，一个ES集群由一个或多个节点组成，一个ES实例为一个节点。ES中的一个索引为文档的集合，每个索引有一个或多个分片，索引的数据被分配存放到各个分片上。分片可以理解为数据的最小单元块，写入数据库中的数据被分配存在分片上。具体的，ES中可以创建索引，每个索引可以对应有多个分片，多个分片可能在相同节点，也可能在不同节点，例如，假设索引IndexA有2个分片，在向IndexA中插入10条数据(10个文档)，那么这10条数据中可以分为5条存储在第一个分片，剩下的5条会存储在另一个分片中。索引对应的数据可以存储于其对应的分片中，当需要查询数据时，可以从索引对应的分片中查询数据。

在本申请实施例中，服务器在确定数据查询结果对应的多个查询句柄时，可以确定数据查询结果中数据所对应的分片。在一些实施方式中，业务端发送的数据查询请求中可以携带有查询条件。服务器可以根据查询条件，提取查询条件中的特征，并且根据确定与特征匹配的数据，作为数据查询结果。在确定出数据查询结果后，服务器确定数据查询结果中数据所在的分片。可以理解的，服务器中可以存储有各个数据的信息，以及各个数据所在的分片，基于此，服务器可以根据查询条件确定出满足查询条件的数据查询结果，并确定出数据所在的分片。

在一些实施方式中，服务器可以根据数据查询请求，确定数据查询结果对应的索引，并获取索引对应的多个分片。可以理解的，服务器可以根据确定出的数据查询结果，查找数据查询结果所对应的索引，并根据索引的信息，确定索引对应的多个分片。例如，数据查询结果中包括索引1以及索引2，并确定出索引1以及索引2的分片的ID。

步骤S230：确定每个分片所对应的部分数据查询结果的查询句柄，获得多个查询句柄。

在本申请实施例中，服务器在确定出数据查询结果所对应的多个分片之后，可以确定每个分片所对应的部分数据查询结果的查询句柄，获得多个查询句柄。其中，查询句柄可以为用于读取数据查询结果的信息。查询句柄可以包括存储位置、数据的标识、字段等。

在一些实施方式中，获取每个分片所对应的部分数据查询结果的标识信息，将标识信息作为查询句柄，获得多个查询句柄。可以理解的，通过标识消息，可以从相应的分片中读取数据。利用各个查询句柄从相应的分片拉取出的数据，可以构成完整的数据查询结果。

步骤S240：将所述多个查询句柄中的每个查询句柄分配给一个线程，每个查询句柄对应的线程不同。

在本申请实施例中，步骤S240可以参阅前述实施例的内容，在此不再赘述。

步骤S250：每个线程根据对应的查询句柄，在拉取预设数据量的数据后，将拉取到的数据发送至所述业务端。

在本申请实施例中，服务器在对每个查询句柄分配一个线程之后，每个线程可以根据其分配的查询句柄，从数据库中拉取数据查询结果，并且在边拉取数据的同时，将数据发送至业务端。具体地，每个线程可以分多次从数据库中拉取数据。其中，每个线程可以根据查询句柄，从相应的分片中拉取数据，也就是说，每个查询句柄都与一个分片中的部分数据查询结果相对应，因此每个线程在根据查询句柄拉取数据时，是从查询句柄对应的分配中拉取数据。具体地，可以根据preference参数来决定取出的分片的，如果参数以_shards开头，则表示只查询指定的分片，因此每个线程可以通过对以_shards开头的参数进行限定，以从相应的分配拉取数据。

在一些实施方式中，每个线程根据对应的查询句柄，可以通过ElasticSearch的scroll游标功能，来实现拉取数据查询结果的同时将数据查询结果发送至业务端。可以理解的，如果我们要把大批量的数据从ES集群中取出，一次性取出会导致IO压力过大，性能容易出问题，而分页查询又容易造成深度分页(deep paging)的问题，因此可以使用ES的scroll查询，一批一批的查，直到所有数据都查询完。例如，查询的数据为用户身份标识，每个线程用自己分配到的查询句柄查询到一定量的用户身份标识，组成一片消息发送到Kafka，从而实现每个分片查询句柄内的分批发送。

在一些实施方式中，每个线程可以根据对应的查询句柄，在拉取预设数据量的数据后，将拉取到的数据发送至业务端。也就是说，每个线程在拉取到一批数据之后，将拉取到的数据存入内存，然后从再从内存中将拉取到的数据进行发送。

在该实施方式下，服务器还可以在进行拉取数据之前，确定每次需要拉取的数据量，也就是上述预设数据量。

作为一种实施方式，服务器可以获取当前的剩余内存值，根据剩余内存值，确定预设数据量。可以理解的，采用边拉取边发送的方式，分批次拉取和发送数据，主要考虑到服务器的内存可能被拉取的数据占用较多，而导致运行崩溃的问题。因此，可以根据服务器当前剩余的内存值，确定每次拉取的预设数据量。

在该实施方式中，服务器根据当前的剩余内存值，确定预设数据量，可以包括：判断所述剩余内存值是否大于指定内存值；如果所述剩余内存值大于所述指定内存值，则将第一数据量作为所述预设数据量；如果所述剩余内存值小于所述指定内存值，则将第二数据量作为所述预设数据量，所述第二数据量小于所述第一数据量。其中，指定内存值可以作为判断服务器当前内存使用情况是否占用较多的标准，如果剩余内存值大于指定内存值，则表示服务器当前的剩余内存较多，因此，可以选择相对第二数据量较大的第一数据量作为预设数据量；如果剩余内存值小于或等于指定内存值，则表示服务器当前的剩余内存较少，其内存比较紧张，因此可以使用相对第一数据量较小的第二数据量来作为预设数据量。

进一步地，以上第一数据量以及第二数据量均小于指定内存值。在确定第一数据量以及第二数据量时，服务器可以根据剩余内存值，确定剩余内存值大于指定内存值的情况下可分配的内存，并计算可分配的内存与多个查询句柄对应的线程数量的比值，将该比值作为第一数据量。服务器还可以根据剩余内存值，确定剩余内存值小于或等于指定内存值的情况下可分配的内存，并计算可分配的内存与多个查询句柄对应的线程数量的比值，将该比值作为第一数据量。可以理解的，剩余内存值在大于指定内存值的情况下可分配的内存，应当大于剩余内存值小于或等于指定内存值的情况下可分配的内存，因此确定的第一数据量应当比第二数据量大。

当然，第一数据量以及第二数据量也可以为预先设置于服务器中。另外，第一数据量应当满足：多个查询句柄对应的线程在拉取数据时，存入内存的总的数据量小于指定内存值；第二数据量应当满足：多个查询句柄对应的线程在拉取数据时，存入内存的总的数据量小于剩余内存值。

在该实施方式中，服务器根据当前的剩余内存值，确定预设数据量，可以包括：根据预先设定的内存值与预设数据量的对应关系，获取剩余内存值所对应的预设数据量。其中，可以预先根据实验来确定不同内存值，所能支持的缓存数据量，以建立内存值与预设数据量的对应关系。需要说明的是，根据该对应关系确定出的预设数据量，均能满足服务器中程序的正常运行。

在该实施方式中，通过服务器的内存值来确定预设数据量，在分批次拉取数据量，避免内存占用过多的问题的基础上，进一步的保证了服务器内存不会占用过多的问题，保证了服务器的正常运行。

在一些实施方式中，服务器也可以根据数据查询结果的总数据量，以及指定拉取次数，获取总数据量与指定拉取次数的比值，将比值作为预设数据量。可以理解的，服务器中可以设置有指定拉取次数，该指定拉取次数为每个线程从分片中拉取数据的总次数。指定拉取次数的设置可以满足不同场景的需求，也能保证数据拉取次数不会过多，而导致整体导出数据的时间过长。拉取次数可以为用户设置，也可以根据当前读取数据和发送的速度来确定。

步骤S260：重复所述每个线程根据对应的查询句柄，在拉取预设数据量的数据后，将拉取到的数据发送至所述业务端，直至所述数据查询结果对应的数据全部发送至所述业务端。

在本申请实施例中，重复步骤S250，直至数据查询结果中的全部读取完毕，并发送至业务端，从而完成了分批次的拉取和发送数据，能够实现边拉取数据边发送数据的效果，避免了拉取的数据对内存占用较多的问题。

本申请实施例提供的数据推送方法，通过获取业务端发送的数据查询请求，根据该数据查询请求，确定数据查询结果所对应的多个分片，然后确定每个分片所对应的部分数据查询结果的查询句柄，获得多个查询句柄，再将多个查询句柄中的每个查询句柄分配给一个线程，其中，每个查询句柄对应的线程不同，然后每个线程根据对应的查询句柄，分批次的拉取数据并发送至业务端，直至数据查询结果中所有数据发送至业务端，从而可以实现并行的拉取和发送数据，提升数据推送的速度，并且，各个线程在拉取和发送数据时，采用边拉取边发送的方式，可以不占用过多的内存，保证程序的稳定运行，进而总体大幅的提升了数据的导出速度，实际应用中，亿级数据的导出时长可以做到从半小时缩短到2分钟，将数据全部发送到业务端。

请参阅图3，图3示出了本申请又一个实施例提供的数据推送方法的流程示意图。该数据推送方法可应用于上述服务器，下面将针对图3所示的流程进行详细的阐述，所述数据推送方法具体可以包括以下步骤：

步骤S310：获取业务端发送的数据查询请求。

步骤S320：判断数据查询结果的总数据量是否大于指定数据量。

在本申请实施例中，服务器在获取到数据查询请求之后，可以根据数据查询请求，确定数据查询结果，然后确定数据查询结果的总数据量，也就是数据查询结果中所有数据的数据大小。服务器再将数据查询结果的总数据量与指定数据量进行比较，并根据比较结果，确定总数据量是否大于指定数据量。其中，指定数据量用于作为确定数据查询结果中数据量是否较大的标准，如果总数据量大于指定数据量，则表示此次需要进行推送的数据量较大，因此可以执行步骤S340至步骤S360，即确定多个查询句柄之后，利用多个线程根据分配的查询句柄从分区中分批读取数据，然后发送至业务端，实现并行拉取数据，提升数据的导出速度，并在边发送数据的同时边发送数据，避免内存占用过多的问题。如果总数据量小于或等于指定数据量，则表示此次需要进行推送的数据量不多，因此可以执行步骤S330，也就是将从数据库中读取全部的数据查询结果之后，将数据存入内存，再从内存中将数据发送至业务端。其中，指定数据量的具体数值不作为限定，应当理解的是，总数据量小于或等于指定数据量，将数据查询结果的全部数据存入内存，不会出现内存占用过多，而导致运行崩溃的情况。

步骤S330：从数据库中读取全部的数据查询结果之后，将数据查询结果发送至所述业务端。

如果总数据量小于或等于指定数据量，执行步骤S330。

步骤S340：根据所述数据查询请求，获取数据查询结果对应的多个查询句柄。

如果总数据量小于或等于指定数据量，执行步骤S340至步骤S360。

步骤S350：将所述多个查询句柄中的每个查询句柄分配给一个线程，每个查询句柄对应的线程不同。

步骤S360：每个线程根据对应的查询句柄，拉取数据查询结果的同时将所述数据查询结果发送至所述业务端。

在本申请实施例中，步骤S330至步骤S360可以参阅前述实施例的内容，在此不再赘述。

本申请实施例提供的数据推送方法，通过获取业务端发送的数据查询请求，根据该查询请求，判读数据查询结果的总数据量是否大于指定数据量，如果大于指定数据量，获取数据查询结果对应的多个查询句柄，将多个查询句柄中的每个查询句柄分配给一个线程，其中，每个查询句柄对应的线程不同，然后每个线程根据对应的查询句柄，拉取数据查询结果的同时将数据查询结果发送至业务端，从而在数据查询结果的总数据量大于指定数据量时，可以实现并行的拉取和发送数据，提升数据推送的速度，并且，各个线程在拉取和发送数据时，采用边拉取边发送的方式，可以不占用过多的内存，保证程序的稳定运行。

请参阅图4，图4示出了本申请再一个实施例提供的数据推送方法的流程示意图。该数据推送方法可应用于上述服务器，下面将针对图4所示的流程进行详细的阐述，所述数据推送方法具体可以包括以下步骤：

步骤S410：获取业务端发送的数据查询请求。

步骤S420：根据所述数据查询请求，获取数据查询结果对应的多个查询句柄。

在本申请实施例中，步骤S410以及步骤S420可以参阅前述实施例的内容，在此不再赘述。

步骤S430：获取线程池中的可用线程。

在本申请实施例中，服务器可以利用线程池，来对查询句柄分配线程。其中，线程池是一种多线程处理形式，可以将任务分配给线程，线程可以自动对任务进行执行。服务器中可以预先创建有线程池，或者在需要进行数据推送时创建线程池。例如，服务器可以通过使用ThreadPoolExecutor类创建线程池，也可以通过使用Executors类创建线程池，具体创建线程池的方式可以不作为限定。

在一些实施方式中，服务器可以获取线程池中的可用线程，其中，可用线程可以指处于空闲状态的线程，也就是未有待执行任务的线程。可用线程可以用于分配查询句柄，以执行从分区拉取数据的任务。

步骤S440：将所述多个查询句柄中的每个查询句柄分配给所述可用线程中的一个线程。

在本申请实施例中，服务器在从线程池中确定出可用线程之后，则可以对可用线程中的线程分配一个查询句柄，其中，每个查询句柄应当保证分配到一个可用线程，以保证数据查询结果能够全部被拉取出来进行发送。

在一些实施方式中，服务器在确定出可用线程之后，还可以确定可用线程的数量，将该数量与多个查询句柄对应的数量进行比较，根据比较结果确定可用线程的数量是否小于多个查询句柄对应的数量。如果可用线程的数量大于或等于多个查询句柄对应的数量，则表示当前的可用线程可以保证每个查询句柄被分配到一个不同的线程，因此可以将多个查询句柄中的每个查询句柄分配给可用线程中的一个线程。如果可用线程的数量小于多个查询句柄对应的数量，则表示当前的可用线程不能保证每个查询句柄被分配到一个不同的线程。此时，需要保证所有的查询句柄能够被分配给线程，以完成全部数据查询结果的拉取和发送。

作为一种实施方式，如果可用线程的数量小于多个查询句柄对应的数量时，可用于线程池中创建目标数量的线程，其中，该目标数量与所述可用线程的数量的和值大于或等于多个查询句柄对应的数量。其中，服务器可以请求分配处理器的可用资源，以创建目标数量的新线程到线程池中，并且目标数量与所述可用线程的数量的和值大于或等于多个查询句柄对应的数量，从而创建线程后，可用线程的数量能够保证每个查询句柄被分配到一个不同的线程。

在该实施方式中，服务器在创建线程到线程池中之前，还可以获取处理器的负载率，然后将负载率与指定负载率进行比较，根据比较结果确定负载率是否小于指定负载率。其中，指定负载率用于确定处理器的负载是否较高，如果如果负载率小于指定负载率，表示处理器的负载不高，因此可以只需于线程池中创建目标数量的线程。如果如果负载率大于或等于指定负载率，则表示处理器的负载较高，不适于创建新的线程到线程池中。

在一些实施方式中，如果负载率大于或等于指定负载率，服务器可以采用将至少两个查询句柄分别给同一线程的方式，保证所有查询句柄均被分配到线程，使数据查询结果对应的数据能被全部拉取和发送。

作为一种实施方式，如果负载率大于或等于指定负载率，服务器可以确定多个查询句柄中每个查询句柄对应的部分数据查询结果的数据量，然后根据数据量来将至少两个查询句柄分别给同一线程，并且使得每个线程拉取和发送的数据量的大小基本保持一致。

例如，有8个查询句柄，分别为查询句柄1、查询句柄2、查询句柄3、查询句柄4、查询句柄5、查询句柄6、查询句柄7、查询句柄8，查询句柄1对应的数据量为100兆(Mb)，查询句柄2对应的数据量为200Mb，查询句柄3对应的数据量为400Mb，查询句柄4对应的数据量为300Mb，查询句柄5对应的数据量为200Mb，查询句柄6对应的数据量为150Mb，查询句柄7对应的数据量为150Mb，查询句柄8对应的数据量为110Mb。则可以将查询句柄1以及查询句柄4分配至同一个线程，将查询句柄2和查询句柄5分配至同一个线程，将查询句柄4分配至同一个线程，将查询句柄6、查询句柄7和查询句柄8分配至同一个线程，从而使得每个线程需要拉取的数据量为400Mb左右。

在一些实施方式中，如果负载率大于或等于指定负载率时，服务器也可以确定当前非空闲的线程所执行的任务的优先级，可将优先级不高的任务对应的线程分配查询句柄，以进行数据拉取和发送，在完成本次的数据推送之后，这些线程再执行此前的任务。其中，优先级可以根据任务的实时性确定，例如，根据数据类型来确定实时性。

步骤S450：每个线程根据对应的查询句柄，拉取数据查询结果的同时将所述数据查询结果发送至所述业务端。

在本申请实施例中，步骤S450可以参阅前述实施例的内容，在此不再赘述。

本申请实施例提供的数据推送方法，通过获取业务端发送的数据查询请求，根据该查询请求，获取数据查询结果对应的多个查询句柄，然后获取线程池中的可用线程，再将多个查询句柄中的每个查询句柄分配给可用线程中的一个线程，并且保证每个查询句柄对应的线程不同，然后每个线程根据对应的查询句柄，拉取数据查询结果的同时将数据查询结果发送至业务端，从而可以实现并行的拉取和发送数据，提升数据推送的速度。并且，各个线程在拉取和发送数据时，采用边拉取边发送的方式，可以不占用过多的内存，保证程序的稳定运行。

请参阅图5，其示出了本申请实施例提供的一种数据推送装置400的结构框图。该数据推送装置400应用上述的服务器，该数据推送装置400包括：请求获取模块410、句柄获取模块420、句柄分配模块430以及数据发送模块440。其中，请求获取模块410用于获取业务端发送的数据查询请求；所述句柄获取模块420用于根据所述数据查询请求，获取数据查询结果对应的多个查询句柄；所述句柄分配模块430用于将所述多个查询句柄中的每个查询句柄分配给一个线程，每个查询句柄对应的线程不同；所述数据发送模块440用于每个线程根据对应的查询句柄，拉取数据查询结果的同时将所述数据查询结果发送至所述业务端。

在一些实施方式中，句柄获取模块420可以包括：分配确定单元以及句柄确定单元。分片确定单元用于根据所述数据查询请求，确定数据查询结果所对应的多个分片；句柄确定单元用于确定每个分片所对应的部分数据查询结果的查询句柄，获得多个查询句柄。

在该实施方式中，分片确定单元可以具体用于：根据所述数据查询请求，获取满足所述查询条件的数据查询结果所在的分片。

在该实施方式中，分片确定单元可以具体用于：根据所述数据查询请求，确定数据查询结果对应的索引；获取所述索引对应的多个分片。

在该实施方式中，数据推送装置400还可以包括：数据分片模块。数据分片模块可以用于对存储至数据库的数据进行分片。

在该实施方式中，句柄确定单元可以具体用于：获取每个分片所对应的部分数据查询结果的标识信息，将所述标识信息作为查询句柄，获得多个查询句柄。

在一些实施方式中，数据发送模块440可以具体用于：每个线程根据对应的查询句柄，在拉取预设数据量的数据后，将拉取到的数据发送至所述业务端；重复所述每个线程根据对应的查询句柄，在拉取预设数据量的数据后，将拉取到的数据发送至所述业务端，直至所述数据查询结果对应的数据全部发送至所述业务端。

在一些实施方式中，数据发送模块440还可以用于：获取当前的剩余内存值；根据所述剩余内存值，确定所述预设数据量。

在该实施方式中，数据发送模块440根据所述剩余内存值，确定所述预设数据量可以包括：判断所述剩余内存值是否大于指定内存值；如果所述剩余内存值大于所述指定内存值，则将第一数据量作为所述预设数据量；如果所述剩余内存值小于所述指定内存值，则将第二数据量作为所述预设数据量，所述第二数据量小于所述第一数据量。

在一些实施方式中，数据发送模块440还可以用于：根据所述数据查询结果的总数据量，以及指定拉取次数，获取所述总数据量与所述指定拉取次数的比值，将所述比值作为所述预设数据量。

在一些实施方式中，数据发送模块440可以具体用于：每个线程根据对应的查询句柄，通过ElasticSearch的scroll游标功能实现拉取数据查询结果的同时将所述数据查询结果发送至所述业务端。

在一些实施方式中，数据推送装置400还可以包括数据量判断模块。数据量判断模块用于在所述根据所述数据查询请求，获取数据查询结果对应的多个查询句柄之前，判断所述数据查询结果的总数据量是否大于指定数据量。如果所述总数据量大于所述指定数据量，则句柄获取模块420根据所述数据查询请求，获取数据查询结果对应的多个查询句柄。

在一些实施方式中，数据发送模块440还可以用于如果所述总数据量小于或等于所述指定数据量，则从数据库中读取全部的数据查询结果之后，将数据查询结果发送至所述业务端。

在一些实施方式中，句柄分配模块可以包括：线程获取单元以及分配单元。线程获取单元用于获取线程池中的可用线程；分配单元用于将所述多个查询句柄中的每个查询句柄分配给所述可用线程中的一个线程。

在该实施方式中，句柄分配模块还可以包括：线程判断单元。线程判断单元用于判断所述可用线程的数量是否小于所述多个查询句柄对应的数量。如果所述可用线程的数量大于或等于所述多个查询句柄对应的数量，则分配单元将所述多个查询句柄中的每个查询句柄分配给所述可用线程中的一个线程。

在该实施方式中，句柄分配模块还可以包括线程创建单元。线程创建单元用于如果所述可用线程的数量小于所述多个查询句柄对应的数量，于所述线程池中创建目标数量的线程，其中，所述目标数量与所述可用线程的数量的和值大于或等于多个查询句柄对应的数量。

在该实施方式中，线程创建单元可以具体用于：获取处理器的负载率；如果所述负载率小于指定负载率，于所述线程池中创建目标数量的线程。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，模块相互之间的耦合可以是电性，机械或其它形式的耦合。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

综上所述，本申请提供的方案，通过获取业务端发送的数据查询请求，根据该查询请求，获取数据查询结果对应的多个查询句柄，将多个查询句柄中的每个查询句柄分配给一个线程，其中，每个查询句柄对应的线程不同，然后每个线程根据对应的查询句柄，拉取数据查询结果的同时将数据查询结果发送至业务端，从而可以实现并行的拉取和发送数据，提升数据推送的速度。

请参考图6，其示出了本申请实施例提供的一种服务器的结构框图。该服务器100可以是传统服务器、云服务器等能够运行应用程序的服务器。本申请中的服务器100可以包括一个或多个如下部件：处理器110、存储器120、触摸屏130以及一个或多个应用程序，其中一个或多个应用程序可以被存储在存储器120中并被配置为由一个或多个处理器110执行，一个或多个程序配置用于执行如前述方法实施例所描述的方法。

处理器110可以包括一个或者多个处理核。处理器110利用各种接口和线路连接整个服务器100内的各个部分，通过运行或执行存储在存储器120内的指令、程序、代码集或指令集，以及调用存储在存储器120内的数据，执行服务器100的各种功能和处理数据。可选地，处理器110可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable Logic Array，PLA)中的至少一种硬件形式来实现。处理器110可集成中央处理器(Central Processing Unit，CPU)、图像处理器(Graphics Processing Unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器110中，单独通过一块通信芯片进行实现。

存储器120可以包括随机存储器(Random Access Memory，RAM)，也可以包括只读存储器(Read-Only Memory)。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储服务器100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。

请参考图7，其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质800中存储有程序代码，所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。

计算机可读存储介质800可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地，计算机可读存储介质800包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质800具有执行上述方法中的任何方法步骤的程序代码810的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码810可以例如以适当形式进行压缩。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种数据推送方法，其特征在于，所述方法包括：

获取业务端发送的数据查询请求；

根据所述数据查询请求，获取数据查询结果对应的多个查询句柄；

将所述多个查询句柄中的每个查询句柄分配给一个线程，每个查询句柄对应的线程不同；

每个线程根据对应的查询句柄，拉取数据查询结果的同时将所述数据查询结果发送至所述业务端。
根据权利要求1所述的方法，其特征在于，所述根据所述数据查询请求，获得多个查询句柄，包括：

根据所述数据查询请求，确定数据查询结果所对应的多个分片；

确定每个分片所对应的部分数据查询结果的查询句柄，获得多个查询句柄。
根据权利要求2所述的方法，其特征在于，所述数据查询请求中携带有查询条件，所述根据所述数据查询请求，确定数据查询结果所对应的多个分片，包括：

根据所述数据查询请求，获取满足所述查询条件的数据查询结果所在的分片。
根据权利要求2或3所述的方法，其特征在于，所述根据所述数据查询请求，确定数据查询结果所对应的多个分片，包括：

根据所述数据查询请求，确定数据查询结果对应的索引；

获取所述索引对应的多个分片。
根据权利要求2-4任一项所述的方法，其特征在于，在所述根据所述数据查询请求，确定数据查询结果所对应的多个分片之前，所述方法还包括：

对存储至数据库的数据进行分片。
根据权利要求2-5任一项所述的方法，其特征在于，所述确定每个分片所对应的部分数据查询结果的查询句柄，获得多个查询句柄，包括：

获取每个分片所对应的部分数据查询结果的标识信息，将所述标识信息作为查询句柄，获得多个查询句柄。
根据权利要求1-6任一项所述的方法，其特征在于，所述每个线程根据对应的查询句柄，拉取数据查询结果的同时将所述数据查询结果发送至所述业务端，包括：

每个线程根据对应的查询句柄，在拉取预设数据量的数据后，将拉取到的数据发送至所述业务端；

重复所述每个线程根据对应的查询句柄，在拉取预设数据量的数据后，将拉取到的数据发送至所述业务端，直至所述数据查询结果对应的数据全部发送至所述业务端。
根据权利要求7所述的方法，其特征在于，所述每个线程根据对应的查询句柄，拉取数据查询结果的同时将所述数据查询结果发送至所述业务端，还包括：

获取当前的剩余内存值；

根据所述剩余内存值，确定所述预设数据量。
根据权利要求8所述的方法，其特征在于，所述根据所述剩余内存值，确定所述预设数据量，包括：

判断所述剩余内存值是否大于指定内存值；

如果所述剩余内存值大于所述指定内存值，则将第一数据量作为所述预设数据量；

如果所述剩余内存值小于所述指定内存值，则将第二数据量作为所述预设数据量，所述第二数据量小于所述第一数据量。
根据权利要求8所述的方法，其特征在于，所述每个线程根据对应的查询句柄，拉取数据查询结果的同时将所述数据查询结果发送至所述业务端，还包括：

根据所述数据查询结果的总数据量，以及指定拉取次数，获取所述总数据量与所述指定拉取次数的比值，将所述比值作为所述预设数据量。
根据权利要求1-10任一项所述的方法，其特征在于，所述每个线程根据对应的查询句柄，拉取数据查询结果的同时将所述数据查询结果发送至所述业务端，包括：

每个线程根据对应的查询句柄，通过ElasticSearch的scroll游标功能实现拉取数据查询结果的同时将所述数据查询结果发送至所述业务端。
根据权利要求1-11任一项所述的方法，其特征在于，在所述根据所述数据查询请求，获取数据查询结果对应的多个查询句柄之前，所述方法还包括：

判断所述数据查询结果的总数据量是否大于指定数据量；

如果所述总数据量大于所述指定数据量，则根据所述数据查询请求，获取数据查询结果对应的多个查询句柄。
根据权利要求12所述的方法，其特征在于，所述方法还包括：

如果所述总数据量小于或等于所述指定数据量，则从数据库中读取全部的数据查询结果之后，将数据查询结果发送至所述业务端。
根据权利要求1-13任一项所述的方法，其特征在于，所述将所述多个查询句柄中的每个查询句柄分配给一个线程，包括：

获取线程池中的可用线程；

将所述多个查询句柄中的每个查询句柄分配给所述可用线程中的一个线程。
根据权利要求14所述的方法，其特征在于，所述将所述多个查询句柄中的每个查询句柄分配给所述可用线程中的一个线程，包括：

判断所述可用线程的数量是否小于所述多个查询句柄对应的数量；

如果所述可用线程的数量大于或等于所述多个查询句柄对应的数量，则将所述多个查询句柄中的每个查询句柄分配给所述可用线程中的一个线程。
根据权利要求15所述的方法，其特征在于，所述将所述多个查询句柄中的每个查询句柄分配给所述可用线程中的一个线程，还包括：

如果所述可用线程的数量小于所述多个查询句柄对应的数量，于所述线程池中创建目标数量的线程，其中，所述目标数量与所述可用线程的数量的和值大于或等于多个查询句柄对应的数量。
根据权利要求16所述的方法，其特征在于，在所述于所述线程池中创建目标数量的线程之前，所述方法还包括：

获取处理器的负载率；

如果所述负载率小于指定负载率，于所述线程池中创建目标数量的线程。
一种数据推送装置，其特征在于，所述装置包括：请求获取模块、句柄获取模块、句柄分配模块以及数据发送模块，其中，

所述请求获取模块用于获取业务端发送的数据查询请求；

所述句柄获取模块用于根据所述数据查询请求，获取数据查询结果对应的多个查询句柄；

所述句柄分配模块用于将所述多个查询句柄中的每个查询句柄分配给一个线程，每个查询句柄对应的线程不同；

所述数据发送模块用于每个线程根据对应的查询句柄，拉取数据查询结果的同时将所述数据查询结果发送至所述业务端。
一种服务器，其特征在于，包括：

一个或多个处理器；

存储器；

一个或多个应用程序，其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序配置用于执行如权利要求1-17任一项所述的方法。
一种计算机可读取存储介质，其特征在于，所述计算机可读取存储介质中存储有程序代码，所述程序代码可被处理器调用执行如权利要求1-17任一项所述的方法。