CN103327048B

CN103327048B - 在线应用的数据匹配方法及装置

Info

Publication number: CN103327048B
Application number: CN201210077596.6A
Authority: CN
Inventors: 张蓉
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd
Priority date: 2012-03-22
Filing date: 2012-03-22
Publication date: 2016-05-04
Anticipated expiration: 2032-03-22
Also published as: CN103327048A; HK1186020A1

Abstract

本申请公开了一种在线应用的数据匹配方法及装置，在线应用服务器对于在线应用的请求，从在线应用服务器本地读取预先存储类值的数量大于或等于预定阈值的分类的类值，从分布式缓存中读取类值的数量小于预定阈值的分类的类值，并将用户属性的属性值与读取的对应的分类的类值进行对比匹配，能够减少对在线应用的数据匹配处理中、从分布式缓存中读取的在线应用的规则信息的数据量，能够降低读取在线应用的规则信息而占用的带宽，提高网络的稳定性和安全性，能够缩短对在线应用请求的响应时间、提高处理效率，从而能够解决现有技术中基于集群模式的在线应用的大数据量的数据匹配处理中存在的占用带宽过多、响应时间过长的问题。

Description

在线应用的数据匹配方法及装置

技术领域

本申请涉及网络通信领域，具体地，涉及一种在线应用的数据匹配方法及装置。

背景技术

目前在互联网中，存在大量的在线应用项目，这些应用项目需将用户的属性信息与对在线应用预定的规则信息进行大数据量的数据匹配处理。这些规则信息中通常包括多个分类，每个分类下又包括多个类值，类值的类型包括字符型、数值型。进行数据匹配处理时，将用户属性的属性值与规则信息中的对应分类的各个类值依次进行对比，当用户的属性值与类值相同或包括在类值的范围之内时，确定匹配处理成功。

例如，一项在线调查对可使用该调查的用户的性别、年龄、所处地域做出了规定，规定女性、年龄在20岁至40岁之间、居住地为北京的用户可以使用该在线调查，该规定的全部内容即为规则信息，规则信息中所包括的用户的性别、年龄、所处地域即为分类，每个分类包括至少一个类值，比如，性别这一分类包括1个类值：女，年龄这一分类包括20个类值：20～39，地域这一分类包括1个类值：北京。系统对对提交该在线调查请求的用户属性进行匹配处理，例如，用户A的用户属性为：性别属性为女、年龄属性为30、地域属性为北京，用户B的用户属性为：性别属性为男、年龄属性为35、地域属性为上海，系统分别将用户性别属性、年龄属性、地域属性的具体属性值与上述三个分类的类值进行对比，用户属性的属性值与规则信息中相对应分类的类值相等或相同、或属性值处于类值的范围之内时，匹配成功，否则，匹配失败，则上述的用户A能够匹配成功、可以使用该在线调查，用户B匹配失败、不能使用该在线调查。

目前，对于这种在线应用的数据匹配处理，通常采用集群式的分布缓存系统来存储预定的规则信息，图1示出了这种集群式的分布缓存系统的结构示意图，如图1所示，该系统中包括负载均衡器1、在线应用服务器集群2、在线应用服务器集群2中包括多个在线应用服务器2₁、2₂、...、2_n，分布式缓存集群3、数据库4。在线应用服务器2_n预先读取数据库4中存储的在线应用的规则信息，并将读取的规则信息存储到分布式缓存集群3中。在处理用户提交的在线应用的请求时，负载均衡器1将来自客户端的在线应用请求经负载均衡处理后发送给在线应用服务器2_n，在线应用服务器2_n根据在线应用的标识从分布式缓存集群3中读取在线应用的规则信息，将用户的属性信息与读取的在线应用的规则信息进行数据匹配处理。

目前有些在线应用项目是与时间密切相关的，例如在期限时间点之前在线应用项目提供最优应用效果，或者在期限时间点之后该在线应用项目失效，这种在线应用项目通常对响应时间和处理效率有较高的要求，并且这种在线应用项目在临近期限时间点时会有大量的使用用户，这就对网络的稳定性也有较高的要求。而这些应用项目的规则信息非常大，有些规则信息中的分类的类值达到5000个之多，这样就导致临近期限时间点时，在线应用服务器集群2中的多个在线应用服务器就会频繁地从分布式缓存集群3中读取大量的规则信息进行数据匹配处理，从而导致瞬间占用大量的网络带宽、影响网络稳定性，并且导致对在线应用请求的响应时间过长、处理效率低下。

例如，一项在线拍卖活动，这项在线拍卖预计会吸引大量的用户，而大部分的用户可能会在拍卖结束前的几分钟、甚至几秒钟才提交拍卖请求，这样在线应用服务器就要不断地从分布式缓存中读取活动规则信息，并将用户属性与规则信息进行匹配、判断用户能否使用该在线拍卖，而该在线拍卖活动的规则信息中的全部类值为5000个，这样在瞬时内在线服务器处理单个请求的时间可达到130毫秒，占用网络带宽达到0.1兆比特，处理大量用户的并发请求时，占用的带宽过大、响应时间过长的现象则更为显著。

可见，目前在现有技术中，对于基于集群模式的在线应用的大数据量的数据匹配处理存在占用带宽过多、响应时间过长的问题。

发明内容

有鉴于此，本申请实施例提供了一种在线应用的数据匹配方法，用以解决现有技术中，基于集群模式的在线应用的大数据量的数据匹配处理中存在占用带宽过多、响应时间过长的问题。

相应地，本申请实施例还提供了一种在线应用的数据匹配装置。

本申请实施例技术方案如下：

一种在线应用的数据匹配方法，包括：在线应用服务器根据用户提交的对在线应用的请求，判断分布式缓存中存储的该在线应用的规则信息中、各个分类所包括的类值的数量是否均小于预定阈值，在判断分类所包括的类值的数量小于预定的阈值的情况下，从分布式缓存中读取该规则信息中该分类的类值，在判断分类所包括的类值的数量大于或等于预定的阈值的情况下，读取在线应用服务器本地上预先存储的该分类的类值；对于用户当前待匹配的用户属性，确定与该用户属性相对应的所读取的规则信息中的分类，将该用户属性的属性值与确定的分类的类值进行对比匹配。

一种在线应用的数据匹配装置，包括：接收模块，用于接收用户提交的对在线应用的请求；第一判断模块，用于判断分布式缓存中存储的该在线应用的规则信息中、各个分类所包括的类值的数量是否均小于预定阈值；第一读取模块，用于在第一判断模块判断分类所包括的类值的数量小于预定阈值的情况下，从分布式缓存中读取该规则信息中该分类的类值；存储控制模块，用于预先存储类值的数量大于或等于预定阈值的分类的类值；第二读取模块，用于在第一判断模块判断分类所包括的类值的数量大于后等于预定阈值的情况下，读取存储控制模块中预先存储的该分类的类值；确定模块，用于对于用户当前待匹配的用户属性，确定与该用户属性相对应的由第一读取模块或由第二读取模块所读取的规则信息中的分类；匹配模块，用于将该用户属性的属性值与确定模块确定的分类的类值进行对比匹配。

根据本申请实施例的技术方案，在线应用服务器对于在线应用的请求，从在线应用服务器本地读取预先存储类值的数量大于或等于预定阈值的分类的类值，从分布式缓存中读取类值的数量小于预定阈值的分类的类值，也即从分布式缓存中读取数据量小的分类的类值，从在线应用服务器本地读取数据量大的分类的类值，能够减少对在线应用的数据匹配处理中、从分布式缓存中读取的在线应用的规则信息的数据量，能够降低读取在线应用的规则信息而占用的带宽，提高网络的稳定性和安全性，并且由于缩短了读取数据量大的分类的类值的时间，能够缩短对在线应用请求的响应时间、提高处理效率，从而能够解决现有技术中基于集群模式的在线应用的大数据量的数据匹配处理中存在的占用带宽过多、响应时间过长的问题。

本申请的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

图1为现有技术中的集群式的分布缓存系统的结构示意图；

图2为本申请实施例提供的在线应用的数据匹配方法的工作流程图；

图3为图2所示方法的优选实施方式的工作流程图；

图4为本申请提供的在线应用的数据匹配装置的结构框图；

图5为图4所示装置的优选实施结构框图。

具体实施方式

以下结合附图对本申请的实施例进行说明，应当理解，此处所描述的实施例仅用于说明和解释本申请，并不用于限定本申请。

针对现有技术中基于集群模式的在线应用的数据匹配处理中存在占用带宽过多、响应时间过长的问题，本申请实施例提供了一种在线应用的数据匹配方案，以解决该问题。

在本申请实施例提供的在线应用的数据匹配方案中，首先在集群式模式架构下，对在线应用的规则信息的存储进行了部署，将规则信息中的分类的类值的数量小于预定阈值的分类存储在分布式缓存中，将分类的类值的数量大于或等于预定阈值的分类存储在在线应用服务器中；这样在线应用服务器在进行对用户属性信息与规则信息的数据匹配时，从分布式缓存中读取数据量小的分类的类值，从在线应用服务器本地读取数据量大的分类的类值，就不用从分布式缓存中读取大量的规则信息，针对瞬时提交的大量在线应用请求，就不会因为在数据匹配处理过程中、从分布式缓存中读取大量的数据而导致占用过多带宽、影响网络稳定的问题，能够减少所占用的带宽、提高网络稳定性，从而能够解决现有技术中对于在线应用的数据匹配处理中存在的占用带宽过多、响应时间过长的问题。

其次，在本申请的优选实施例中，使用二分法来进行具体的数据对比匹配处理。二分法即，确定与用户属性对应的分类中预先按照从小到大升序排列的类值中的中值位置的类值，将用户属性的属性值与该中值位置的类值进行对比，在二者相等的情况下，匹配成功，否则，在用户的属性信息大于或小于该中值位置的类值时，在该分类的类值中大于或小于该中值位置的类值的范围内再次确定中值位置的类值，将用户的属性信息与该再次确定的中值位置的类值进行对比，如此进行匹配处理直至匹配成功、或用户属性的属性值与各个类值均不相等。相比于现有技术中将用户属性的属性值与分类的各个类值按序依次对比匹配的处理方法，使用二分法进行具体的数据匹配处理，能够显著地提高数据对比匹配的处理速度，能够提高对在线应用请求的响应速度、提高处理效率。

下面对本申请实施例进行详细说明。

图2示出了本申请实施例提供的在线应用的数据匹配方法的工作流程图，该方法可应用在如图1所示的系统中，如图2所示，该方法包括如下处理过程：

步骤21、在线应用服务器根据用户提交的对在线应用的请求，判断分布式缓存中存储的该在线应用的规则信息中、各个分类所包括的类值的数量是否均小于预定阈值，在判断分类所包括的类值的数量小于预定的阈值的情况下，从分布式缓存中读取该规则信息中该分类的类值，在判断分类所包括的类值的数量大于或等于预定的阈值的情况下，读取在线应用服务器本地上预先存储的该分类的类值；

步骤22、对于用户当前待匹配的用户属性，确定与该用户属性相对应的所读取的规则信息中的分类，将该用户属性的属性值与确定的分类的类值进行对比匹配。

通过如图2所示的方法，由在线应用服务器从在线应用服务器本地读取预先存储类值的数量大于或等于预定阈值的分类的类值，从分布式缓存中读取类值的数量小于预定阈值的分类的类值，能够减少对在线应用的数据匹配处理中、从分布式缓存中读取的在线应用的规则信息的数据量，能够降低读取在线应用的规则信息而占用的带宽，提高网络的稳定性和安全性，能够缩短对在线应用响应的时间、提高处理效率，从而能够解决现有技术中对在线应用的大数据量的数据匹配处理中存在的占用带宽过多、响应时间过长的问题。尤其是对于与时间相关的在线应用、以及分类的类值的数量非常大的在线应用，通过如图2所示的方法，能够显著地减少由于读取规则信息中的分类的类值而占用的带宽，提高网络的稳定性。

图3示出了图2所示方法的优选实施方式的工作流程图，如图3所示，该优选实施方式包括如下处理过程：

步骤30、在线应用服务器预先访问数据库中存储的在线应用的规则信息，具体包括：访问数据库，遍历数据库中存储的在线应用的规则信息中包括的各个分类，判断分类所包括的类值的数量是否小于预定阈值，在分类所包括的类值的数量小于预定阈值的情况下，处理进行到步骤31，在分类所包括的类值的数量大于或等于预定阈值的情况下，处理进行到步骤32；其中，数据库中存储的类值的类型为数字字符；其中，预定阈值可以根据系统处理的数据量情况来具体设置；

步骤31、在线应用服务器从数据库中读取该分类的类值，并将读取的分类的类值存储到分布式缓存中，处理进行到步骤33；

步骤32、在线应用服务器在分布式缓存中对该标识对应的分类标记本地存储标识、并将该分类中存储的内容设置为空，记录该规则信息包括的该分类的标识，在预定的时间间隔到来时，根据记录的分类的标识，从数据库中读取该标识对应的规则信息包括的分类的类值，并在应用服务器本地存储读取的该分类的类值；其中，预定时间间隔可根据系统处理的忙闲程度来确定；

步骤33、在线应用服务器接收到来自负载均衡器发来的用户对在线应用的请求，解析该请求得到该在线应用的标识、以及用户标识；

步骤34、在线应用服务器根据解析得到的在线应用的标识，从分布式缓存中查找到该在线应用标识对应的在线应用的规则信息；

步骤35、在线应用服务器判断查找到的规则信息中包括的各个分类是否具有本地存储标识，在不具有本地存储标识的情况下，处理进行到步骤36，在具有本地存储标识的情况下，处理进行到步骤37；

步骤36、在线应用服务器从分布式缓存中读取规则信息中该分类的类值，处理进行到步骤38；

步骤37、在线应用服务器获取该分类的标识，根据该分类的标识从在线应用服务器本地读取预先存储的该分类的类值；

步骤38、在线应用服务器判断在线应用的规则信息中的分类信息是否全部读取完毕，在读取完毕的情况下，处理进行到步骤39，否则处理返回步骤35；

步骤39、在线应用服务器根据解析得到的用户标识获取该用户的属性信息，将获取的用户的属性信息与读取的规则信息中相对应的分类的类值进行对比匹配分析；

步骤40、对于当前待匹配的用户属性，确定与该用户属性相对应的分类；

步骤41、确定该分类中预先按照升序排列的类值中的中值位置的类值，对比判断该用户属性的属性值与确定的该中值位置的类值的关系，在该用户属性的属性值等于该中值位置的类值的情况下，匹配成功；在该用户属性的属性值大于或小于该中值位置的类值的情况下，在该分类的类值中大于或小于该中值位置的类值的类值范围内再次确定中值位置的类值，并对比判断该用户属性的属性值与再次确定的中值位置的类值的关系，如此对比判断下去，直至匹配成功、或该分类中的各个类值与该用户属性的属性值均不相等；

步骤42、判断用户的属性信息是否全部匹配完毕，在匹配完毕的情况下，处理结束，否则，处理返回到步骤40。

此外，图2所示方法的优选实施方式还包括数据更新的处理，该数据更新的处理过程包括：

步骤一、在线应用服务器本地存储的在线应用的规则信息的分类有更新的情况下，记录待更新的分类的标识；

步骤二、在预定时间间隔到来时，根据记录的分类的标识从数据库中读取该标识对应的更新后的分类的类值；

步骤三、删除更新之前的该标识对应的分类的类值；

步骤四、存储所读取的更新后的分类的类值。

根据如图3所示的处理过程，能够从应用服务器本地读取规则信息中类值数据量较大的分类的类值，从分布式缓存中读取规则信息中类值数据量较小的分类的类值，能够显著地减少对在线应用的数据匹配处理中由于读取规则信息而占用的带宽，并且通过二分法对用户属性的属性值与规则信息中的分类的类值进行对比匹配，相比于现有技术中采用依次对比匹配的处理方法，能够有效地提高对用户发出的在线应用请求的响应速度、提高对在线应用处理的效率，从而能够解决现有技术中对于在线应用的数据匹配处理中存在的占用带宽过多、响应时间过长的问题。

为实现上述功能，本申请实施例提供的在线应用的数据匹配方法，既可以通过硬件实现，也可以通过软件程序实现，即在线应用服务器中包括下述的在线应用的数据匹配装置。

图4示出了本申请提供的在线应用的数据匹配装置的结构框图，如图4所示，该装置包括：

接收模块41，用于接收用户提交的对在线应用的请求；

第一判断模块42，连接至接收模块41，用于判断分布式缓存中存储的该在线应用的规则信息中、各分类所包括的类值的数量是否小于预定阈值；

第一读取模块43，连接至第一判断模块42，用于在第一判断模块42判断分类所包括的类值的数量小于预定的阈值的情况下，从分布式缓存中读取该规则信息中该分类的类值；

存储控制模块44，用于预先存储类值的数量大于或等于预定阈值的分类的类值；

第二读取模块45，连接至第一判断模块42，用于在第一判断模块42判断分类所包括的类值的数量大于后等于预定的阈值的情况下，读取存储控制模块44上预先存储的该分类的类值；

确定模块46，连接至第一读取模块43、第二读取模块45，用于对于用户当前待匹配的用户属性，确定与该用户属性相对应的由第一读取模块43或由第二读取模块45所读取的规则信息中的分类；

匹配模块47，连接至确定模块46，用于将该用户属性的属性值与确定模块46确定的分类的类值进行对比匹配。

图4所示装置的工作原理如图2所示，这里不再赘述。

通过如图4所示的装置，从在线应用的数据匹配装置本地读取预先存储类值的数量大于或等于预定阈值的分类的类值，从分布式缓存中读取类值的数量小于预定阈值的分类的类值，能够减少对在线应用的数据匹配处理中、从分布式缓存中读取的在线应用的规则信息的数据量，能够降低读取在线应用的规则信息而占用的带宽，提高网络的稳定性和安全性，从而能够解决现有技术中对在线应用的大数据量的数据匹配处理中存在的占用带宽过多的问题。

图5示出了图4所示装置的优选实施结构框图，如图5所示，该装置在如5所示结构的基础上，读取控制模块44还包括：第二判断模块441、第三读取模块442、标记模块443、第四读取模块444、存储模块445。在图5中，图4中的已述结构和功能不在赘述。

第二判断模块441，用于预先判断分布式缓存中存储的在线应用的规则信息中的各分类是否具有本地存储标识；

第三读取模块442，连接至第二判断模块441，用于在第二判断模块441判断分类的类值的数量小于预定阈值的情况下，从数据库中读取该分类的类值、并将读取的该分类的类值存储到分布式缓存中；

标记模块443，连接至第二判断模块441，用于在第二判断模块441判断分类的类值的数量大于或等于预定阈值的情况下，在分布式缓存中对该分类标记本地存储标识；

第四读取模块444，连接至第二判断模块441，用于在第二判断模块441判断分类的类值的数量大于或等于预定阈值的情况下，在预定的时间间隔到来时，根据该分类的标识从数据库中读取该标识对应的分类的类值；还用于在预定时间间隔到来时，根据待更新的分类的标识从数据库中读取该标识对应的更新后的分类的类值；

存储模块445，连接至第四读取模块444，用于存储第四读取模块444读取的分类的类值；还用于存储第四读取模块444所读取的更新后的分类的类值；

第一判断模块42，具体用于判断分布式缓存中存储的该在线应用的规则信息中各分类是否具有本地存储标识，在不具有本地存储标识的情况下，判断该分类所包括的类值的数量小于预定的阈值，在具有本地存储标识的情况下，判断该分类所包括的类值的数量大于或等于预定的阈值；

匹配模块47，具体用于在确定的分类的类值为数值型的情况下，确定该分类中预先按照升序排列的类值中的中值位置的类值，对比判断该用户属性的属性值与确定的该中值位置的类值的关系；在该用户属性的属性值等于该中值位置的类值的情况下，匹配成功；在该用户属性的属性值大于或小于该中值位置的类值的情况下，在该分类的类值中大于或小于该中值位置的类值的类值范围内再次确定中值位置的类值，并对比判断该用户属性的属性值与再次确定的中值位置的类值的关系，如此进行匹配处理直至匹配成功、或该分类中的各个类值与该用户属性的属性值均不相等。

通过如图5所示的装置，能够从在线应用的数据匹配装置本地读取规则信息中类值数据量较大的分类的类值，从分布式缓存中读取规则信息中类值数据量较小的分类的类值，能够显著地减少对在线应用的数据匹配处理中由于读取规则信息而占用的带宽，并且通过二分法对用户属性的属性值与规则信息中的分类的类值进行对比匹配，能够有效地提高对用户发出的在线应用请求的响应速度、提高对在线应用处理的效率，从而能够解决现有技术中对于在线应用的数据匹配处理中存在的占用带宽过多、响应时间过长的问题。

下面对本申请实施例具体实施的情况进行说明。

本申请实施例具体实施的场景为在线拍卖，该在线拍卖的规则信息中全部的类值的数量为5000个，类值的类型为数字字符，各分类中类值的数量大于或等于500时设置本地存储标识JVM_cache，在线应用服务器从数据库读取数据到本地、或更新数据的时间间隔为10分钟。

本申请实施例具体实施的处理过程包括如下步骤：

步骤一、在线应用服务器接收到用户提交的对在线拍卖的请求；

步骤二、在线应用服务器解析接收到的该请求，得到在线拍卖的标识和用户标识；

步骤三、在线应用服务器访问分布式缓存，查询判断分布式缓存中是否存储有解析得到的在线拍卖的标识所对应的在线拍卖的规则信息，判断为否的情况下，处理进行到步骤四，判断为是的情况下，处理进行到步骤十；

步骤四、在线应用服务器访问数据库，在数据库中遍历解析得到的在线拍卖的标识所对应的在线拍卖的规则信息，在规则信息所包括的分类的类值的数量小于500的情况下，处理进行到步骤五，在分类的类值的数量大于或等于500的情况下，处理进行到步骤六；

步骤五、在线应用服务器读取类值的数量小于500的分类的类值，将读取的分类的类值存储到分布式缓存上，处理进行到步骤十；

步骤六、在线应用服务器在分布式缓存中，对类值的数量大于或等于500的分类标记本地存储标识JVM_cache，并将该分类的存储内容中标记存储为空的标识null；

步骤七、在线应用服务器记录下类值的数量大于或等于500的分类的标识；

步骤八、在线应用服务器在预定时间间隔到来时，从数据库中读取在线拍卖的规则信息中所记录的分类的标识对应的分类的类值；

步骤九、在线应用服务器将读取的分类的类值存储到在线应用服务器本地；

步骤十、在线应用服务器遍历分布式缓存，判断所存储的在线拍卖的规则信息中的各个分类的类值是否具有本地存储标识JVM_cache，在判断为是的情况下，处理进行到步骤十一，否则，处理进行到步骤十五；

步骤十一、在线应用服务器在分布式缓存中获取具有本地存储标识JVM_cache的分类的标识；

步骤十二、在线应用服务器根据获取的该分类的标识，判断在线应用服务器本地是否存储有该标识对应的分类的类值，在判断为否的情况下处理进行到步骤十三，否则，处理进行到步骤十四；

步骤十三、在线应用服务器在预定的时间间隔到来时，从数据库中读取并存储该标识对应的分类的类值；

步骤十四、在线应用服务器读取本地存储的该标识对应的分类的类值，处理进行到步骤十六；

步骤十五、在线应用服务器从分布式缓存中读取不具有本地存储标识的分类的类值；

步骤十六、根据解析得到的用户标识，获取该用户的各个用户属性的属性值；

步骤十七、对于当前待匹配的用户属性，确定与该用户属性相对应的在线拍卖的规则信息中的分类；

步骤十八、确定该分类中预先按照升序排列的类值中的中值位置的类值，对比判断该用户属性的属性值与确定的该中值位置的类值的关系，在该用户属性的属性值等于该中值位置的类值的情况下，匹配成功；在该用户属性的属性值大于或小于该中值位置的类值的情况下，在该分类的类值中大于或小于该中值位置的类值的类值范围内再次确定中值位置的类值，并对比判断该用户属性的属性值与再次确定的中值位置的类值的关系，如此对比判断下去，直至匹配成功、或该分类中的各个类值与该用户属性的属性值均不相等；

步骤十九、判断用户的属性信息是否全部匹配完毕，在匹配完毕的情况下，处理结束，否则，处理返回到步骤十七。

根据上述的处理过程，在线应用服务器对于单个在线拍卖请求的处理时间(即对用户的在线拍卖请求的响应时间)小于1毫秒，占用的带宽为0.0005兆比特，在临近拍卖结束、用户提交大量并发请求的情况下，本申请实施例则可以提供更为显著的效果，而现有技术中处理类值总和为5000个的在线应用的数据匹配，处理时间为130毫秒，占用网络带宽为0.1兆比特，可见，本申请实施例提供的技术方案，能够显著地减少占用的带宽、缩短响应的时间、提高响应的效率。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种在线应用的数据匹配方法，其特征在于，包括：

在线应用服务器根据用户提交的对在线应用的请求，判断分布式缓存中存储的该在线应用的规则信息中、各个分类所包括的类值的数量是否均小于预定阈值，在判断分类所包括的类值的数量小于所述预定的阈值的情况下，从所述分布式缓存中读取该规则信息中该分类的类值，在判断分类所包括的类值的数量大于或等于所述预定的阈值的情况下，读取所述在线应用服务器本地上预先存储的该分类的类值；

对于所述用户当前待匹配的用户属性，确定与该用户属性相对应的所读取的规则信息中的分类，将该用户属性的属性值与确定的分类的类值进行对比匹配；

其中，判断分布式缓存中存储的该在线应用的规则信息中各分类所包括的类值的数量是否小于预定阈值，具体包括：

判断所述分布式缓存中存储的该在线应用的规则信息中各分类是否具有本地存储标识，在不具有本地存储标识的情况下，确定该分类所包括的类值的数量小于预定的阈值，在具有本地存储标识的情况下，确定该分类所包括的类值的数量大于或等于预定的阈值。

2.根据权利要求1所述的方法，其特征在于，所述类值的类型包括数字字符，将该用户属性的属性值与确定的分类的类值进行对比匹配，具体包括：

在所确定的分类中确定预先按照升序排列的类值中的中值位置的类值，对比判断该用户属性的属性值与确定的该中值位置的类值的关系；

在该用户属性的属性值等于该中值位置的类值的情况下，匹配成功；在该用户属性的属性值大于或小于该中值位置的类值的情况下，在该分类的类值中大于或小于该中值位置的类值的范围内再次确定中值位置的类值，并对比判断该用户属性的属性值与再次确定的中值位置的类值的关系，如此进行匹配处理直至匹配成功、或该分类中的各个类值与该用户属性的属性值均不相等。

3.根据权利要求1所述的方法，其特征在于，所述在线应用服务器预先在本地存储分类的类值，具体包括：

所述在线应用服务器预先判断数据库中存储的在线应用的规则信息中、各分类的类值的数量是否小于所述预定阈值；

在分类的类值的数量小于所述预定阈值的情况下，从所述数据库中读取该分类的类值、并将读取的该分类的类值存储到所述分布式缓存中；

在分类的类值的数量大于或等于所述预定阈值的情况下，在所述分布式缓存中对该分类标记本地存储标识，并在预定的时间间隔到来时，根据该分类的标识从所述数据库中读取该标识对应的分类的类值，并将所读取的分类的类值存储到所述在线应用服务器本地。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

所述在线应用服务器本地存储的在线应用的规则信息的分类有更新的情况下，在所述预定时间间隔到来时，根据待更新的分类的标识从所述数据库中读取该标识对应的更新后的分类的类值，并存储所读取的更新后的分类的类值。

5.一种在线应用的数据匹配装置，其特征在于，包括：

接收模块，用于接收用户提交的对在线应用的请求；

第一判断模块，用于判断分布式缓存中存储的该在线应用的规则信息中、各个分类所包括的类值的数量是否均小于预定阈值；

第一读取模块，用于在所述第一判断模块判断分类所包括的类值的数量小于所述预定阈值的情况下，从所述分布式缓存中读取该规则信息中该分类的类值；

存储控制模块，用于预先存储类值的数量大于或等于所述预定阈值的分类的类值；

第二读取模块，用于在所述第一判断模块判断分类所包括的类值的数量大于或等于所述预定阈值的情况下，读取所述存储控制模块中预先存储的该分类的类值；

确定模块，用于对于所述用户当前待匹配的用户属性，确定与该用户属性相对应的由所述第一读取模块或由所述第二读取模块所读取的所述规则信息中的分类；

匹配模块，用于将该用户属性的属性值与所述确定模块确定的分类的类值进行对比匹配；

其中，所述第一判断模块，具体用于判断所述分布式缓存中存储的该在线应用的规则信息中各分类是否具有本地存储标识，在不具有本地存储标识的情况下，确定该分类所包括的类值的数量小于预定的阈值，在具有本地存储标识的情况下，确定该分类所包括的类值的数量大于或等于预定的阈值。

6.根据权利要求5所述的装置，其特征在于，所述匹配模块，具体用于：

在所述确定模块所确定的分类中确定预先按照升序排列的类值中的中值位置的类值，对比判断该用户属性的属性值与确定的该中值位置的类值的关系；

在该用户属性的属性值等于该中值位置的类值的情况下，匹配成功；在该用户属性的属性值大于或小于该中值位置的类值的情况下，在该分类的类值中大于或小于该中值位置的类值的类值范围内再次确定中值位置的类值，并对比判断该用户属性的属性值与再次确定的中值位置的类值的关系，如此进行匹配处理直至匹配成功、或该分类中的各个类值与该用户属性的属性值均不相等。

7.根据权利要求6所述的装置，其特征在于，所述存储控制模块，具体包括：

第二判断模块，用于预先判断数据库中存储的在线应用的规则信息中、各分类的类值的数量是否小于所述预定阈值；

第三读取模块，用于在所述第二判断模块判断分类的类值的数量小于所述预定的阈值的情况下，从所述数据库中读取该分类的类值、并将读取的该分类的类值存储到所述分布式缓存中；

标记模块，用于在所述第二判断模块判断分类的类值的数量大于或等于所述预定阈值的情况下，在所述分布式缓存中对该分类标记本地存储标识；

第四读取模块，用于在所述第二判断模块判断分类的类值的数量大于或等于所述预定阈值的情况下，在预定的时间间隔到来时，根据该分类的标识从所述数据库中读取该标识对应的分类的类值；

存储模块，用于存储所述第四读取模块读取的分类的类值。

8.根据权利要求7所述的装置，其特征在于，所述第四读取模块，还用于在所述预定时间间隔到来时，根据待更新的分类的标识从所述数据库中读取该标识对应的更新后的分类的类值；

所述存储模块，还用于存储所述第四读取模块所读取的更新后的分类的类值。