CN103309894A - 基于用户属性的搜索实现方法及系统 - Google Patents

基于用户属性的搜索实现方法及系统 Download PDF

Info

Publication number
CN103309894A
CN103309894A CN2012100688154A CN201210068815A CN103309894A CN 103309894 A CN103309894 A CN 103309894A CN 2012100688154 A CN2012100688154 A CN 2012100688154A CN 201210068815 A CN201210068815 A CN 201210068815A CN 103309894 A CN103309894 A CN 103309894A
Authority
CN
China
Prior art keywords
registered user
user
search
registered
visitor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100688154A
Other languages
English (en)
Other versions
CN103309894B (zh
Inventor
王超群
徐萧萧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210068815.4A priority Critical patent/CN103309894B/zh
Publication of CN103309894A publication Critical patent/CN103309894A/zh
Priority to HK13113049.9A priority patent/HK1185687A1/zh
Application granted granted Critical
Publication of CN103309894B publication Critical patent/CN103309894B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于用户属性的搜索实现方法,包括以下步骤:S1、根据注册用户的属性数据并利用近度频度额度RFM模型对注册用户进行排序并推荐被排序在预设位数之前的注册用户;S2、根据上述推荐结果构建索引数据库,并在搜索引擎收到访问者的搜索请求时,根据该搜索请求中包括的关键词在索引数据库内搜索匹配的可供应资源信息,进而依序显示与各注册用户对应的可供应资源信息。本发明相应还公开了一种基于用户属性的搜索实现系统。本发明实施例提供的搜索实现方法及系统能够在搜索的可供应资源信息结果中体现出注册用户的用户属性,并且能够避免造成搜索引擎计算时间的增加和结果显示的延迟。

Description

基于用户属性的搜索实现方法及系统
技术领域
本申请涉及互联网搜索技术领域,尤其涉及一种基于用户属性的搜索实现方法及系统。
背景技术
互联网上的信息发布型网站通常用于集中发布注册用户提交的可供应资源信息,由于具有资源集中、信息量大、可选性丰富、作为第三方的信誉可保障等优势,信息发布型网站越来越受到来自信息提供方(即前述的注册用户)和信息需求方(即访问网站寻求目标信息的访问者)二者双方面的欢迎,近年来用于发布可售卖商品信息的大型电子商务网站市场与日剧增便是一个典型的例子。
一般来说,信息发布型网站都会提供站内搜索引擎,以便于作为信息需求方的访问者能够快速、准确地检索到适合自己的可供应资源信息。目前,这类搜索引擎的搜索实现方法主要是基于上述可供应资源信息的关键词,相应的,其主要优势也体现在关键词的相关性方面,然而却不能很好地体现信息发布方的属性,这些属性例如包括信息总数、信息质量和活跃情况等等。换言之,访问者在现有的信息发布型网站上使用搜索引擎检索目标信息时,得到的检索结果数据是按关键词的相关性高低进行构建并显示给访问者的,在关键词相关性接近的情况下,其显示的检索结果数据都是随机构建的,因而体现不出信息发布方的属性。导致以上问题的主要原因在于,搜索引擎的实现有实时性的特点,如果要在其分析数据中加入体现用户属性的海量历史数据,不但会带来存储成本的增加,更会造成计算时间的增加和结果显示的延迟,进而会降低访问者的使用体验。
发明内容
本申请的实施例旨在提供一种基于用户属性的搜索实现方法,以解决通过普通搜索引擎搜索的可供应资源信息结果无法体现信息发布方属性的问题。
为实现上述目的,本申请的实施例提供了一种基于用户属性的搜索实现方法,供网站的搜索引擎用来根据访问者的搜索请求搜索并显示由注册用户在所述网站上发布的可供应资源信息,该方法包括以下步骤:
S1.根据所述注册用户的属性数据并利用近度频度额度RFM模型对所述注册用户进行排序并推荐被排序在预设位数之前的注册用户,所述RFM模型的参数包括所述注册用户最近一次被推荐的日期、所述注册用户在预设第一期间内被推荐的次数以及所述注册用户在预设第二期间内得到的来自所述访问者的反馈次数;以及
S2.根据所述步骤S1得到的推荐结果构建索引数据库,并在所述搜索引擎收到所述访问者的搜索请求时,根据该搜索请求中包括的关键词在所述索引数据库内搜索匹配的所述可供应资源信息,进而依序显示与所述注册用户对应的可供应资源信息。
本申请的实施例还相应提供一种基于用户属性的搜索实现系统,供网站的搜索引擎用来根据访问者的搜索请求搜索并显示由注册用户在所述网站上发布的可供应资源信息,该系统包括:
用户属性统计装置,根据所述注册用户的属性数据并利用近度频度额度RFM模型对所述注册用户进行排序并推荐被排序在预设位数之前的注册用户,所述RFM模型的参数包括所述注册用户最近一次被推荐的日期、所述注册用户在预设第一期间内被推荐的次数以及所述注册用户在预设第二期间内得到的来自所述访问者的反馈次数;
搜索装置,用于根据所述用户属性统计装置得到的推荐结果构建索引数据库,并在所述搜索引擎收到所述访问者的搜索请求时,根据该搜索请求中包括的关键词在所述索引数据库内搜索匹配的所述可供应资源信息,进而依序显示与所述注册用户对应的可供应资源信息。
由上述技术方案可知,本申请实施例基于用户属性的搜索实现方法及系统,供网站的搜索引擎用来根据访问者的搜索请求搜索并显示由注册用户在所述网站上发布的可供应资源信息,能够在搜索的可供应资源信息结果中体现出信息发布者(即注册用户)的用户属性,并且无需由搜索引擎处理与用户属性相关的海量数据,从而避免造成搜索引擎计算时间的增加和结果显示的延迟。
附图说明
图1为本申请基于用户属性的搜索实现方法实施例流程图;
图2为本申请基于用户属性的搜索实现系统实施例结构图。
具体实施方式
下面将详细描述本申请的具体实施例。应当注意,这里描述的实施例只用于举例说明,并不用于限制本申请。
本申请的实施例提供一种基于用户属性的搜索实现方法,其供网站的搜索引擎用来根据访问者的搜索请求搜索并显示由注册用户在该网站上发布的可供应资源信息。在一个实施例中,上述网站可以是信息发布型网站,例如用于发布可售卖商品信息的电子商务网站,这里的商品信息(下文中又称为offer)即对应上述的可供应资源信息。接续,请参见图1,其为本申请基于用户属性的搜索实现方法实施例流程图,如图所示,本实施例的方法包括以下步骤S110-S120。
S110、根据注册用户的属性数据并利用近度频度额度RFM模型对注册用户进行排序并推荐被排序在预设位数之前的注册用户;
其中,RFM模型的参数包括注册用户最近一次被推荐的日期、注册用户在预设第一期间内被推荐的次数以及注册用户在预设第二期间内得到的来自访问者的反馈次数。
结合背景技术部分的内容所述,在现有的信息发布型网站中,普通搜索引擎根据关键词检索可供应资源信息,其所得到并显示给访问者的结果通常是按关键词的相关性进行排序,这样无法体现信息发布者(即信息发布型网站的注册用户)的用户属性,也即,无法根据注册用户的属性来对搜索得到的可供应资源信息进行排序结果的调整和优化。
针对上述问题,本步骤中首先需要构建用于存储注册用户属性数据的基础数据库。目前,一些大型的信息发布型网站都会设有数据仓库,用来存储海量的用户属性信息和历史用户行为数据,现有网站利用这种数据仓库提供的数据进行分析,通常是为了把握注册用户的行为轨迹以便有针对性的提高用户黏度和活跃度,而在本实施例中,便可以将这一数据仓库作为上述所需要构建的基础数据库。进而,在一个实施例中,基础数据库中存储的用户属性数据包括但不限于以下信息的任意组合:
(1)注册用户的注册信息,也即在网站上发布可供应资源信息的用户在注册时录入的基本信息,其可以体现注册用户的基本属性;
(2)注册用户浏览网站的行为数据,是指某个注册用户对于其他注册用户的公开信息以及所发布资源信息的浏览行为,以及对于自身注册信息以及所发布资源信息的浏览、修改和完善等行为,这种信息的价值主要在于体现注册用户的活跃度;
(3)注册用户及其发布的可供应资源被访问者浏览的行为数据,其主要在于体现注册用户及其所发布资源信息对于网站访问者的吸引力;
(4)通过CRM(Customer Relationship Management,客户关系管理)系统得到的用户信息、通过电话调研得到的用户信息,也即由网站管理方通过CRM系统或电话调研主动得到的注册用户信息,用来更新或补充注册用户的基本信息,可以进一步体现注册用户的基本属性;
(5)注册用户发布的可供应资源的质量信息、需求信息及完成供应信息,以电子商务网站为例,这里的质量信息、需求信息及完成供应信息例如分别对应于会员所发布offer的评分数据、订单数据及成交数据,所述评分数据例如可以由网站管理方直接打分并显示给访问者参考,由此可见,这些信息可用来体现注册用户所发布资源的质量。
基于由基础数据库提供的上述用户属性数据,在一个实施例中,本步骤进一步可以利用RFM模型来对满足一定条件的网站注册用户进行打分、排序,并使排在前面的一定数量注册用户进入当前的推荐池子。这里所指的满足一定条件的注册用户实际上是对网站所有注册用户进行的初筛,在一个实施例中,初筛条件的设置既要考虑到能使结果覆盖足够比例(例如70%)的注册用户,又要考虑到访问者对最终搜索结果的体验,也即,要保证可能进入推荐池子的注册用户所发布的是高质量的可供应资源信息;以电子商务网站为例,这里的初筛条件例如可以设置为:注册用户所发布的评分超过2级(例如由低至高包括1-5共5级)的offer数量要大于等于2,且注册用户最近30天内的登录次数要大于1。接续,上述RFM模型在相关技术中通常用于商场销售,在RFM模型中,R(Recency,近度)表示客户最近一次购买的时间距目前有多远,F(Frequency,频度)表示客户在最近一段时间内购买的次数,M(Monetary,额度)表示客户在最近一段时间内购买的金额;一般的分析型CRM着重于对客户贡献度的分析,而RFM则强调以客户的行为来区分客户,RFM分析技术主要依据上述三个参数预测客户将来的行为,对客户进行分类,找出客户交易的规律和趋势,方便企业采取相应的营销策略防止大客户流失,最终达到增量销售的目的。具体到本实施例中,RFM模型中的三个参数可以分别对应于注册用户最近一次被推荐的日期(R)、注册用户在预设第一期间内被推荐的次数(F)以及注册用户在预设第二期间内得到的来自所述访问者的反馈次数(M),可以理解,这三个参数都能够在对基础数据库提供的用户属性数据进行统计分析的基础上得到。
进一步,在一个实施例中,本步骤可以采用一定的数学方法来基于上述RFM模型对注册用户进行打分。在一个实施例中,可以采用下面的权值系数方法来计算分值,例如,其计算表达式可以是:
score=a*r+b*f+c*m
其中,score表示要计算的分值;r对应于RFM模型中的参数R,具体取值可以是对注册用户最近一次被推荐的日期进行归类分组,并按不同分组赋以不同的值,例如,以2012年2月1日为当前日期,将注册用户最近一次被推荐的日期分为2012年1月1日以前、2012年1月1-10日、2012年1月11-20日、2012年1月21-31日共4组,分别对应为r赋值为10、20、30、40;接续,式中f对应于RFM模型中的参数F,并可以直接取值为注册用户在预设第一期间内被推荐的次数;式中m则对应于RFM模型中的参数M,其既可以参照r的取值方法,按照注册用户在预设第二期间内得到的来自访问者的反馈次数进行归类分组并按不同分组来赋以不同的值,也可以参照f的取值方法,直接取值为注册用户在预设第二期间内得到的来自访问者的反馈次数;接续,上述表达式中a、b、c的值则可以是根据当前数据中r、f、m的取值范围和各个值段的占比而指定的加权系数。应当理解的是,本申请基于RFM模型为注册用户打分排序并不限于采用上述权值系数的计算方法,该方法仅用作示例,不能解释为对于本申请保护范围的限制。
接续,在对注册用户打分的基础上,可以利用分值为参与打分的所有注册用户进行排序,并使排在前面的一定数量注册用户进入当前的推荐池子,后续将会提到,这里进入推荐池子的注册用户(也即被推荐的注册用户)所发布的可供应资源信息可以依序显示在搜索引擎的搜索结果中,并且搜索结果中可供应资源信息的显示排序除了按照关键词的相关性排序外,也可以参照各信息所对应的注册用户在本步骤所得到的分值大小进行排序。
S120、根据步骤S110得到的推荐结果构建索引数据库,并在搜索引擎收到访问者的搜索请求时,根据该搜索请求中包括的关键词在所述索引数据库内搜索匹配的可供应资源信息,进而依序显示与各注册用户对应的可供应资源信息。
经过步骤S110中基于用户属性数据并利用RFM模型进行打分排序并推荐之后,本步骤中可以使搜索引擎直接利用步骤S110得到的排序数据。具体而言,结合背景技术部分的内容可知,正常情况下,搜索引擎在收到来自访问者的搜索请求时,是直接根据搜索请求携带的关键词在网站的可供应资源数据库中检索资源信息的结果,这里搜索引擎使用的可供应资源数据库可以是包括当前网站发布的所有可供应资源的完整数据库,也可以是根据该完整数据库而随机构建的随机数据库,该随机数据库中仅包括当前网站发布的所有可供应资源中的一部分资源信息;实际上,在网站发布的可供应资源信息量十分巨大的情况下,为了缩短搜索引擎的计算时间、保证搜索结果的及时显示,大部分网站的搜索引擎在进行关键词检索时采用的都是定时构建(例如,每隔3-4小时构建一次)的随机数据库。相应地,在本实施例中,可以直接利用步骤S110中得到的进入推荐池子的注册用户,将包括这些注册用户所发布的可供应资源信息并依据关键词相关性进行构建的索引数据库用来替代上述搜索引擎通常用到的随机数据库,这样一来,可以使得本申请的技术方案对于搜索引擎的改动成本及难度达到最低,更重要的是不会对搜索引擎的计算时间造成影响,从而保证了搜索结果的及时显示。
进一步,在一个实施例中,搜索引擎在收到访问者的搜索请求时,可以根据该搜索请求中包括的关键词在上述包括有被推荐注册用户所发布可供应资源信息的索引数据库中搜索匹配的可供应资源信息,并根据步骤S110中得到的排序结果依序显示与各注册用户对应的可供应资源信息。换言之,搜索引擎在上述索引数据库中检索到匹配的可供应资源信息后,可以继续按照步骤S110中得到的排序结果来显示这些匹配的可供应资源信息,举例来说,搜索引擎检索到的匹配可供应资源信息a和b分别是由推荐池子中的注册用户A和B发布,那么搜索引擎最终显示的搜索结果中,可供应资源信息a和b的排序也可以参照注册用户A和B在推荐池子中的排序;可以理解,采用这种排序方式最终显示的可供应资源信息,综合参考了关键词相关性和步骤S110所得到的排序结果,因此相当于对常规关键词检索的相关性结果起到了修正作用。然而,本技术方案也并不仅限于此,在一个实施例中,搜索引擎在使用上述索引数据库搜索到匹配的可供应资源信息之后,也可以类似于现有技术那样完全按照关键词的相关性大小来依序显示可供应资源信息,尽管如此,由于搜索引擎使用的检索数据库是基于步骤S110经过打分排序后得到的推荐池子,因此此时搜索结果中显示的可供应资源信息也已经能够在一定程度上体现注册用户的属性数据。
综上所述,本申请实施例基于用户属性的搜索实现方法及系统,能够在搜索引擎搜索得到的可供应资源信息结果中体现出信息发布者(即注册用户)的用户属性,并且无需由搜索引擎处理与用户属性相关的海量数据,从而避免造成搜索引擎计算时间的增加和结果显示的延迟。
接续,在一个实施例中,上述步骤S110与S120之间还包括以下步骤S111。
S111、计算网站的所有注册用户中各类型的注册用户之间的分布比例,并使被推荐的注册用户中各类型的注册用户之间的比例与该分布比例相符。
通常,为了方便对注册用户进行管理以及便于为访问者提供快速、准确的定位,信息发布型网站会对发布可供应资源信息的注册用户进行分类。以上述电子商务网站为例,其可以按照所处行业对发布offer信息的注册用户(例如可称为卖家)进行分类。进一步,在一个实施例中,考虑到各个类型的注册用户之间分布不均,可以在进行注册用户的推荐时保证进入推荐池子的各类型注册用户的分布比例与所有注册用户中各类型注册用户的分布比例大致相符。因此,在本步骤中,可以计算当前网站所有注册用户中各类型的注册用户之间的分布比例,在进行步骤S110的推荐和打分排序后,可以按照先后顺序对进入推荐池子的注册用户进行替换操作,以使得最后进入推荐池子,也即被推荐的注册用户中各类型的注册用户之间的比例与上述分布比例相符。
以电子商务网站举例来说,假设当前网站所有注册用户中计算机数码、日常百货和图书音像这三类行业的注册用户之间的分布比例为3∶2∶1,在进行步骤S110的推荐和打分排序后,前60名进入推荐池子的注册用户中上述三类行业所占的数量均为20名,经过本步骤S111,则可以从60名之外的注册用户中依打分排序选取10名计算机数码行业的注册用户,用来替换推荐池子中20名图书音像行业注册用户里的后10名注册用户,同时仍然维持最终得到的60名推荐用户的打分排序,这样一来最后推荐池子中60名被推荐注册用户在计算机数码、日常百货和图书音像这三类行业的分布比例便可以跟在所有注册用户中的分布比例保持一致。
接续,在一个实施例中,上述步骤120之后还包括步骤S130。
S130、统计被推荐的注册用户在被推荐后预设第三期间内来自访问者的反馈次数,并判断该反馈次数是否小于预设阈值,如果是则取消对该注册用户的推荐。
本步骤主要用于在使部分注册用户被推荐进入推荐池子之后,根据后期的访问者反馈情况对这些注册用户进行调节。在一个实施例中,本步骤可以统计注册用户在进入推荐池子数天内产生的反馈次数,并将该反馈次数与针对该类型用户所设置的阈值进行比较,以此来区分是否有必要继续推荐。如果上述反馈次数达到或超出预设阈值,则表明推荐效果良好,可以继续使该注册用户保持被推荐的状态;否则,如果反馈次数小于预设阈值,则表明没有产生预期的推荐效果,于是便可以从推荐池子中去除该注册用户,同时可以补入相应数量的注册用户。仍以电子商务网站为例,上述的反馈次数可以通过以下方式进行统计,例如,在访问者点击注册用户在网站上公布的联系方式时可计一次反馈,在访问者通过网站提供的聊天工具向注册用户发送第一条留言时可计一次反馈(之后在同一聊天窗口的留言均不统计),以及在访问者对注册用户在网站上发布的offer进行下单预订或购买时可计一次反馈等等。
利用本步骤S130对推荐池子中的注册用户进行调节可以带来两点益处:首先,可以避免长期推荐没有效果的注册用户,浪费有限的推荐资源,造成不良的用户体验。其次,也可以给其他没有得到推荐的会员创造机会,使网站的推荐资源得到充分利用。
接续,在一个实施例中,上述步骤S120具体包括以下步骤S121。
S121、搜索引擎在收到访问者的搜索请求时,判断该搜索请求中是否包括注册用户的指定类型,如果是则在根据该搜索请求中包括的关键词搜索得到匹配的可供应资源信息后,根据上述步骤S110得到的排序结果依序显示与指定类型的注册用户对应的可供应资源信息。
如以上步骤S111中所述,信息发布型网站对发布可供应资源信息的注册用户进行分类,可以便于为访问者提供快速、准确的定位。具体而言,访问者在网站上检索可供应资源信息时,可以通过指定资源信息所属的类型(也即发布该资源的注册用户所属的类型)来加快搜索引擎的处理速度。在一个实施例中,如果访问者在当前网站上输入关键词进行搜索同时还可能指定了注册用户类型,本步骤即可以对搜索请求中是否包括注册用户的指定类型进行判断,如果不包括,则可以在根据关键词搜索得到匹配的可供应资源信息后,根据步骤S110得到的推荐池子中的排序结果显示各注册用户对应的可供应资源信息;否则,如果搜索请求中包括注册用户的指定类型,则可以在根据关键词搜索得到匹配的可供应资源信息后,根据推荐池子中的排序结果仅显示其中与访问者指定类型相符的注册用户所对应的可供应资源信息。如此一来,本申请实施例的搜索实现方法,在结果中体现出用户属性的同时,也为访问者提供了指定类型的搜索服务,以电子商务网站为例,即可以实现指定行业的“专场搜索”的效果,从而扩展了搜索应用,进一步提升了访问者的使用体验。
对应于以上基于用户属性的搜索实现方法,本申请的实施例还提供一种基于用户属性的搜索实现系统,其同样供网站的搜索引擎用来根据访问者的搜索请求搜索并显示由注册用户在该网站上发布的可供应资源信息。图2为本申请基于用户属性的搜索实现系统实施例结构图,如图所示,本实施例的系统包括用户属性统计装置21及搜索装置22。
在一个实施例中,用户属性统计装置21用于根据注册用户的属性数据并利用RFM模型对注册用户进行排序并推荐被排序在预设位数之前的注册用户,其中RFM模型的参数例如可以包括注册用户最近一次被推荐的日期(R)、注册用户在预设第一期间内被推荐的次数(F)以及注册用户在预设第二期间内得到的来自访问者的反馈次数(M)。搜索装置22则用于根据用户属性统计装置21得到的推荐结果构建索引数据库,并在搜索引擎收到访问者的搜索请求时,根据该搜索请求中包括的关键词在上述索引数据库内搜索匹配的可供应资源信息,进而依序显示与注册用户对应的可供应资源信息。
接续,如图所示,在一个实施例中,本申请的搜索实现系统还可以包括用户属性数据库23,其用于存储上述注册用户的属性数据;且该属性数据例如可以包括下列数据的任意组合:
(1)注册用户的注册信息,也即在网站上发布可供应资源信息的用户在注册时录入的基本信息,其可以体现注册用户的基本属性;
(2)注册用户浏览网站的行为数据,是指某个注册用户对于其他注册用户的公开信息以及所发布资源信息的浏览行为,以及对于自身注册信息以及所发布资源信息的浏览、修改和完善等行为,这种信息的价值主要在于体现注册用户的活跃度;
(3)注册用户及其发布的可供应资源被访问者浏览的行为数据,其主要在于体现注册用户及其所发布资源信息对于网站访问者的吸引力;
(4)通过CRM系统或电话调研得到的用户信息,也即由网站管理方通过CRM系统或电话调研主动得到的注册用户信息,用来更新或补充注册用户的基本信息,可以进一步体现注册用户的基本属性;
(5)注册用户发布的可供应资源的质量信息、需求信息及完成供应信息,以电子商务网站为例,这里的质量信息、需求信息及完成供应信息例如分别对应于会员所发布offer的评分数据、订单数据及成交数据,所述评述数据例如可以由网站管理方直接打分并显示给访问者参考,由此可见,这些信息可用来体现注册用户所发布资源的质量。
接续,如图所示,在一个实施例中,本申请的搜索实现系统还可以包括用户分布统计装置24,其用于计算当前网站的所有注册用户中各类型的注册用户之间的分布比例,并使通过用户属性统计装置21被推荐的注册用户中各类型的注册用户之间的比例与前述计算得出分布比例相符。
接续,如图所示,在一个实施例中,本申请的搜索实现系统还可以包括反馈统计装置25,其用于统计被推荐的注册用户在被推荐后的预设第三期间内来自访问者的反馈次数,并判断该反馈次数是否小于预设阈值,如果是则通知用户属性统计装置21取消对该注册用户的推荐。
接续,如图所示,在一个实施例中,本申请的搜索实现系统还可以包括用户过滤装置26,其用于在搜索引擎收到来自访问者的搜索请求时,判断该搜索请求中是否包括注册用户的指定类型,如果是则通知搜索装置22在根据该搜索请求中包括的关键词搜索得到匹配的可供应资源信息后,根据用户属性统计装置21得到的排序结果依序显示与该指定类型的注册用户对应的可供应资源信息。
综上所述,本申请实施例提供的基于用户属性的搜索实现方法及系统,供网站的搜索引擎用来根据访问者的搜索请求搜索并显示由注册用户在所述网站上发布的可供应资源信息,能够在搜索的可供应资源信息结果中体现出信息发布者(即注册用户)的用户属性,并且无需由搜索引擎处理与用户属性相关的海量数据,从而避免造成搜索引擎计算时间的增加和结果显示的延迟。并且,由上述实施例可知,一方面,本申请基于用户属性的搜索实现方法各个步骤及其整体,可以对应于存储在计算机可读存储介质中的计算机可执行指令及其组成的计算机可执行程序;而另一方面,本申请基于用户属性的搜索实现系统,则可以对应于用以执行该计算机可执行程序或指令的各部分计算机硬件及其组成的硬件集合。
虽然已参照几个典型实施例描述了本申请,但应当理解,所用的术语是说明和示例性、而非限制性的术语。由于本申请能够以多种形式具体实施而不脱离申请的精神或实质,所以应当理解,上述实施例不限于任何前述的细节,而应在随附权利要求所限定的精神和范围内广泛地解释,因此落入权利要求或其等效范围内的全部变化和改型都应为随附权利要求所涵盖。

Claims (10)

1.一种基于用户属性的搜索实现方法,供网站的搜索引擎用来根据访问者的搜索请求搜索并显示由注册用户在所述网站上发布的可供应资源信息,该方法包括以下步骤:
S1.根据所述注册用户的属性数据并利用近度频度额度RFM模型对所述注册用户进行排序并推荐被排序在预设位数之前的注册用户,所述RFM模型的参数包括所述注册用户最近一次被推荐的日期、所述注册用户在预设第一期间内被推荐的次数以及所述注册用户在预设第二期间内得到的来自所述访问者的反馈次数;以及
S2.根据所述步骤S1得到的推荐结果构建索引数据库,并在所述搜索引擎收到所述访问者的搜索请求时,根据该搜索请求中包括的关键词在所述索引数据库内搜索匹配的所述可供应资源信息,进而依序显示与所述注册用户对应的可供应资源信息。
2.如权利要求1所述的基于用户属性的搜索实现方法,其中,所述注册用户的属性数据包括以下数据的任意组合:所述注册用户的注册信息,所述注册用户浏览所述网站的行为数据,所述注册用户及其发布的所述可供应资源被所述访问者浏览的行为数据,通过客户关系管理CRM系统得到的用户信息,通过电话调研得到的用户信息,所述注册用户发布的所述可供应资源的质量信息、需求信息及完成供应信息。
3.如权利要求1所述的基于用户属性的搜索实现方法,其中,所述步骤S1与S2之间还包括:
计算所述网站的所有注册用户中各类型的注册用户之间的分布比例,并使被推荐的注册用户中各类型的注册用户之间的比例与所述分布比例相符。
4.如权利要求1所述的基于用户属性的搜索实现方法,其中,所述步骤S2之后还包括:
统计被推荐的注册用户在被推荐后预设第三期间内来自所述访问者的反馈次数,并判断该反馈次数是否小于预设阈值,如果是则取消对该注册用户的推荐。
5.如权利要求1至4所述的基于用户属性的搜索实现方法,其中,所述步骤S2还包括:
所述搜索引擎在收到所述访问者的搜索请求时,判断该搜索请求中是否包括注册用户的指定类型,如果是则在根据该搜索请求中包括的关键词搜索得到匹配的可供应资源信息后,根据所述步骤S1得到的排序结果依序显示与所述指定类型的注册用户对应的可供应资源信息。
6.一种基于用户属性的搜索实现系统,供网站的搜索引擎用来根据访问者的搜索请求搜索并显示由注册用户在所述网站上发布的可供应资源信息,该系统包括:
用户属性统计装置,用于根据所述注册用户的属性数据并利用近度频度额度RFM模型对所述注册用户进行排序并推荐被排序在预设位数之前的注册用户,所述RFM模型的参数包括所述注册用户最近一次被推荐的日期、所述注册用户在预设第一期间内被推荐的次数以及所述注册用户在预设第二期间内得到的来自所述访问者的反馈次数;以及
搜索装置,用于根据所述用户属性统计装置得到的推荐结果构建索引数据库,并在所述搜索引擎收到所述访问者的搜索请求时,根据该搜索请求中包括的关键词在所述索引数据库内搜索匹配的所述可供应资源信息,进而依序显示与所述注册用户对应的可供应资源信息。
7.如权利要求6所述的基于用户属性的搜索实现系统,其中,还包括用户属性数据库,用于存储所述注册用户的属性数据;且所述属性数据包括以下数据的任意组合:所述注册用户的注册信息,所述注册用户浏览所述网站的行为数据,所述注册用户及其发布的所述可供应资源被所述访问者浏览的行为数据,通过客户关系管理CRM系统得到的用户信息,通过电话调研得到的用户信息,所述注册用户发布的所述可供应资源的质量信息、需求信息及完成供应信息。
8.如权利要求6所述的基于用户属性的搜索实现系统,其中,该系统还包括:
用户分布统计装置,用于计算所述网站的所有注册用户中各类型的注册用户之间的分布比例,并使被推荐的注册用户中各类型的注册用户之间的比例与所述分布比例相符。
9.如权利要求6所述的基于用户属性的搜索实现系统,其中,该系统还包括:
反馈统计装置,用于统计被推荐的注册用户在被推荐后预设第三期间内来自所述访问者的反馈次数,并判断该反馈次数是否小于预设阈值,如果是则通知所述用户属性统计装置取消对该注册用户的推荐。
10.如权利要求6-9任一项所述的基于用户属性的搜索实现系统,其中,该系统还包括:
用户过滤装置,用于在所述搜索引擎收到所述访问者的搜索请求时,判断该搜索请求中是否包括注册用户的指定类型,如果是则通知所述搜索装置在根据该搜索请求中包括的关键词搜索得到匹配的可供应资源信息后,根据所述用户属性统计装置得到的排序结果依序显示与所述指定类型的注册用户对应的可供应资源信息。
CN201210068815.4A 2012-03-15 2012-03-15 基于用户属性的搜索实现方法及系统 Active CN103309894B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201210068815.4A CN103309894B (zh) 2012-03-15 2012-03-15 基于用户属性的搜索实现方法及系统
HK13113049.9A HK1185687A1 (zh) 2012-03-15 2013-11-22 基於用戶屬性的搜索實現方法及系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210068815.4A CN103309894B (zh) 2012-03-15 2012-03-15 基于用户属性的搜索实现方法及系统

Publications (2)

Publication Number Publication Date
CN103309894A true CN103309894A (zh) 2013-09-18
CN103309894B CN103309894B (zh) 2016-04-27

Family

ID=49135131

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210068815.4A Active CN103309894B (zh) 2012-03-15 2012-03-15 基于用户属性的搜索实现方法及系统

Country Status (2)

Country Link
CN (1) CN103309894B (zh)
HK (1) HK1185687A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126651A (zh) * 2016-06-28 2016-11-16 成都育芽科技有限公司 一种互联网应用程序的轻量级页面引导方法
CN106156088A (zh) * 2015-04-01 2016-11-23 阿里巴巴集团控股有限公司 一种索引数据处理方法、数据查询方法及装置
CN106484426A (zh) * 2016-10-20 2017-03-08 乐视控股(北京)有限公司 一种反馈搜索信息的方法、装置及系统
CN106611344A (zh) * 2015-10-23 2017-05-03 北京国双科技有限公司 挖掘潜在客户的方法及装置
CN107402982A (zh) * 2017-07-07 2017-11-28 阿里巴巴集团控股有限公司 数据写入、数据匹配方法、装置及计算设备
CN109299388A (zh) * 2018-11-16 2019-02-01 杭州安芯科技有限公司 一种查找高质量社交用户的系统及方法
CN109388649A (zh) * 2018-09-28 2019-02-26 湖南土流信息有限公司 一种土地智能推荐方法及系统
CN111127105A (zh) * 2019-12-25 2020-05-08 青梧桐有限责任公司 用户分层模型构建方法及系统、运营分析方法及系统
CN116737966A (zh) * 2023-08-15 2023-09-12 中国标准化研究院 一种基于知识本体的知识体系的建模方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1755678A (zh) * 2004-09-30 2006-04-05 微软公司 在排序搜索结果时引入锚文本用的系统和方法
CN101620625A (zh) * 2009-07-30 2010-01-06 腾讯科技(深圳)有限公司 一种搜索关键词排序方法、装置和搜索引擎
US20100094673A1 (en) * 2008-10-14 2010-04-15 Ebay Inc. Computer-implemented method and system for keyword bidding
CN101937432A (zh) * 2009-06-29 2011-01-05 刘健 一种按照供需信息进行两方撮合的系统与方法
CN101996215A (zh) * 2009-08-27 2011-03-30 阿里巴巴集团控股有限公司 一种应用于电子商务网站的信息匹配方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1755678A (zh) * 2004-09-30 2006-04-05 微软公司 在排序搜索结果时引入锚文本用的系统和方法
US20100094673A1 (en) * 2008-10-14 2010-04-15 Ebay Inc. Computer-implemented method and system for keyword bidding
CN101937432A (zh) * 2009-06-29 2011-01-05 刘健 一种按照供需信息进行两方撮合的系统与方法
CN101620625A (zh) * 2009-07-30 2010-01-06 腾讯科技(深圳)有限公司 一种搜索关键词排序方法、装置和搜索引擎
CN101996215A (zh) * 2009-08-27 2011-03-30 阿里巴巴集团控股有限公司 一种应用于电子商务网站的信息匹配方法和系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156088A (zh) * 2015-04-01 2016-11-23 阿里巴巴集团控股有限公司 一种索引数据处理方法、数据查询方法及装置
CN106156088B (zh) * 2015-04-01 2020-02-04 阿里巴巴集团控股有限公司 一种索引数据处理方法、数据查询方法及装置
CN106611344A (zh) * 2015-10-23 2017-05-03 北京国双科技有限公司 挖掘潜在客户的方法及装置
CN106126651A (zh) * 2016-06-28 2016-11-16 成都育芽科技有限公司 一种互联网应用程序的轻量级页面引导方法
CN106484426A (zh) * 2016-10-20 2017-03-08 乐视控股(北京)有限公司 一种反馈搜索信息的方法、装置及系统
CN107402982A (zh) * 2017-07-07 2017-11-28 阿里巴巴集团控股有限公司 数据写入、数据匹配方法、装置及计算设备
CN109388649A (zh) * 2018-09-28 2019-02-26 湖南土流信息有限公司 一种土地智能推荐方法及系统
CN109299388A (zh) * 2018-11-16 2019-02-01 杭州安芯科技有限公司 一种查找高质量社交用户的系统及方法
CN111127105A (zh) * 2019-12-25 2020-05-08 青梧桐有限责任公司 用户分层模型构建方法及系统、运营分析方法及系统
CN116737966A (zh) * 2023-08-15 2023-09-12 中国标准化研究院 一种基于知识本体的知识体系的建模方法

Also Published As

Publication number Publication date
CN103309894B (zh) 2016-04-27
HK1185687A1 (zh) 2014-02-21

Similar Documents

Publication Publication Date Title
CN103309894B (zh) 基于用户属性的搜索实现方法及系统
US11100178B2 (en) Method and device for pushing information
US9311662B2 (en) Computer-implemented method and system for managing keyword bidding prices
US10402858B2 (en) Computer-implemented method and system for enabling the automated selection of keywords for rapid keyword portfolio expansion
US9529897B2 (en) Computer-implemented method and system for combining keywords into logical clusters that share similar behavior with respect to a considered dimension
CN102385601B (zh) 一种产品信息的推荐方法及系统
US9043302B1 (en) Campaign and competitive analysis and data visualization based on search interest data
US8893012B1 (en) Visual indicator based on relative rating of content item
US8667135B1 (en) Detecting and reporting on consumption rate changes
CN104391849A (zh) 融入时间上下文信息的协同过滤推荐方法
CN105677767A (zh) 一种设备配置推荐方法和装置
US8626604B1 (en) Aggregating product endorsement information
CN103593350A (zh) 一种推荐推广关键词价格参数的方法和装置
CN105426528A (zh) 一种商品数据的检索排序方法及系统
WO2013025874A2 (en) Page reporting
CN108460082A (zh) 一种推荐方法及装置,电子设备
EP2509007A1 (en) Evaluating supply of electronic content relating to keywords
CN103383702A (zh) 一种基于用户投票排名的个性化新闻推荐的方法及系统
Lai Applying knowledge flow mining to group recommendation methods for task‐based groups
CN104835067A (zh) 网络广告实时竞价系统
Sun et al. A time-sensitive collaborative filtering model in recommendation systems
CN105550282A (zh) 利用多维数据预测用户兴趣的方法
CN104077713A (zh) 访问网站的用户的需求评估、广告推送方法和系统
CN110347923B (zh) 一种可回溯的快速裂变式构建用户画像的方法
US10013699B1 (en) Reverse associate website discovery

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1185687

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1185687

Country of ref document: HK