CN103514187A - 一种提供搜索结果的方法及装置 - Google Patents

一种提供搜索结果的方法及装置 Download PDF

Info

Publication number
CN103514187A
CN103514187A CN201210211323.6A CN201210211323A CN103514187A CN 103514187 A CN103514187 A CN 103514187A CN 201210211323 A CN201210211323 A CN 201210211323A CN 103514187 A CN103514187 A CN 103514187A
Authority
CN
China
Prior art keywords
price
merchandise news
standard deviation
mean value
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210211323.6A
Other languages
English (en)
Other versions
CN103514187B (zh
Inventor
李嘉森
姚建强
帅朝谦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210211323.6A priority Critical patent/CN103514187B/zh
Publication of CN103514187A publication Critical patent/CN103514187A/zh
Application granted granted Critical
Publication of CN103514187B publication Critical patent/CN103514187B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种提供搜索结果的方法及装置,用以解决现有技术中将排序后的商品信息提供给用户后,用户仍需要重新搜索,导致服务器的压力较大的问题。该方法服务器基于接收到的搜索词进行搜索时,查找预先确定的该搜索词对应的价格最优值,确定搜索到的商品信息中包含的价格与该价格最优值的差值的绝对值,并按照确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。通过上述方法,服务器向用户提供的商品信息中,排序靠前的商品信息即为包含的价格与价格最优值相差较小的商品信息,与现有技术中单一按照包含的价格从高到低或从低到高的顺序提供搜索结果的方法相比,可以减少用户设置筛选条件并重新搜索的次数,减轻了服务器的压力。

Description

一种提供搜索结果的方法及装置
技术领域
本申请涉及通信技术领域,尤其涉及一种提供搜索结果的方法及装置。
背景技术
目前,大多购物网站都可以向用户提供搜索功能,用户可以通过该搜索功能搜索其想要的商品的商品信息。具体的,用户向购物网站的服务器发送搜索词,服务器基于接收到的搜索词,搜索与该搜索词相关的商品信息,并将搜索到的商品信息提供给用户。
在实际应用中,由于用户通常比较关注的是排序比较靠前的商品信息,因此服务器搜索到商品信息之后,需要对搜索到的商品信息进行排序,并将排序后的商品信息提供给用户。而由于一般用户对商品信息中包含的价格比较关注,因此,在现有技术中,服务器在对搜索到的商品信息进行排序时,可以按照所包含的价格由高到低或由低到高的顺序对搜索到的商品信息进行排序。
但是,对于同一种商品而言,不同的卖家制定的该商品的出售价格也有所不同。例如,作为买家的用户向服务器发送的搜索词为某品牌的跑鞋,在服务器搜索到的商品信息中,10个商品信息中包含的价格为20元、20个商品信息中包含的价格为100元、5个商品信息中包含的价格为300元。而实际上该品牌的跑鞋的价格应该是120元,显然,作为买家的用户会直观的认为以100元出售该跑鞋更加合理,从而关注这20个所包含的价格为100元的商品信息。
然而,现有技术中服务器只能单一的按照所包含的价格由高到低或由低到高的顺序对搜索到的商品信息进行排序,假设服务器按照价格由低到高的顺序对上例中搜索到的商品信息进行排序,则排序结果为:10个包含的价格为20元的商品信息、20个包含的价格为100元的商品信息、5个包含的价格为300元的商品信息。
显然,服务器并未将这20个包含的价格为100元的商品信息排在靠前的位置,而是将10个包含的价格为20元的商品信息排在了靠前的位置,因此服务器将排序后的商品信息提供给用户后,排序靠前的商品信息对应的商品往往并不是用户认为价格合理的商品,从而用户就会不断的设置筛选条件进行重新搜索,导致服务器的压力增大。
发明内容
本申请实施例提供一种提供搜索结果的方法及装置,用以解决现有技术中服务器将排序后的商品信息提供给用户后,用户仍需要不断的设置筛选条件进行重新搜索,导致服务器的压力较大的问题。
本申请实施例提供的一种提供搜索结果的方法,包括:
服务器基于接收到的搜索词搜索相关的商品信息;并
查找预先确定的所述搜索词对应的价格最优值;以及
分别确定搜索到的每个商品信息中包含的价格与查找到的价格最优值的差值的绝对值,按照分别确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。
本申请实施例提供的一种提供搜索结果的装置,包括:
搜索模块,用于基于接收到的搜索词搜索相关的商品信息;
最优值确定模块,用于查找预先确定的所述搜索词对应的价格最优值;
提供模块,用于分别确定搜索到的商品信息中包含的价格与查找到的价格最优值的差值的绝对值,按照分别确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。
本申请实施例提供一种提供搜索结果的方法及装置,该方法服务器基于接收到的搜索词进行搜索时,查找预先确定的该搜索词对应的价格最优值,分别确定搜索到的每个商品信息中包含的价格与该价格最优值的差值的绝对值,并按照确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。通过上述方法,服务器向用户提供的商品信息中,排序靠前的商品信息即为包含的价格与价格最优值相差较小的商品信息,与现有技术中单一按照包含的价格从高到低或从低到高的顺序提供搜索结果的方法相比,可以有效减少用户设置筛选条件并重新搜索的次数,这减轻了服务器的压力。
附图说明
图1为本申请实施例提供的提供搜索结果的过程;
图2为本申请实施例提供的拟合基于该搜索词搜索到的商品信息中包含的价格的概率密度函数的过程;
图3为本申请实施例提供的一种提供搜索结果的装置结构示意图。
具体实施方式
由于现有技术中服务器只能单一的按照包含的价格由高到低或由低到高的顺序对搜索到的商品信息进行排序并提供,因此,现有技术中服务器提供的排序靠前的商品信息所包含的价格往往与大多用户所认为的合理价格相差甚远,这就会导致用户需要不断的设置筛选条件进行重新搜索,导致服务器的压力增大。
本申请实施例服务器预先确定搜索词对应的价格最优值,该搜索词对应的价格最优值即为在基于该搜索词所能搜索到的商品信息所包含的价格中,被大多用户所认为的合理价格,在基于搜索词进行搜索时,按照搜索到的商品信息中包含的价格与预先确定的该搜索词对应的价格最优值的差值的绝对值越小,排序越靠前的方式,对搜索到的商品信息进行排序并提供,从而向用户提供的排序靠前的商品信息即为包含的价格与该搜索词对应的价格最优值较为接近的商品信息,以降低用户通过设置筛选条件进行重新搜索的次数,减轻服务器的压力。
下面结合说明书附图,对本申请实施例进行详细描述。
图1为本申请实施例提供的提供搜索结果的过程,具体包括以下步骤:
S101:服务器基于接收到的搜索词搜索相关的商品信息。
与现有技术中类似的,用户想要搜索某种商品的商品信息时,向服务器发送相应的搜索词,服务器接收到用户发送的搜索词后,基于接收到的该搜索词,搜索与该搜索词相关的商品信息。
S102:查找预先确定的该搜索词对应的价格最优值。
在本申请实施例中,服务器预先针对搜索日志中记录的每个搜索词都确定了相应的价格最优值,因此服务器基于接收到的该搜索词进行搜索后,查找预先确定的该搜索词对应的价格最优值。
其中,预先确定该搜索词对应的价格最优值的方法可以为:根据基于该搜索词所能搜索到的所有商品信息中包含的价格,将该所有商品信息中包含的价格的平均价格作为该搜索词对应的价格最优值,或者将该所有商品信息中包含的价格的中位数作为该搜索词对应的价格最优值。当然,也可以人为设定该搜索词对应的价格最优值。
S103:分别确定搜索到的每个商品信息中包含的价格与查找到的价格最优值的差值的绝对值,按照分别确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。
也即,在对搜索到的商品信息进行排序时,按照所包含的价格与价格最优值的差值的绝对值越小,排序越靠前的方式进行排序,由于预先确定的该搜索词对应的价格最优值更加贴近大多数用户认为的以该搜索词搜索到的商品的合理价格,因此,按照步骤S103中的排序方式对搜索到的商品信息进行排序并提供给用户后,可以有效减少用户设置筛选条件进行重新搜索的次数,从而减轻服务器的压力。
在本申请实施例中,服务器需要预先针对搜索日志中记录的每个使用过的搜索词确定对应的价格最优值,确定某个搜索词对应的价格最优值的方法具体为,服务器查找搜索日志中记录的过去每次基于该搜索词进行搜索时,搜索到的商品信息中满足指定条件的商品信息,并根据查找到的商品信息中包含的价格,确定该搜索词对应的价格最优值。其中,满足指定条件的商品信息包括被用户点击的商品信息。当然,满足指定条件的商品信息还可以包括被用户收藏的商品信息、订购了相应商品的商品信息、分享的商品信息,以及其他用户执行了指定操作的商品信息。并且,服务器在查找过去每次基于该搜索词搜索到的满足指定条件的商品信息时,可以查找过去的设定时间段内每次基于该搜索词进行搜索时,搜索到的商品信息中满足指定条件的商品信息。
在实际应用中,服务器将基于该搜索词搜索到的商品信息提供给用户后,用户关注的往往是其认为包含的价格比较合理的商品信息,对于其认为包含的价格比较合理的商品信息,用户通常会进行点击操作以详细查看该商品信息,而对于其认为包含的价格不合理的商品信息,用户通常则不会进行点击操作而忽略该商品信息。因此,服务器根据过去每次基于该搜索词搜索到的商品信息中被点击的商品信息中包含的价格,确定该搜索词对应的价格最优值。
例如,假设要确定搜索词“1g显卡”对应的价格最优值,则服务器在搜索日志中查找过去以“1g显卡”为搜索词进行的搜索行为。假设查找到3次搜索行为,则进一步查找进行这3次搜索行为时每次搜索到的商品信息中满足指定条件的商品信息,也即查找每次以“1g显卡”为搜索词进行搜索后,搜索到的商品信息中被用户点击的商品信息。假设查找到第1次搜索到的商品信息中被点击的商品信息为商品A的信息,第2次搜索到的商品信息中被点击的商品信息为商品B的信息,第3次搜索到的商品信息中被点击的商品信息为商品C的信息,则服务器根据查找到的该商品A的信息中包含的价格、商品B的信息中包含的价格、商品C的信息中包含的价格,确定该搜索词“1g显卡”对应的价格最优值。其中,可以将查找到的商品信息中包含的价格的平均值确定为该搜索词对应的价格最优值,也即将商品A的信息、商品B的信息、商品C的信息中分别包含的价格的平均值作为该搜索词对应的价格最优值。
当然,在根据查找到的商品信息中包含的价格确定该搜索词对应的价格最优值时,可根据实际情况将查找到的商品信息中包含的价格转换为统一的度量价格。例如,根据实际情况将查找到的商品信息中包含的价格转换为每个商品的价格,或者每斤商品的价格,或者每升商品的价格,或者每平方米商品的价格等等。
通过上述方法服务器可以更加准确的确定出该搜索词对应的价格最优值,使后续基于该搜索词进行搜索时,通过图1所示的步骤S103对搜索到的商品信息进行排序并提供后,可以进一步减少用户设置筛选条件进行重新搜索的次数,以进一步减轻服务器的压力。
考虑到在实际应用中存在很多相似的搜索词,例如“1g显卡”和“显卡1g”,采用这两个搜索词搜索时,搜索到的商品信息是基本相同的,因此,服务器可以将搜索日志中记录的搜索词进行整理,将相似的搜索词整合为一个归一化搜索词,例如,将搜索词“1g显卡”和搜索词“显卡1g”整合为归一化搜索词“1g显卡”。在查找过去每次以该搜索词搜索到的商品信息中满足指定条件的商品信息时,则基于该搜索词的归一化搜索词在搜索日志中进行查找。
例如,将搜索日志中记录的搜索词“1g显卡”和搜索词“显卡1g”整合为归一化搜索词“1g显卡”后,如果要确定搜索词“显卡1g”对应的价格最优值,则确定该搜索词“显卡1g”的归一化搜索词为“1g显卡”,查找搜索日志中记录的过去每次基于“1g显卡”进行搜索时,搜索到的被用户点击的商品信息,并根据查找到的商品信息中包含的价格确定搜索词“显卡1g”对应的价格最优值。
较佳的,由于在实际应用中,对于以同一个搜索词搜索到的商品信息而言,搜索到的各商品信息中包含的价格的概率密度分布大致上是符合混合双高斯概率分布的,因此,服务器在根据查找到的各个满足指定条件的商品信息中包含的价格,确定该搜索词对应的价格最优值时,可以根据查找到的商品信息中包含的价格,采用混合双高斯模型拟合基于该搜索词搜索到的商品信息中包含的价格的概率密度函数,并根据拟合的概率密度函数,确定概率密度最大时对应的价格作为该搜索词对应的价格最优值。
其中,采用混合双高斯模型拟合基于该搜索词搜索到的商品信息中包含的价格的概率密度函数的过程具体如图2所示,图2为本申请实施例提供的拟合基于该搜索词搜索到的商品信息中包含的价格的概率密度函数的过程,具体包括以下步骤:
S201:根据查找到的商品信息中包含的价格,确定查找到的商品信息中包含的价格的总平均值。
例如,要确定搜索词“1g显卡”对应的价格最优值,服务器在搜索日志中查找过去以“1g显卡”为搜索词进行的搜索行时,搜索到的商品信息中满足指定条件的商品信息。假设共查找到n个满足指定条件的商品信息,其中,第i个商品信息中包含的价格记为xi,则确定这n个查找到的商品信息中包含的价格的总平均值
Figure BDA00001789200900071
S202:根据查找到的商品信息中包含的价格以及确定的总平均值,确定查找到的商品信息中包含的价格的总标准差。
继续沿用上例,确定了n个商品信息中包含的价格的总平均值
Figure BDA00001789200900072
之后,采用公式确定这n个商品信息中包含的价格的总标准差σ。
较佳的,对于查找到的商品信息中包含的价格,如果某个商品信息中包含的价格与确定的总平均值相差较大,则该商品信息中包含的价格就是异常数据,异常数据会影响后续拟合的准确性,因此,本申请实施例中服务器还可以剔除查找到的各商品信息包含的价格中的异常数据。具体的,继续沿用上例,针对查找到的n个商品信息中的第i个商品信息中包含的价格xi,如果
Figure BDA00001789200900074
的值大于3,则确定该第i个商品信息中包含的价格xi为异常数据,剔除该第i个商品信息中包含的价格xi。或者,如果
Figure BDA00001789200900081
的值不在设定范围内,则确定该第i个商品信息中包含的价格xi为异常数据,剔除该第i个商品信息中包含的价格xi,该设定范围例如可以为0.2~1.8。
S203:将确定的总平均值与第一设定参数的乘积作为第一平均值,将确定的总平均值与第二设定参数的乘积作为第二平均值,其中,第一设定参数大于1,第二设定参数小于1。
继续沿用上例,确定的第一平均值
Figure BDA00001789200900082
确定的第二平均值其中,a为第一设定参数,b为第二设定参数,本申请实施例中只要保证a和b中一个大于1,另一个小于1即可,例如a为0.3,b为1.3。
S204:将确定的总标准差同时作为第一标准差和第二标准差。
继续沿用上例,确定的第一标准差σ1=σ,确定的第二标准差σ2=σ。
S205:针对查找到的每个商品信息中包含的价格,采用公式 gamma ( i ) = p × 1 2 π σ 2 e - ( x i - mu 2 ) 2 2 σ 2 2 ( 1 - p ) × 1 2 π σ 1 e - ( x i - mu 1 ) 2 2 σ 1 2 + p × 1 2 π σ 2 e - ( x i - mu 2 ) 2 2 σ 2 2 确定每个价格对应的中间值。
其中,p为初始设定的权值。初始设定的权值可以设定为0.5。
继续沿用上例,针对查找到的n个商品信息中的第i个商品信息中包含的价格xi,采用上述公式确定该第i个商品信息中包含的价格xi对应的中间值gamma(i)。
S206:根据确定的每个价格对应的中间值,采用公式重新确定第一平均值,采用公式
Figure BDA00001789200900086
重新确定第二平均值。
S207:根据重新确定的第一平均值和第二平均值,采用公式
Figure BDA00001789200900091
重新确定第一标准差,采用公式 σ 2 = Σ i gamma ( i ) ( x i - mu 2 ) 2 Σ i gamma ( i ) 重新确定第二标准差。
其中,公式 σ 1 = Σ i ( 1 - gamma ( i ) ) ( x i - mu 1 ) 2 Σ i ( 1 - gamma ( i ) ) σ 2 = Σ i gamma ( i ) ( x i - mu 2 ) 2 Σ i gamma ( i ) 中的mu1和mu2为步骤S206中重新确定的第一平均值和第二平均值。
S208:采用公式
Figure BDA00001789200900095
重新确定权值。
其中,n为查找到的商品信息的数量。
S209:判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差是否满足设定条件,若是,则执行步骤S211,否则执行步骤S210。
在本申请实施例中,判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差是否满足设定条件的方法具体为:判断重新确定的第一平均值与上一次确定的第一平均值的差值在设定范围内,判断重新确定的第二平均值与上一次确定的第二平均值的差值在设定范围内,判断重新确定的第一标准差与上一次确定的第一标准差的差值在设定范围内,判断重新确定的第二标准差与上一次确定的第二标准差的差值在设定范围内;当上述四个判断中的至少一个判断结果为是时,判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差是否满足设定条件。
当然,也可以当上述四个判断中的至少两个或所有判断结果均为是时,判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差是否满足设定条件。
S210:根据重新确定的第一平均值、第二平均值、第一标准差、第二标准差、权值,重新确定每个价格对应的中间值,返回步骤S206。
也即,基于重新确定的第一平均值、第二平均值、第一标准差、第二标准差、权值,采用公式 gamma ( i ) = p × 1 2 π σ 2 e - ( x i - mu 2 ) 2 2 σ 2 2 ( 1 - p ) × 1 2 π σ 1 e - ( x i - mu 1 ) 2 2 σ 1 2 + p × 1 2 π σ 2 e - ( x i - mu 2 ) 2 2 σ 2 2 重新确定查找到的每个商品信息中包含的价格对应的中间值,并根据重新确定的每个中间值继续确定第一平均值、第二平均值、第一标准差、第二标准差和权值,直至确定的第一平均值、第二平均值、第一标准差、第二标准差满足设定条件为止。
S211:根据重新确定的第一平均值、第二平均值、第一标准差、第二标准、权值,确定函数 f ( x ) = ( 1 - p ) × 1 2 π σ 1 e - ( x - mu 1 ) 2 2 σ 1 2 + p × 1 2 π σ 2 e - ( x - mu 2 ) 2 2 σ 2 2 , 作为拟合的基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数。
继续沿用上例,当得到满足设定条件的第一平均值、第二平均值、第一标准差、第二标准差时,根据满足设定条件的第一平均值、第二平均值、第一标准差、第二标准差,以及最终确定的权值得到函数 f ( x ) = ( 1 - p ) × 1 2 π σ 1 e - ( x - mu 1 ) 2 2 σ 1 2 + p × 1 2 π σ 2 e - ( x - mu 2 ) 2 2 σ 2 2 , 即为拟合的基于该搜索词“1g显卡”搜索到的商品信息中包含的价格的概率密度函数。
在后续的过程中,则可以确定概率密度最大时对应的价格作为该搜索词“1g显卡”对应的价格最优值,也即得到的上述函数取最大函数值f(x)max时对应的自变量x的值,就是该搜索词“1g显卡”对应的价格最优值。这是因为,得到上述概率密度函数是基于查找到的满足指定条件的商品信息中包含的价格确定的,而满足指定条件的商品信息是被用户点击的商品信息,因此上述概率密度函数反映了当以该搜索词“1g显卡”进行搜索时,用户点击搜索到的商品信息中包含不同价格的商品信息的概率,点击包含某个价格的商品信息的概率越大,说明认为该价格是合理价格的用户越多,因此将概率密度最大时对应的价格作为该搜索词对应的价格最优值,可以更加准确的确定出该搜索词对应的价格最优值,以进一步减少用户设置筛选条件进行重新搜索的次数,减轻服务器的压力。
其中,在得到拟合的基于该搜索词搜索到的商品信息中包含的价格的概率密度函数 f ( x ) = ( 1 - p ) × 1 2 π σ 1 e - ( x - mu 1 ) 2 2 σ 1 2 + p × 1 2 π σ 2 e - ( x - mu 2 ) 2 2 σ 2 2 之后,由于该函数的最大值一定是在mu1和mu2之间出现,因此确定该函数取最大函数值f(x)max时对应的自变量x的值的方法可以为:将mu1到mu2的范围划分为若干个子范围,例如,可以将mu1到mu2的范围划分为n个子范围,分别为mu1到mu1+d、mu1+d到mu1+2d、mu1+2d到mu1+3d……、mu1+(n-1)d到mu2,其中,
Figure BDA00001789200900112
在划分的每个子范围中随机选择一个x的值,根据得到的概率密度函数 f ( x ) = ( 1 - p ) × 1 2 π σ 1 e - ( x - mu 1 ) 2 2 σ 1 2 + p × 1 2 π σ 2 e - ( x - mu 2 ) 2 2 σ 2 2 确定选择的每个x的值对应的函数值f(x),将确定的每个函数值f(x)中最大的函数值所对应的x的值确定为该函数取最大函数值f(x)max时对应的自变量x的值,也即该搜索词对应的价格最优函数。
较佳的,由于统计学中如果要确定某些样本的概率密度分布符合混合双高斯概率分布,就要求不同样本的数量要大于一定阈值,因此,本申请实施例中在采用图2所示的过程拟合基于该搜索词搜索到的商品信息中包含的价格的概率密度函数之前,还要确定查找到的满足指定条件且所包含的不同价格的商品信息的数量大于设定阈值。
另外,考虑到实际应用中基于某些搜索词搜索到的商品信息中包含的价格往往较高,采用如图2所示的过程拟合基于该搜索词搜索到的商品信息中包含的价格的概率密度函数时所需要的计算量较大,因此,在上述步骤S201中,可以将查找到的每个商品信息中包含的价格进行取对数运算,将得到的结果重新作为每个商品信息中包含的价格。
例如,针对查找到的n个满足指定条件的商品信息中的第i个商品信息中包含的价格xi,可以将log2xi的值重新作为该第i个商品信息中包含的价格,后续则根据重新确定的每个商品信息中包含的价格进行如图2所示的拟合过程。假设根据图2所示的过程最终确定出该搜索词对应的价格最优值为X,则还要将2X重新作为确定的该搜索词对应的价格最优值。
在得到了该搜索词对应的价格最优值后,还可以对得到的该搜索词的价格最优值进行人工调整,并保存该搜索词的价格最优值,用以在后续基于该搜索词进行搜索时,查找该搜索词的价格最优值,并根据搜索到的各商品信息中包含的价格以及该搜索词对应的价格最优值对搜索到的商品进行排序并提供。当然,本申请实施例中服务器对搜索到的商品信息进行排序时,除了根据搜索到的各商品信息中包含的价格以及该搜索词对应的价格最优值进行排序之外,还可以综合搜索到的商品信息与该搜索词的相关性、搜索到的商品信息对应的商品的质量、提供搜索到的商品信息对应的卖家的质量等因素对搜索到的商品信息进行排序。
服务器也可以仅当接收到用户发送的按照价格最优值进行排序的请求时,才根据搜索到的各商品信息中包含的价格以及该搜索词对应的价格最优值对搜索到的商品信息进行排序并提供,未接收到按照价格最优值进行排序的请求时,则按照默认的排序规则对搜索到的商品信息进行排序并提供。
图3为本申请实施例提供的一种提供搜索结果的装置结构示意图,具体包括:
搜索模块301,用于基于接收到的搜索词搜索相关的商品信息;
最优值确定模块302,用于查找预先确定的所述搜索词对应的价格最优值;
提供模块303,用于分别确定搜索到的每个商品信息中包含的价格与查找到的价格最优值的差值的绝对值,按照分别确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。
所述最优值确定模块302具体用于,查找搜索日志中记录的过去每次基于所述搜索词进行搜索时,搜索到的商品信息中满足指定条件的商品信息,其中,满足指定条件的商品信息包括被用户点击的商品信息;根据查找到的商品信息中包含的价格,确定所述搜索词对应的价格最优值。
所述最优值确定模块302具体用于,根据查找到的商品信息中包含的价格,采用混合双高斯模型拟合基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数,根据拟合的概率密度函数,确定概率密度最大时对应的价格作为所述搜索词对应的价格最优值。
所述最优值确定模块302具体包括:
初始化单元3021,用于根据查找到的商品信息中包含的价格,确定查找到的商品信息中包含的价格的总平均值,根据查找到的商品信息中包含的价格以及确定的总平均值,确定查找到的商品信息中包含的价格的总标准差,将确定的总平均值与第一设定参数的乘积作为第一平均值,将确定的总平均值与第二设定参数的乘积作为第二平均值,其中,所述第一设定参数大于1,所述第二设定参数小于1;将确定的总标准差同时作为第一标准差和第二标准差;
训练单元3022,用于针对查找到的每个商品信息中包含的价格,采用公式 gamma ( i ) = p × 1 2 π σ 2 e - ( x i - mu 2 ) 2 2 σ 2 2 ( 1 - p ) × 1 2 π σ 1 e - ( x i - mu 1 ) 2 2 σ 1 2 + p × 1 2 π σ 2 e - ( x i - mu 2 ) 2 2 σ 2 2 确定每个价格对应的中间值,其中,p为初始设定的权值,mu1为第一平均值,mu2为第二平均值,σ1为第一标准差,σ2为第二标准差,xi为查找到的第i个商品信息中包含的价格,gamma(i)为查找到的第i个商品信息中包含的价格对应的中间值;根据确定的每个价格对应的中间值,采用公式
Figure BDA00001789200900141
重新确定第一平均值,采用公式
Figure BDA00001789200900142
重新确定第二平均值;根据重新确定的第一平均值和第二平均值,采用公式重新确定第一标准差,采用公式
Figure BDA00001789200900144
重新确定第二标准差;采用公式
Figure BDA00001789200900145
重新确定权值,其中,n为查找到的商品信息的数量;判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差是否满足设定条件;当判断结果为否时,根据重新确定的第一平均值、第二平均值、第一标准差、第二标准差、权值,重新确定每个价格对应的中间值,并根据重新确定的每个中间值继续确定第一平均值、第二平均值、第一标准差、第二标准差和权值,直至确定的第一平均值、第二平均值、第一标准差、第二标准差满足所述设定条件为止;
函数确定单元3023,用于当所述训练单元3022判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差满足设定条件时,根据重新确定的第一平均值、第二平均值、第一标准差、第二标准、权值,确定函数 f ( x ) = ( 1 - p ) × 1 2 π σ 1 e - ( x - mu 1 ) 2 2 σ 1 2 + p × 1 2 π σ 2 e - ( x - mu 2 ) 2 2 σ 2 2 , 作为拟合的基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数。
所述训练单元3022具体用于,当判断重新确定的第一平均值与上一次确定的第一平均值的差值在设定范围内时,或者,当判断重新确定的第二平均值与上一次确定的第二平均值的差值在设定范围内时,或者,当判断重新确定的第一标准差与上一次确定的第一标准差的差值在设定范围内时,或者,当判断重新确定的第二标准差与上一次确定的第二标准差的差值在设定范围内时,判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差满足所述设定条件。
本申请实施例提供一种提供搜索结果的方法及装置,该方法服务器基于接收到的搜索词进行搜索时,查找预先确定的该搜索词对应的价格最优值,分别确定搜索到的每个商品信息中包含的价格与该价格最优值的差值的绝对值,并按照确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。通过上述方法,服务器向用户提供的商品信息中,排序靠前的商品信息即为包含的价格与价格最优值相差较小的商品信息,与现有技术中单一按照包含的价格从高到低或从低到高的顺序提供搜索结果的方法相比,可以有效减少用户设置筛选条件并重新搜索的次数,这减轻了服务器的压力。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种提供搜索结果的方法,其特征在于,包括:
服务器基于接收到的搜索词搜索相关的商品信息;并
查找预先确定的所述搜索词对应的价格最优值;以及
分别确定搜索到的每个商品信息中包含的价格与查找到的价格最优值的差值的绝对值,按照分别确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。
2.如权利要求1所述的方法,其特征在于,确定所述搜索词对应的价格最优值,具体包括:
所述服务器查找搜索日志中记录的过去每次基于所述搜索词进行搜索时,搜索到的商品信息中满足指定条件的商品信息,其中,满足指定条件的商品信息包括被用户点击的商品信息;
根据查找到的商品信息中包含的价格,确定所述搜索词对应的价格最优值。
3.如权利要求2所述的方法,其特征在于,根据查找到的商品信息中包含的价格,确定所述搜索词对应的价格最优值,具体包括:
根据查找到的商品信息中包含的价格,采用混合双高斯模型拟合基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数;
根据拟合的概率密度函数,确定概率密度最大时对应的价格作为所述搜索词对应的价格最优值。
4.如权利要求3所述的方法,其特征在于,采用混合双高斯模型拟合基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数,具体包括:
根据查找到的商品信息中包含的价格,确定查找到的商品信息中包含的价格的总平均值;
根据查找到的商品信息中包含的价格以及确定的总平均值,确定查找到的商品信息中包含的价格的总标准差;
将确定的总平均值与第一设定参数的乘积作为第一平均值,将确定的总平均值与第二设定参数的乘积作为第二平均值,其中,所述第一设定参数大于1,所述第二设定参数小于1;
将确定的总标准差同时作为第一标准差和第二标准差;
针对查找到的每个商品信息中包含的价格,采用公式 gamma ( i ) = p × 1 2 π σ 2 e - ( x i - mu 2 ) 2 2 σ 2 2 ( 1 - p ) × 1 2 π σ 1 e - ( x i - mu 1 ) 2 2 σ 1 2 + p × 1 2 π σ 2 e - ( x i - mu 2 ) 2 2 σ 2 2 确定每个价格对应的中间值,其中,p为初始设定的权值,mu1为第一平均值,mu2为第二平均值,σ1为第一标准差,σ2为第二标准差,xi为查找到的第i个商品信息中包含的价格,gamma(i)为查找到的第i个商品信息中包含的价格对应的中间值;
根据确定的每个价格对应的中间值,采用公式重新确定第一平均值,采用公式
Figure FDA00001789200800023
重新确定第二平均值;
根据重新确定的第一平均值和第二平均值,采用公式
Figure FDA00001789200800024
重新确定第一标准差,采用公式 σ 2 = Σ i gamma ( i ) ( x i - mu 2 ) 2 Σ i gamma ( i ) 重新确定第二标准差;
采用公式
Figure FDA00001789200800026
重新确定权值,其中,n为查找到的商品信息的数量;
判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差是否满足设定条件;
若是,则根据重新确定的第一平均值、第二平均值、第一标准差、第二标准、权值,确定函数 f ( x ) = ( 1 - p ) × 1 2 π σ 1 e - ( x - mu 1 ) 2 2 σ 1 2 + p × 1 2 π σ 2 e - ( x - mu 2 ) 2 2 σ 2 2 , 作为拟合的基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数;
否则,根据重新确定的第一平均值、第二平均值、第一标准差、第二标准差、权值,重新确定每个价格对应的中间值,并根据重新确定的每个中间值继续确定第一平均值、第二平均值、第一标准差、第二标准差和权值,直至确定的第一平均值、第二平均值、第一标准差、第二标准差满足所述设定条件为止。
5.如权利要求4所述的方法,其特征在于,判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差满足所述设定条件,具体包括:
判断重新确定的第一平均值与上一次确定的第一平均值的差值在设定范围内;或者
判断重新确定的第二平均值与上一次确定的第二平均值的差值在设定范围内;或者
判断重新确定的第一标准差与上一次确定的第一标准差的差值在设定范围内;或者
判断重新确定的第二标准差与上一次确定的第二标准差的差值在设定范围内。
6.一种提供搜索结果的装置,其特征在于,包括:
搜索模块,用于基于接收到的搜索词搜索相关的商品信息;
最优值确定模块,用于查找预先确定的所述搜索词对应的价格最优值;
提供模块,用于分别确定搜索到的每个商品信息中包含的价格与查找到的价格最优值的差值的绝对值,按照分别确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。
7.如权利要求6所述的装置,其特征在于,所述最优值确定模块具体用于,查找搜索日志中记录的过去每次基于所述搜索词进行搜索时,搜索到的商品信息中满足指定条件的商品信息,其中,满足指定条件的商品信息包括被用户点击的商品信息;根据查找到的商品信息中包含的价格,确定所述搜索词对应的价格最优值。
8.如权利要求7所述的装置,其特征在于,所述最优值确定模块具体用于,根据查找到的商品信息中包含的价格,采用混合双高斯模型拟合基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数,根据拟合的概率密度函数,确定概率密度最大时对应的价格作为所述搜索词对应的价格最优值。
9.如权利要求8所述的装置,其特征在于,所述最优值确定模块具体包括:
初始化单元,用于根据查找到的商品信息中包含的价格,确定查找到的商品信息中包含的价格的总平均值,根据查找到的商品信息中包含的价格以及确定的总平均值,确定查找到的商品信息中包含的价格的总标准差,将确定的总平均值与第一设定参数的乘积作为第一平均值,将确定的总平均值与第二设定参数的乘积作为第二平均值,其中,所述第一设定参数大于1,所述第二设定参数小于1;将确定的总标准差同时作为第一标准差和第二标准差;
训练单元,用于针对查找到的每个商品信息中包含的价格,采用公式 gamma ( i ) = p × 1 2 π σ 2 e - ( x i - mu 2 ) 2 2 σ 2 2 ( 1 - p ) × 1 2 π σ 1 e - ( x i - mu 1 ) 2 2 σ 1 2 + p × 1 2 π σ 2 e - ( x i - mu 2 ) 2 2 σ 2 2 确定每个价格对应的中间值,其中,p为初始设定的权值,mu1为第一平均值,mu2为第二平均值,σ1为第一标准差,σ2为第二标准差,xi为查找到的第i个商品信息中包含的价格,gamma(i)为查找到的第i个商品信息中包含的价格对应的中间值;根据确定的每个价格对应的中间值,采用公式
Figure FDA00001789200800042
重新确定第一平均值,采用公式重新确定第二平均值;根据重新确定的第一平均值和第二平均值,采用公式重新确定第一标准差,采用公式重新确定第二标准差;采用公式重新确定权值,其中,n为查找到的商品信息的数量;判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差是否满足设定条件;当判断结果为否时,根据重新确定的第一平均值、第二平均值、第一标准差、第二标准差、权值,重新确定每个价格对应的中间值,并根据重新确定的每个中间值继续确定第一平均值、第二平均值、第一标准差、第二标准差和权值,直至确定的第一平均值、第二平均值、第一标准差、第二标准差满足所述设定条件为止;
函数确定单元,用于当所述训练单元判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差满足设定条件时,根据重新确定的第一平均值、第二平均值、第一标准差、第二标准、权值,确定函数 f ( x ) = ( 1 - p ) × 1 2 π σ 1 e - ( x - mu 1 ) 2 2 σ 1 2 + p × 1 2 π σ 2 e - ( x - mu 2 ) 2 2 σ 2 2 , 作为拟合的基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数。
10.如权利要求9所述的装置,其特征在于,所述训练单元具体用于,当判断重新确定的第一平均值与上一次确定的第一平均值的差值在设定范围内时,或者,当判断重新确定的第二平均值与上一次确定的第二平均值的差值在设定范围内时,或者,当判断重新确定的第一标准差与上一次确定的第一标准差的差值在设定范围内时,或者,当判断重新确定的第二标准差与上一次确定的第二标准差的差值在设定范围内时,判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差满足所述设定条件。
CN201210211323.6A 2012-06-20 2012-06-20 一种提供搜索结果的方法及装置 Active CN103514187B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210211323.6A CN103514187B (zh) 2012-06-20 2012-06-20 一种提供搜索结果的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210211323.6A CN103514187B (zh) 2012-06-20 2012-06-20 一种提供搜索结果的方法及装置

Publications (2)

Publication Number Publication Date
CN103514187A true CN103514187A (zh) 2014-01-15
CN103514187B CN103514187B (zh) 2020-06-05

Family

ID=49896923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210211323.6A Active CN103514187B (zh) 2012-06-20 2012-06-20 一种提供搜索结果的方法及装置

Country Status (1)

Country Link
CN (1) CN103514187B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886037A (zh) * 2014-03-10 2014-06-25 华为技术有限公司 一种数据筛选的方法及装置
CN105630836A (zh) * 2014-11-05 2016-06-01 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置
CN107705225A (zh) * 2017-11-27 2018-02-16 广西塔锡科技有限公司 一种旅游电子商务服务系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090313088A1 (en) * 2008-03-17 2009-12-17 Kamruddin Imtiaz Ali Patriotic American Shopping Network
CN102081776A (zh) * 2010-12-30 2011-06-01 百度在线网络技术(北京)有限公司 搜索结果排序方法及系统
CN102298593A (zh) * 2010-06-24 2011-12-28 腾讯科技(深圳)有限公司 显示检索结果的方法及装置
CN102419779A (zh) * 2012-01-13 2012-04-18 青岛理工大学 一种基于属性排序的商品个性化搜索方法及装置
CN102446180A (zh) * 2010-10-09 2012-05-09 腾讯科技(深圳)有限公司 一种商品搜索方法及其装置
CN102467726A (zh) * 2010-11-04 2012-05-23 阿里巴巴集团控股有限公司 一种基于网上交易平台的数据处理方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090313088A1 (en) * 2008-03-17 2009-12-17 Kamruddin Imtiaz Ali Patriotic American Shopping Network
CN102298593A (zh) * 2010-06-24 2011-12-28 腾讯科技(深圳)有限公司 显示检索结果的方法及装置
CN102446180A (zh) * 2010-10-09 2012-05-09 腾讯科技(深圳)有限公司 一种商品搜索方法及其装置
CN102467726A (zh) * 2010-11-04 2012-05-23 阿里巴巴集团控股有限公司 一种基于网上交易平台的数据处理方法和装置
CN102081776A (zh) * 2010-12-30 2011-06-01 百度在线网络技术(北京)有限公司 搜索结果排序方法及系统
CN102419779A (zh) * 2012-01-13 2012-04-18 青岛理工大学 一种基于属性排序的商品个性化搜索方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886037A (zh) * 2014-03-10 2014-06-25 华为技术有限公司 一种数据筛选的方法及装置
CN103886037B (zh) * 2014-03-10 2018-01-19 华为技术有限公司 一种数据筛选的方法及装置
CN105630836A (zh) * 2014-11-05 2016-06-01 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置
CN105630836B (zh) * 2014-11-05 2018-11-16 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置
CN107705225A (zh) * 2017-11-27 2018-02-16 广西塔锡科技有限公司 一种旅游电子商务服务系统及方法

Also Published As

Publication number Publication date
CN103514187B (zh) 2020-06-05

Similar Documents

Publication Publication Date Title
CN101819573B (zh) 一种自适应的网络舆情识别方法
US8612438B2 (en) Techniques for dynamic cross-filtering
US20190018900A1 (en) Method and Apparatus for Displaying Search Results
US10504028B1 (en) Techniques to use machine learning for risk management
CN103577413A (zh) 搜索结果排序方法及系统、搜索结果排序优化方法及系统
CN103309894B (zh) 基于用户属性的搜索实现方法及系统
WO2013009947A2 (en) System and method for advertisement placement
CN104142999A (zh) 搜索结果展示方法及装置
CN104077714A (zh) 访问网站的用户的偏好获取、广告推送方法和系统
CN102339296A (zh) 一种查询结果的排序方法和装置
CN105488163B (zh) 信息推送方法和装置
CN102955902A (zh) 雷达模拟设备可信度的评估方法及评估系统
US20040267553A1 (en) Evaluating storage options
CN111612581A (zh) 一种物品推荐的方法、装置、设备及存储介质
CN103020141B (zh) 一种用于提供搜索结果的方法和设备
CN105335363A (zh) 一种对象推送方法及系统
CN105786810B (zh) 类目映射关系的建立方法与装置
CN111292109A (zh) 产品的价格区间的确定方法、系统、设备和存储介质
CN105321113A (zh) 一种基于宏观因子的压力测试客户端
CN103514187A (zh) 一种提供搜索结果的方法及装置
CN110009796B (zh) 发票类别识别方法、装置、电子设备及可读存储介质
CN117035563B (zh) 产品质量安全风险监测方法、设备、监测系统及介质
CN110599281A (zh) 一种确定目标店铺的方法和装置
CN106611339B (zh) 种子用户筛选方法、产品的用户影响力评价方法及装置
CN113094444A (zh) 数据处理方法、数据处理装置、计算机设备和介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1192035

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant