CN102968417B - 一种应用于计算机网络中的搜索方法和系统 - Google Patents

一种应用于计算机网络中的搜索方法和系统 Download PDF

Info

Publication number
CN102968417B
CN102968417B CN201110256639.2A CN201110256639A CN102968417B CN 102968417 B CN102968417 B CN 102968417B CN 201110256639 A CN201110256639 A CN 201110256639A CN 102968417 B CN102968417 B CN 102968417B
Authority
CN
China
Prior art keywords
querying condition
query result
condition information
information
weighted value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110256639.2A
Other languages
English (en)
Other versions
CN102968417A (zh
Inventor
殷维栋
仇光
郭宁
傅其乐
许潇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110256639.2A priority Critical patent/CN102968417B/zh
Publication of CN102968417A publication Critical patent/CN102968417A/zh
Application granted granted Critical
Publication of CN102968417B publication Critical patent/CN102968417B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种应用于计算机网络的搜索方法和系统,其中,应用于计算机网络的搜索方法用于搜索符合用户意图的信息,包括如下步骤:获得由用户输入的第一查询条件信息,及存储于所述计算机网络中的所述用户的个性化信息;基于所述第一查询条件信息,获得第一查询结果;基于所述个性化信息,获得第二查询结果;输出所述第一查询结果至第一显示区域;输出所述第二查询结果至第二显示区域。本申请可以解决搜索结果精度下降和获取搜索结果效率低下的问题。

Description

一种应用于计算机网络中的搜索方法和系统
技术领域
本申请涉及互联网搜索技术领域,尤其涉及一种应用于计算机网络中的搜索方法和系统。
背景技术
随着计算机网络技术的不断发展,用户在计算机网络中可以开展的业务越来越多。近几年来,随着计算机网络中的数据量越来越多,业务种类也是越来越多,用户对如何有效而快速地在所述计算机网络中找到满足自己的信息需求也在不断增加。
为了满足上述需求,应用于所述计算机网络中的搜索技术不断出现,如:专门提供各类搜索业务的google或百度;网络购物平台上提供的商品信息搜索引擎,例如:京东商城中的搜索引擎,淘宝网中的搜索引擎。
在用户实际使用所述的搜索技术时,总是会存在对于有些查询条件,没有或只有很少的搜索结果。在这种情况出现时,在现有技术中,一般对应的技术方案为:
在如google或百度等传统的搜索引擎中,通过重写查询条件,降低匹配精度,来获得更多的搜索结果。如:在百度中输入“48小时不锈钢保温杯”查询条件时,输出的搜索结果为“零”或很少,此时搜索引擎会重写查询条件,如:将用户输入的搜索条件“48小时不锈钢保温杯”改写成“不锈钢保温杯”,然后利用改写后的查询条件进行查询来获得更多的搜索结果。
本申请发明人在实现本发明的过程中,发现所述现有技术方案存在下述技术问题,如:
在所述现有技术方案中,由于搜索页面的搜索结果为零或少结果,所以需要对查询条件进行重写,在重写查询条件过程中,只能去降低匹配精度。所以,虽然在重写后,搜索结果会增加,但是却存在搜索结果与所述用户想要搜索的结果的相关度下降,进而引起所述搜索结果精度下降的技术问题;同时,还存在浪费网络资源的技术问题。
另外,所述现有技术方案中,搜索引擎需要对用户输入的查询条件进行重写,并利用重写后的查询条件进行再次搜索匹配,若该次搜索匹配获得的搜索结果仍然为零或较少,则搜索引擎可能还是会对所述查询条件进行再次改写,并利用再次改写后的查询条件进行搜索匹配,如此反复的对查询条件进行改写及反复的搜索匹配查询无疑会增加搜索引擎的搜索压力并降低搜索结果获取的效率。
发明内容
本发明提供一种应用于计算机网络中的搜索方法和系统,用于解决现有技术中存在搜索结果精度下降和获取搜索结果效率低下的技术问题。
一方面,本发明通过本申请中的一个实施例,提供如下技术方案:
一种应用于计算机网络中的搜索方法,所述方法包括:
获得由用户输入的第一查询条件信息,及存储于所述计算机网络中的所述用户的个性化信息;
基于所述第一查询条件信息,获得第一查询结果;基于所述个性化信息,获得第二查询结果;
输出所述第一查询结果至第一显示区域;输出所述第二查询结果至第二显示区域。
可选地,所述基于所述查询条件信息,获得第一查询结果,具体包括:
基于所述第一查询条件信息,检索获得第三查询结果;
在所述第三查询结果中包括的信息数量大于或等于一阀值时,所述第三查询结果即为所述第一查询结果;
在所述第三查询结果中包括的信息数量小于一阀值时,获得由搜索引擎基于所述第一查询条件信息自动改写后获得的第二查询条件信息;基于所述第二查询条件信息,获得所述第一查询结果。
可选地,其中所述第一查询条件信息中包括至少一个关键词,所述获得由搜索引擎基于所述第一查询条件信息自动改写后获得的第二查询条件信息,具体包括:
通过去除所述至少一个关键词中一个或多个关键词,获得所述第二查询条件信息;或
通过用一个或多个不包含在所述至少一个关键词中的新关键词去替换所述至少一个关键词中的一个或多个关键词,获得所述第二查询条件信息,其中,所述新关键词为被替换关键词的同义词、近义词或反义词;或
通过用所述用户历史查询条件信息替换所述第一查询条件信息,获得所述第二查询条件信息。
可选地,所述存储于所述计算机网络中的所述用户的个性化信息包括:存储于所述计算机网络中的表征所述用户兴趣或偏好的第一个性化信息,和/或基于所述用户历史检索记录获得的表征所述用户搜索意图的第二个性化信息。
可选地,所述基于所述第一查询条件信息,获得第一查询结果;基于所述个性化信息,获得第二查询结果,具体包括:
计算获得所述第一查询条件信息的第一权重值,所述个性化信息的第二权重值;
基于所述第一查询条件信息及所述第一权重值,获得所述第一查询结果;基于所述个性化信息及所述第二权重值获得所述第二查询结果。
可选地,在所述计算获得所述第一查询条件信息的第一权重值,所述个性化信息的第二权重值之后,还包括:
利用所述第一权重值及所述第二权重值,并利用公式:w=alpha*w1+(1-alpha)*w2,计算获得融合权重值w,其中alpha是加权因子,为0至1间的实数;w1为所述第一权重值;w2为所述第二权重值。
此外,本发明还通过本申请中的另一实施例提供如下技术方案:
一种应用于计算机网络中的搜索系统,所述搜索系统包括:
第一获得单元,用于获得由用户输入的第一查询条件信息,及存储于所述计算机网络中的所述用户的个性化信息;
第二获得单元,用于基于所述第一查询条件信息,获得第一查询结果;基于所述个性化信息,获得第二查询结果;
输出单元,用于输出所述第一查询结果至第一显示区域;输出所述第二查询结果至第二显示区域。
可选地,所述基第二获得单元具体包括:
第一获得子单元,用于基于所述第一查询条件信息,检索获得第三查询结果;
判断单元,用于判断所述第三查询结果中包括的信息数量是否大于或等于一阀值;其中
在所述第三查询结果中包括的信息数量大于或等于一阀值时,所述第一获得子单元通过第三查询结果获得所述第一查询结果;
在所述第三查询结果中包括的信息数量小于一阀值时,所述第一获得子单元,由搜索引擎基于所述第一查询条件信息自动改写后获得的第二查询条件信息,获得所述第一查询结果。
可选地,其中所述第一查询条件信息中包括至少一个关键词,所述第二查询条件信息为:
通过去除所述至少一个关键词中一个或多个关键词,获得的查询条件信息;或
通过用一个或多个不包含在所述至少一个关键词中的新关键词去替换所述至少一个关键词中的一个或多个关键词,获得的查询条件信息,其中,所述新关键词为被替换关键词的同义词、近义词或反义词;或
通过用所述用户历史查询条件信息替换所述第一查询条件信息,获得的查询条件信息。
可选地,所述存储于所述计算机网络中的所述用户的个性化信息包括:存储于所述计算机网络中的表征所述用户兴趣或偏好的第一个性化信息,和/或基于所述用户历史检索记录获得的表征所述用户搜索意图的第二个性化信息。
可选地,所述第二获得单元,具体包括:权重获得单元,用于计算获得所述第一查询条件信息的第一权重值,所述个性化信息的第二权重值;
第二获得子单元,用于基于所述第一查询条件信息及所述第一权重值,获得所述第一查询结果;基于所述个性化信息及所述第二权重值获得所述第二查询结果。
可选地,所述第二获得单元,还包括:融合权重获得单元,与所述权重获得单元连接,用于利用所述第一权重值及所述第二权重值,利用公式:w=alpha*w1+(1-alpha)*w2,计算获得融合权重值w,其中alpha加权因子,为0至1间的实数;w1为所述第一权重值;w2为所述第二权重值。
上述技术方案中的一个或多个技术方案,至少具有如下技术效果或优点:
一、本申请在获得由用户输入的第一查询条件的同时,还会获取所述用户的个性化信息,当基于所述第一查询条件信息获得的第一查询结果为零或较少时,基于所述个性化信息获得第二查询结果。这样在第一搜索结果为零或较少时,搜索引擎无需对第一查询条件进行改写,而是基于所述用户的个性化信息获得第二查询结果,这样可以降低搜索引擎对查询条件反复改写,并利用改写后的搜索条件进行搜索匹配所造成的搜索压力,而且由于本申请直接利用所述个性化信息获得第二查询结果,可以提高获取搜索结果的效率。
二、通过在搜索过程中,采用了根据所述第一查询条件信息检索获得的第三查询结果中的信息数量与一阀值进行比较,或搜索引擎自动对所述第一查询条件改写后重新获得的第二查询条件,以及计算所述第一查询条件信息的第一权重值的技术手段,使得在获得第一查询结果的过程中,实现了提升用户搜索结果精度的技术效果;
三、通过在搜索过程中,采用了根据存储于计算机网络中的表征所述用户兴趣或偏好的第一个性化信息,和/或通过检索用户历史获得的表征所述用户搜索意图的第二个性化信息,以及计算所述第一个性化信息,和/或第二个性化信息的第二权重值的技术手段,使得在获得第二查询结果的过程中,实现了提升搜索结果精度及搜索结果效率的技术效果。
附图说明
图1为本发明实施例一中应用于计算机网络中的搜索方法流程图;
图2为本发明实施例二中应用于计算机网络中的搜索系统结构图;
图3为本发明实施例一或二中第三查询结果包含的信息数量与第一查询结果的对照表。
具体实施方式
为了使本申请所属技术领域中的技术人员更清楚地理解本发明,下面结合附图,通过具体实施例对本发明技术方案作详细描述。
请参考图1、图3,本申请实施例一中的一种应用于计算机网络中的搜索方法,包括如下步骤:
步骤101,获得由用户输入的第一查询条件信息,及存储于所述计算机网络中的所述用户的个性化信息。
在具体实施过程中,对于所述第一查询条件信息,可以通过很多种方式获得,如:
第一种,可以去捕获用户在搜索引擎的搜索界面输入的查询条件信息而获得,通常来讲,所述搜索界面可以是文本输入框,用户在所述文本输入框中输入所述查询条件信息后,设置于计算机网络中的所述搜索引擎便可获得所述查询条件信息了。如,当用户在所述文本输入框中输入“飞利浦不锈钢电动剃须刀”、“大功率家用电器”、“笔记本电脑”等作为查询条件信息时,搜索引擎便能捕获。
第二种,也可以去捕获用户通过其他输入设备输入的查询条件信息来获得所述第一查询条件信息,如:可以先去捕获用户通过音频方式输入的查询条件信息,再去将所述音频方式的查询条件信息转化为文字方式的查询条件信息。
当然,在具体实现过程中,本申请所属技术领域的技术人员还可以采用其他的实施方式来获得查询条件信息,在此,就不一一列举了。
而对于获得存储于所述计算机网络中的所述的用户的个性化信息,在具体实现过程中,所述的个性化信息是存储于计算机网络中一个或多个存储设备上的,如:硬盘,在搜索过程中,所述计算机网络可以存储内容、并通过读取指令从所述硬盘上获得所述个性化信息。
所述个性化信息所包括的具体的信息,本申请所述技术领域的技术人员可以在基于本申请公开的内容的基础上,根据实际需要来决定。在本实施例中,所述计算机网络会利用自动搜集、整理及分析软件来获得所述个性信息,具体过程可为:
搜集所述用户通过所述计算机网络中的输入界面而输入的用来体现兴趣或爱好的个性化信息,如:白色的IPHONE4,色彩丰富的棉质毛衣等;
搜集所述用户历史搜索的记录,如,去搜集用户过去一年中的搜索记录,然后通过去整理和分析所述搜索记录,获得所述用户比较特有需求的能表征所述用户搜索意图的个性化信息,如,通过整理和分析发现,所述用户在过去一年中针对“食用油”这个主题搜索过10次,其中,有7次都是用“金龙鱼食用油”的查询条件信息来搜索,此时,就可认为“金龙鱼食用油”就是所述用户的比较特有需求的能表征所述用户搜索意图的个性化信息。
当然,在具体应用中,本申请所属技术领域的技术人员还可以根据需要来确定哪些信息可以包括在所述个性化信息中,在此,本实施例中就不一一列举了。
步骤102,基于所述第一查询条件信息,获得第一查询结果;基于所述个性化信息,获得第二查询结果。
在具体实施过程中,所述第一查询条件信息包括至少一个关键词,用所述第一查询条件信息进行检索,获得第三结果,将所述第三结果与一阀值进行比较,所述阀值不是固定的,用户可以根据实际需要来进行设定,在此实施例中,设置所述阀值为7,所述阀值越高,表明所述结果越满足用户的需要,当然,在实际使用过程中,本领域技术人员也可将所述阀值设置为0或设置为8,当所述第三查询结果中包括的结果数量大于或等于7时,所述第三查询结果即为所述第一查询结果;当所述第三查询结果中包括的结果数量小于7时,由搜索引擎基于所述第一查询条件信息自动改写后重新获得的第二查询条件信息,获得所述第一查询结果。
所述第二查询条件信息可以通过重写规则的方法获得,具体包括:
第一种,去除所述至少一个关键词中一个或多个子关键词,如:将“飞利浦不锈钢电动剃须刀”重写成“电动剃须刀”;
第二种,用一个或多个不包含在所述至少一个关键词中的新关键词替换所述至少一个关键词中的一个或多个关键词,其中,所述新关键词为换关键词的同义词、近义词或反义词,如:将“大功率家用电器”重写成“小功率家用电器”;
第三种,用所述用户历史查询条件信息替换所述第一查询条件信息,如:当所述第一查询条件信息为“笔记本电脑”时,重写时,用所述用户历史查询条件信息代替所述“笔记本电脑”,如用“电脑”代替所述“笔记本电脑”。
在本申请实施例中,为了让用户在获得基于所述第一查询条件信息或所述第二查询条件的第一查询结果外,还可以让用户获得与自己兴趣或偏好相关的查询结果,为此,在所述计算机网络中便利用计算机软件或硬件技术,去获得与用户兴趣或偏好相关的所述个性化信息,所述个性化信息包括:
一,体现用户兴趣或爱好的个性化信息,如:白色的IPHONE4,色彩丰富的棉质毛衣等;
二,用来表征所述用户搜索意图的个性化信息,如:通过整理和分析发现,所述用户在过去一年中针对“食用油”这个主题搜索过10次,其中,有7次都是用“金龙鱼食用油”的查询条件信息来搜索,此时,就可认为“金龙鱼食用油”就是所述用户的比较特有需求的能表征所述用户搜索意图的所述个性化信息。
在本实施例中,为了能使得输出的结果更加精确地与所述第一查询条件信息或第二查询条件信息和/或所述个性化信息相匹配,进而更加符合用户的预期或满足用户的需求,需要对所述第一查询条件信息或第二查询条件信息和/或所述个性化信息进行权重计算,在本实施例中,权重是用来决定输出查询结果显示比例用的,如:所述第一查询结果或第三查询结果中有100条检索结果,第二查询结果中也有100条查询结果,在输出查询结果时,却只给用户输出100条查询结果,此时,假设所述第一查询条件信息或第二查询条件信息对应的权重为60%,所述个性化信息对应的权重为40%,则从第一查询结果或第三查询结果中选择60条查询结果输出,从所述第二查询结果中选择40条查询结果输出。在对所述查询条件进行计算所述权重前,需要判断是计算所述第一查询条件还是所述第二查询条件的所述权重,具体的判断过程为:
在搜索引擎的搜索界面输入第一查询条件信息,通过检索获得第三查询结果,将所述第三结果与一阀值进行比较,设置所述阀值为7,当然,在实际使用过程中,本领域技术人员也可将所述阀值设置为0或设置为8,当所述第三查询结果中包括的结果数量大于或等于7时,所述第三查询结果即为所述第一查询结果,在这种情况下,在计算权重值时,将所述第一查询条件信息的权重值作为第一权重值;当所述第三查询结果中包括的结果数量小于7时,由搜索引擎基于所述第一查询条件信息自动改写后重新获得所述第二查询条件信息;在这种情况下,在计算权重值时,将所述第二查询条件信息的权重值作为第一权重值。
在获得的第一权重值后,再基于所述第一查询条件信息或第二查询条件信息,就可以获得所述第一查询结果。
同样,本申请实施中会计算所述个性化信息权重值作为第二权重值,结合所述第二权重值与所述个性化信息,获得所述第二查询结果。
在具体实施过程中,为了更精确地输出查询结果,还会对所述第一权重值和所述第二权重值作进一步处理,处理的方法有很多,在本申请中,采用如下方法来处理:
将所述第一权重值和所述第二权重值输入至公式:w=alpha*w1+(1-alpha)*w2中,来计算获得融合权重值w,其中alpha是加权因子,为0至1间的实数;w1为所述第一权重值;w2为所述第二权重值;
其中,所述融合权重值用于体现经过综合评估后的查询结果的重要性,系统将根据所述融合权重值,选择合适查询结果进行输出,进而保证输出的查询结果能更好地符合用户的要求。
在经过步骤102后,本实施例就获得了所述第一查询结果和所述第二查询结果,为了让用户最终能够得到查询结果,本实施例还包括如下步骤;
步骤103,输出所述第一查询结果至第一显示区域;输出所述第二查询结果至第二显示区域。
在具体实施过程中,在所述计算机网络中,可以将网页页面划分为包括第一显示区域和第二显示区域的至少两个区域,将获得的所述第一查询结果输出到所述第一显示区域,将所述第二查询结果作为补充结果输出到所述第二显示区域。其中,所述第一显示区域与所述第二显示区域间有很多种呈现方式,如:
通过用底色来区分所述第一显示区域与所述第二显示区域,如:红色、蓝色等加以区别;或
采用不同字体的方式来区分所述第一显示区域与所述第二显示区域,如:在所述第一显示区域中用宋体字,在所述第二显示区域中用楷体字;或
采用分别给所述第一显示区域与所述第二显示区域分配不重叠的物理显示区域来区分,如:将所述第一显示区域的大小为8cm*10cm,将第二显示区域大小设置为3cm*10cm,而且这两个区域不重叠。
请参考图2、图3,实施例二中的一种应用于计算机网络中的搜索系统,包括:
第一获得单元201,用于获得由用户输入的所述第一查询条件信息,及存储于所述计算机网络中的所述用户的个性化信息。
在具体实施过程中,对于所述第一查询条件信息,可以通过很多种方式获得,如:
第一种,可以去捕获用户在搜索引擎的搜索界面输入的查询条件信息而获得,通常来讲,所述搜索界面可以是文本输入框,用户在所述文本输入框中输入所述查询条件信息后,设置于计算机网络中的所述搜索引擎便可获得所述查询条件信息了。如,当用户在所述文本输入框中输入“飞利浦不锈钢电动剃须刀”、“大功率家用电器”、“笔记本电脑”等作为查询条件信息时,搜索引擎便能捕获;
第二种,也可以去捕获用户通过其他输入设备输入的查询条件信息来获得所述第一查询条件信息,如:可以先去捕获用户通过音频方式输入的查询条件信息,再去将所述音频方式的查询条件信息转化为文字方式的查询条件信息。
当然,在具体实现过程中,本申请所属技术领域的技术人员还可以采用其他的实施方式来获得查询条件信息,在此,就不一一列举了。
而对于获得存储于所述计算机网络中的所述的用户的个性化信息,在具体实现过程中,所述的个性化信息是存储于计算机网络中一个或多个存储设备上的,如:硬盘,在搜索过程中,所述计算机网络可以存储内容,也可以通过读取指令从所述硬盘上获得所述个性化信息。
所述个性化信息所包括的具体的信息,本申请所述技术领域的技术人员可以在基于本申请公开的内容的基础上,根据实际需要来决定。在本实施例中,所述计算机网络会利用自动搜集、整理及分析软件来获得所述个性信息,具体过程可为:
搜集所述用户通过所述计算机网络中的输入界面而输入的用来体现兴趣或爱好的第一个性化信息,如:白色的IPHONE4,色彩丰富的棉质毛衣等;
搜集所述用户历史搜索的记录,如,去搜集用户过去一年中的搜索记录,然后通过去整理和分析所述搜索记录,获得所述用户比较特有需求的能表征所述用户搜索意图的个性化信息,如,通过整理和分析发现,所述用户在过去一年中针对“食用油”这个主题搜索过10次,其中,有7次都是用“金龙鱼食用油”的查询条件信息来搜索,此时,就可认为“金龙鱼食用油”就是所述用户的比较特有需求的能表征所述用户搜索意图的第二个性化信息。
当然,在具体应用中,本申请所属技术领域的技术人员还可以根据需要来确定哪些信息可以包括在所述个性化信息中,在此,本实施例中就不一一列举了。
第二获得单元202,用于基于所述第一查询条件信息,获得第一查询结果;基于所述个性化信息,获得第二查询结果。其中,所述第二获得单元202包括:
进一步地,所述第二获得单元202还包括:
第二获得子单元,用于检索所述第一查询条件信息,如:飞利浦不锈钢电动剃须刀、大功率家用电器、笔记本电脑等,获得第三查询结果;
判断单元,与所述第二获得子单元连接,用于判断所述第三查询结果中包括的结果数量是否大于或等于一阀值;
其中,所述阀值不是固定的,用户可以根据用户实际需要来进行设定,在这个实施例中,设置所述阀值为7,所述阀值越高,表明所述结果越满足用户的需要,当然,在实际使用过程中,本领域技术人员也可将所述阀值设置为0或设置为8,当所述第三查询结果中包括的结果数量大于或等于7时,所述第三查询结果即为所述第一查询结果;当所述第三查询结果中包括的结果数量小于7时,由搜索引擎基于所述第一查询条件信息自动改写后重新获得的第二查询条件信息,获得所述第一查询结果;
所述第二查询条件信息可以通过重写规则的方法获得,具体包括:
第一种,去除所述至少一个关键词中一个或多个子关键词,如:将飞利浦不锈钢电动剃须刀重写成电动剃须刀;
第二种,用一个或多个不包含在所述至少一个关键词中的新关键词替换所述至少一个关键词中的一个或多个关键词,其中,所述新关键词为换关键词的同义词、近义词或反义词,如:将大功率家用电器重写成小功率家用电器;
第三种,用所述用户历史查询条件信息替换所述第一查询条件信息,如:当所述第一查询条件信息为“笔记本电脑”时,重写时,用所述用户历史查询条件信息代替所述“笔记本电脑”,如用“电脑”代替所述“笔记本电脑”。
进一步地,所述第二获得单元202还包括权重获得单元,用于计算所述第一查询条件信息或第二查询条件信息,和/或所述个性化信息的权重;
其中,计算所述查询条件的所述权重前,需要判断:计算所述第一查询条件还是所述第二查询条件的所述权重,具体的判断过程为:
在搜索引擎的搜索界面输入第一查询条件信息,通过检索获得第三查询结果,将所述第三结果与一阀值进行比较,设置所述阀值为7,当然,在实际使用过程中,本领域技术人员也可将所述阀值设置为0或设置为8,当所述第三查询结果中包括的结果数量大于或等于7时,所述第三查询结果即为所述第一查询结果,在这种情况下,在计算权重值时,就计算所述第一查询条件信息的权重值作为第一权重值;
当所述第三查询结果中包括的结果数量小于7时,由搜索引擎基于所述第一查询条件信息自动改写后重新获得所述第二查询条件信息;在这种情况下,在计算权重值时,就计算所述第二查询条件信息的权重值作为第一权重值。
本申请实施例中,所述权重获得单元还可以对获得的所述个性化信息进行权重计算,并将所述个性化信息的权重作为第二权重值。
进一步地,所述第二获得单元202还包括:
所述第二获得子单元,用于获得所述第一查询结果和所述第二查询结果;
其中,获得所述第一查询结果的方式有两种:
第一种,根据所述第一权重值及所述第一查询条件信息,获得所述第一查询结果;在具体实施过程中,所述第一查询条件可以通过很多种方式获得,如:
一,可以去捕获用户在搜索引擎的搜索界面输入的查询条件信息而获得,通常来讲,所述搜索界面可以是文本输入框,用户在所述文本输入框中输入所述查询条件信息后,设置于计算机网络中的所述搜索引擎便可获得所述查询条件信息了。如,当用户在所述文本输入框中输入“飞利浦不锈钢电动剃须刀”、“大功率家用电器”、“笔记本电脑”等作为查询条件信息时,搜索引擎便能捕获;
二,也可以去捕获用户通过其他输入设备输入的查询条件信息来获得所述第一查询条件信息,如:可以先去捕获用户通过音频方式输入的查询条件信息,再去将所述音频方式的查询条件信息转化为文字方式的查询条件信息。
当然,在具体实现过程中,本申请所属技术领域的技术人员还可以采用其他的实施方式来获得查询条件信息,在此,就不一一列举了。
第二种,根据所述第一权重值及所述第二查询条件,获得所述第一查询结果;在具体实施过程中,所述第二查询条件可以通过重写规则、或个性化处理的方法获得,具体包括:
一,去除所述至少一个关键词中一个或多个子关键词,如:将“飞利浦不锈钢电动剃须刀”重写成“电动剃须刀”;
二,用一个或多个不包含在所述至少一个关键词中的新关键词替换所述至少一个关键词中的一个或多个关键词,其中,所述新关键词为换关键词的同义词、近义词或反义词,如:将“大功率家用电器”重写成“小功率家用电器”;
三,用所述用户历史查询条件信息替换所述第一查询条件信息,如:当所述第一查询条件信息为“笔记本电脑”时,重写时,用所述用户历史查询条件信息代替所述“笔记本电脑”,如用“电脑”代替所述“笔记本电脑”。
获得所述第二查询结果的方式为:根据所述第二权重值及个性化信息获得;
其中,所述个性化信息与用户兴趣和偏好相关,通过在所述计算机网络中利用计算机软件和硬件技术获得,具体包括:
一,体现用户兴趣或爱好的个性化信息,如:白色的IPHONE4,色彩丰富的棉质毛衣等;
二,用来表征所述用户搜索意图的个性化信息,如:通过整理和分析发现,所述用户在过去一年中针对“食用油”这个主题搜索过10次,其中,有7次都是用“金龙鱼食用油”的查询条件信息来搜索,此时,就可认为“金龙鱼食用油”就是所述用户的比较特有需求的能表征所述用户搜索意图的所述个性化信息。
在具体实施过程中,为了更精确地输出查询结果,还会对所述第一权重值和所述第二权重值作进一步处理,处理的方法有很多,在本申请中,采用如下方法来处理:
所述融合权重获得单元,与所述权重获得单元连接,用于将所述第一权重值和所述第二权重值输入至公式:w=alpha*w1+(1-alpha)*w2中,来计算获得融合权重值w,其中alpha加权因子,为0至1间的实数;w1为所述第一权重值;w2为所述第二权重值。
进一步地,所述第二获得单元202还包括:输出单元203,用于输出所述第一查询结果至第一显示区域;输出所述第二查询结果至第二显示区域。
在具体是实施过程中,在所述计算机网络中,可以将网页页面划分为包括第一显示区域和第二显示区域的至少两个区域,将获得的所述第一查询结果输出到所述第一显示区域,将所述第二查询结果作为补充结果输出到所述第二显示区域。其中,所述第一显示区域与所述第二显示区域间有很多种呈现方式,如:通过用底色来区分所述第一显示区域与所述第二显示区域,如:红色、蓝色等加以区别;或
采用不同字体的方式来区分所述第一显示区域与所述第二显示区域,如:在所述第一显示区域中用宋体字,在所述第二显示区域中用楷体字;或
采用分别给所述第一显示区域与所述第二显示区域分配不重叠的物理显示区域来区分,如:将所述第一显示区域的大小为8cm*10cm,将第二显示区域大小设置为3cm*10cm,而且这两个区域不重叠。
本发明有益效果如下:
一、通过在改写查询条件过程中,采用了基于所述第一查询条件信息获得的第一查询结果为零或较少时,基于个性化信息获得第二查询结果的技术手段,使得在获得所述第二查询结果的过程中,实现了搜索引擎无需对所述查询条件反复改写,并利用改写后的搜索条件进行搜索匹配造成的压力,及直接利用所述个性化信息获得所述第二结果,提高获取搜索结果的效率的技术效果;
二、通过在搜索过程中,采用了根据所述第一查询条件信息检索获得的第三查询结果中的信息数量与一阀值进行比较,或搜索引擎自动对所述第一查询条件改写后,重新输入第二查询条件,以及计算所述第一查询条件信息的第一权重值的技术手段,使得在获得第一查询结果的过程中,实现了提升用户搜索结果精度的技术效果;
三、通过在搜索过程中,采用了根据存储于计算机网络中的表征所述用户兴趣或偏好的第一个性化信息,和/或通过检索用户历史获得的表征所述用户搜索意图的第二个性化信息,以及计算所述第一个性化信息,和/或第二个性化信息的第二权重值的技术手段,使得在获得第二查询结果的过程中,实现了提升搜索结果精度及搜索结果效率的技术效果;
四、通过在搜索过程中,采用了重写规则和个性化信息处理的技术手段,使得在确定输出结果和个性化结果的过程中,实现了确定补充结果是否与用户的意图相关的技术效果;
五、通过在搜索过程中,采用了对目标用户进行行为定向分析的技术手段,使得个性化结果对正常结果进行补充的过程中,实现了提升搜索结果效率的技术效果;
六、通过在搜索过程中,采用了对所述个性化结果用底色或不同字体等方式加以区别的技术手段,使得在匹配个性化结果的过程中,实现了提升用户搜索体验的技术效果。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种应用于计算机网络中的搜索方法,其特征在于,包括:
获得由用户输入的第一查询条件信息,及存储于所述计算机网络中的所述用户的个性化信息;
基于所述第一查询条件信息,获得第一查询结果;基于所述个性化信息,获得第二查询结果;
输出所述第一查询结果至第一显示区域;输出所述第二查询结果至第二显示区域;
所述基于所述第一查询条件信息,获得第一查询结果;基于所述个性化信息,获得第二查询结果,具体包括:
计算获得所述第一查询条件信息的第一权重值,所述个性化信息的第二权重值;
基于所述第一查询条件信息及所述第一权重值,获得所述第一查询结果;基于所述个性化信息及所述第二权重值获得所述第二查询结果,所述第一权重值和第二权重值是用来决定输出查询结果显示比例用的。
2.如权利要求1所述的方法,其特征在于,所述基于所述第一查询条件信息,获得第一查询结果,具体包括:
基于所述第一查询条件信息,检索获得第三查询结果;
在所述第三查询结果中包括的信息数量大于或等于一阀值时,所述第三查询结果即为所述第一查询结果;
在所述第三查询结果中包括的信息数量小于一阀值时,获得由搜索引擎基于所述第一查询条件信息重新自动改写的第二查询条件信息;基于所述第二查询条件信息,获得所述第一查询结果。
3.如权利要求2所述的方法,其特征在于,其中所述第一查询条件信息中包括至少一个关键词,所述获得由搜索引擎基于所述第一查询条件信息重新自 动改写而获得的第二查询条件信息,具体包括:
通过去除所述至少一个关键词中一个或多个关键词,获得所述第二查询条件信息;或
通过用一个或多个不包含在所述至少一个关键词中的新关键词去替换所述至少一个关键词中的一个或多个关键词,获得所述第二查询条件信息,其中,所述新关键词为被替换关键词的同义词、近义词或反义词;或
通过用所述用户历史查询条件信息替换所述第一查询条件信息,获得所述第二查询条件信息。
4.如权利要求1‐3中任一所述的方法,其特征在于,所述存储于所述计算机网络中的所述用户的个性化信息包括:存储于所述计算机网络中的表征所述用户兴趣或偏好的第一个性化信息,和/或基于所述用户历史检索记录获得的表征所述用户搜索意图的第二个性化信息。
5.如权利要求1所述的方法,其特征在于,在所述计算获得所述第一查询条件信息的第一权重值,所述个性化信息的第二权重值之后,还包括:
利用所述第一权重值及所述第二权重值,利用公式:w=alpha*w1+(1–alpha)*w2,计算获得融合权重值w,其中alpha加权因子,为0至1间的实数;w1为所述第一权重值;w2为所述第二权重值。
6.一种应用于计算机网络中的搜索系统,其特征在于,包括:
第一获得单元,用于获得由用户输入的第一查询条件信息,及存储于所述计算机网络中的所述用户的个性化信息;
第二获得单元,用于基于所述第一查询条件信息,获得第一查询结果;基于所述个性化信息,获得第二查询结果;
输出单元,用于输出所述第一查询结果至第一显示区域;输出所述第二查询结果至第二显示区域;
所述第二获得单元,具体包括:
权重获得单元,用于计算获得所述第一查询条件信息的第一权重值,所述 个性化信息的第二权重值;
第二获得子单元,用于基于所述第一查询条件信息及所述第一权重值,获得所述第一查询结果;基于所述个性化信息及所述第二权重值获得所述第二查询结果,所述第一权重值和第二权重值是用来决定输出查询结果显示比例用的。
7.如权利要求6所述的系统,其特征在于,所述第二获得单元具体包括:
第一获得子单元,用于基于所述第一查询条件信息,检索获得第三查询结果;
判断单元,用于判断所述第三查询结果中包括的信息数量是否大于或等于一阀值;其中
在所述第三查询结果中包括的信息数量大于或等于一阀值时,所述第一获得子单元通过第三查询结果获得所述第一查询结果;
在所述第三查询结果中包括的信息数量小于一阀值时,所述第一获得子单元,基于由搜索引擎基于所述第一查询条件信息重新自动改写而获得的第二查询条件信息,获得所述第一查询结果。
8.如权利要求7所述的系统,其特征在于,其中所述第一查询条件信息中包括至少一个关键词,所述第二查询条件信息为:
通过去除所述至少一个关键词中一个或多个关键词,获得的查询条件信息;或
通过用一个或多个不包含在所述至少一个关键词中的新关键词去替换所述至少一个关键词中的一个或多个关键词,获得的查询条件信息,其中,所述新关键词为被替换关键词的同义词、近义词或反义词;或
通过用所述用户历史查询条件信息替换所述第一查询条件信息,获得的查询条件信息。
9.如权利要求6‐8中任一所述的系统,其特征在于,所述存储于所述计算机网络中的所述用户的个性化信息包括:存储于所述计算机网络中的表征所述 用户兴趣或偏好的第一个性化信息,和/或基于所述用户历史检索记录获得的表征所述用户搜索意图的第二个性化信息。
10.如权利要求6所述的系统,其特征在于,所述第二获得单元,还包括:
融合权重获得单元,与所述权重获得单元连接,用于利用所述第一权重值及所述第二权重值,利用公式:w=alpha*w1+(1–alpha)*w2,计算获得融合权重值w,其中alpha加权因子,为0至1间的实数;w1为所述第一权重值;w2为所述第二权重值。
CN201110256639.2A 2011-09-01 2011-09-01 一种应用于计算机网络中的搜索方法和系统 Active CN102968417B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110256639.2A CN102968417B (zh) 2011-09-01 2011-09-01 一种应用于计算机网络中的搜索方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110256639.2A CN102968417B (zh) 2011-09-01 2011-09-01 一种应用于计算机网络中的搜索方法和系统

Publications (2)

Publication Number Publication Date
CN102968417A CN102968417A (zh) 2013-03-13
CN102968417B true CN102968417B (zh) 2016-09-28

Family

ID=47798565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110256639.2A Active CN102968417B (zh) 2011-09-01 2011-09-01 一种应用于计算机网络中的搜索方法和系统

Country Status (1)

Country Link
CN (1) CN102968417B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104424286A (zh) * 2013-08-30 2015-03-18 北京四维图新科技股份有限公司 一种搜索信息的方法和系统
CN103699576B (zh) * 2013-11-29 2018-03-23 百度在线网络技术(北京)有限公司 一种用于提供搜索结果的方法与设备
CN104679853B (zh) * 2015-02-13 2018-04-13 百度在线网络技术(北京)有限公司 信息搜索方法及装置
CN105260432A (zh) * 2015-09-30 2016-01-20 北京奇虎科技有限公司 一种网络搜索结果筛选方法及电子设备
CN105260436B (zh) * 2015-09-30 2019-02-12 北京奇虎科技有限公司 一种网络搜索方法及电子设备
CN105354225B (zh) * 2015-09-30 2019-05-31 北京奇虎科技有限公司 一种网络搜索结果推荐方法及电子设备
CN105183900B (zh) * 2015-09-30 2019-05-21 北京奇虎科技有限公司 一种网络搜索结果处理方法、系统、客户端及网络服务器
CN105260434A (zh) * 2015-09-30 2016-01-20 北京奇虎科技有限公司 一种网页浏览控制方法及电子设备
CN105138703B (zh) * 2015-09-30 2019-08-16 北京奇虎科技有限公司 一种基于搜索引擎的网络搜索方法及电子设备
CN106528753A (zh) * 2016-10-28 2017-03-22 腾讯科技(深圳)有限公司 数据搜索方法及装置
CN109660580B (zh) * 2017-10-11 2021-06-22 苏州跃盟信息科技有限公司 一种信息推送方法及装置
CN108664561A (zh) * 2018-04-09 2018-10-16 博光系统有限公司 搜索对比系统及其搜索方法
CN109241103A (zh) * 2018-09-26 2019-01-18 深圳壹账通智能科技有限公司 数据扩展查询方法、电子装置及计算机可读存储介质
CN112699295B (zh) * 2019-10-23 2023-12-12 腾讯科技(深圳)有限公司 一种网页内容推荐方法、装置和计算机可读存储介质
CN111459888B (zh) * 2020-02-11 2023-06-30 天启黑马信息科技(北京)有限公司 一种文献检索的方法与设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1716257A (zh) * 2004-06-30 2006-01-04 微软公司 基于跟踪到的用户偏好对搜索结果进行分级的系统和方法
CN1758248A (zh) * 2004-10-05 2006-04-12 微软公司 用于提供个性化搜索和信息访问的系统、方法和接口
CN1890663A (zh) * 2003-12-03 2007-01-03 咕果公司 用于个人化网络搜索的方法和系统
CN102063451A (zh) * 2010-04-16 2011-05-18 百度在线网络技术(北京)有限公司 供用户进行文字输入及同时提供搜索相关信息的方法和设备
CN102063453A (zh) * 2010-05-31 2011-05-18 百度在线网络技术(北京)有限公司 一种用于基于用户的需求进行搜索的方法和设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020143759A1 (en) * 2001-03-27 2002-10-03 Yu Allen Kai-Lang Computer searches with results prioritized using histories restricted by query context and user community
US7206778B2 (en) * 2001-12-17 2007-04-17 Knova Software Inc. Text search ordered along one or more dimensions
KR20090006464A (ko) * 2007-07-11 2009-01-15 성균관대학교산학협력단 사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1890663A (zh) * 2003-12-03 2007-01-03 咕果公司 用于个人化网络搜索的方法和系统
CN1716257A (zh) * 2004-06-30 2006-01-04 微软公司 基于跟踪到的用户偏好对搜索结果进行分级的系统和方法
CN1758248A (zh) * 2004-10-05 2006-04-12 微软公司 用于提供个性化搜索和信息访问的系统、方法和接口
CN102063451A (zh) * 2010-04-16 2011-05-18 百度在线网络技术(北京)有限公司 供用户进行文字输入及同时提供搜索相关信息的方法和设备
CN102063453A (zh) * 2010-05-31 2011-05-18 百度在线网络技术(北京)有限公司 一种用于基于用户的需求进行搜索的方法和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
搜索引擎个性化查询扩展技术的研究与应用;杨诏钧;《中国优秀硕士学位论文全文数据库信息科技辑(月刊)》;20110715;正文第8-19页以及第31-33页 *

Also Published As

Publication number Publication date
CN102968417A (zh) 2013-03-13

Similar Documents

Publication Publication Date Title
CN102968417B (zh) 一种应用于计算机网络中的搜索方法和系统
Park et al. Identification and evaluation of corporations for merger and acquisition strategies using patent information and text mining
CN105447186B (zh) 一种基于大数据平台的用户行为分析系统
CN104077415B (zh) 搜索方法及装置
CN106339502A (zh) 一种基于用户行为数据分片聚类的建模推荐方法
CN109634698A (zh) 菜单显示方法、装置、计算机设备及存储介质
CN103309869B (zh) 数据对象的展示关键词推荐方法及系统
EP2506152A1 (en) Apparatus and method for analyzing research information about a researcher, and computer-readable storage medium for storing computer-executable program for the method
CN105786875B (zh) 提供问答对数据搜索结果的方法和装置
KR101491627B1 (ko) 모바일 애플리케이션 평가를 위한 리뷰 정량화 방법, 장치 및 시스템
CN109189990A (zh) 一种搜索词的生成方法、装置及电子设备
CN107168991A (zh) 一种搜索结果展示方法和装置
CN103136213B (zh) 一种提供相关词的方法及装置
CN104050243B (zh) 一种将搜索与社交相结合的网络搜索方法及其系统
CN104537341A (zh) 人脸图片信息获取方法和装置
WO2011153171A2 (en) Data isolating research tool
CN109961311A (zh) 客户推荐方法、装置、计算设备及存储介质
US20190179839A1 (en) Methods for evaluating term support in patent-related documents
CN106339898A (zh) 一种基于互联网大数据的产品创新方法
CN107153697A (zh) 一种商品交易网站中的商品搜索方法和装置
CN105608183B (zh) 一种提供聚合类型回答的方法和装置
CN103399879B (zh) 基于用户搜索日志的兴趣实体获得方法及装置
CN107798089A (zh) 信息推荐方法、装置及冰箱
JPWO2016009553A1 (ja) 知財評価システム、知財評価システムの制御方法、および知財評価プログラム
US7716209B1 (en) Automated advertisement publisher identification and selection

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1177289

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1177289

Country of ref document: HK