CN103246677A - 基于社交的搜索办法及搜索系统 - Google Patents
基于社交的搜索办法及搜索系统 Download PDFInfo
- Publication number
- CN103246677A CN103246677A CN2012100308066A CN201210030806A CN103246677A CN 103246677 A CN103246677 A CN 103246677A CN 2012100308066 A CN2012100308066 A CN 2012100308066A CN 201210030806 A CN201210030806 A CN 201210030806A CN 103246677 A CN103246677 A CN 103246677A
- Authority
- CN
- China
- Prior art keywords
- website
- score value
- search
- module
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于社交的搜索办法及搜索系统:把传统搜索引擎和社交技术结合;包括由用户打分评论模块、交易评价模块、官网认证模块、官网问答模块、社交圈推荐模块构建成的社交技术系统,让用户参与甄别、筛选、优化搜索结果,让搜索结果更具有高效准确、社交化、个性化。其中,用户打分评论模块:由用户对网站打分评论的结果来判断网站质量,决定网站在新搜索结果中的排序评级分值;尤其,通过交易评价模块(购物交易卖方为网站、买方为用户)的打分评价来反映对方的交易质量;并通过官网认证模块、官网问答模块、社交圈推荐模块,对搜索结果进行社交技术优化处理,有助用户筛掉搜索结果中的欺诈网站和做出更佳的选择判断。
Description
技术领域
本发明涉及网络信息搜索技术领域,尤其涉及网站或网页质量的排序评级方面,通过搜索引擎与社交技术的结合、技术与人的体验结合,用户对所收录的网站网页进行社交评价处理,解决了搜索结果的网站网页相关性、重要性、诚信度、关键词匹配度的排序评级问题。
背景技术
随着计算机技术和互联网技术的不断发展极大的提高了人们获取信息的便利性。,特别是随着互联网应用的日益普及,对网络中的海量信息进行有效准确的搜索成为一项非常重要的日常活动和研究课题。为了便于人们查找到自己所需的信息,搜索引擎被广泛使用,人们通过输入关键词,即就可找到包含该关键词的网页。
然而,正是由于互联网中数据量日益庞大,通过搜索引擎搜索获得的满足条件的搜索结果一般也是非常多,有时甚至多达数百万,这其中就有相当一部分网页虽然也包含了该关键词,但是与用户所要了解的信息无关。甚至,更严重的是,搜索出来的结果里面,排在靠前位置的网站网页可能属于钓鱼网站,虚假诈骗网站。例如:当用户搜索“铁道部订票官网”,排在前面的可能是一些虚假诈骗网站,而不是铁道部正规官方订票网站,不但浪费了用户的时间和体验,还上当受骗,被钓鱼欺诈网站乱假当真,用户蒙受损失。
因此,为了解决上述存在的问题,有必要研究比现有技术更准确有效更个性化的搜索技术,引进社交和搜索技术结合,提供效果更好的对网站网页评级的办法和系统,对搜索结果进行优化呈现,更好的提高用户搜索体验。
发明内容
基于此,本发明的目的是提供一种高效的对网站网页评级的办法和系统来优化搜索结果,我搜即我要,减少用户在选择目标结果上浪费时间。
本发明另一个目的是通过社交技术手段杜绝钓鱼虚假诈骗网站。
为了达到这2个目的:
a.针对出现在某关键词搜索结果中但与用户搜索目标无关的网站、网页,用户可以对它打分评论,降级区分;
b.对出现在某关键词搜索结果中而且又符合用户搜索要求的网站、网页,用户可以打分评论、升级区分;尤其,诚信值、个人值越高的用户,打分评价的权重系数越高,对网站在搜索结果中的排序影响越大。对数据库里的网站加进官网认证、官网问答、圈子推荐的社交功能模块,更有助用户筛掉搜索结果的钓鱼网站和进一步做出更佳的选择判断。
c.对数据库中曾出现的钓鱼网站,增加黑名单处理。在搜索结果中对用户进行提醒,从而达到杜绝钓鱼虚假诈骗网站。
d.用户与官网认证的网站进行问答对话,减少信息误区和提高用户打分评论精准度。
附图说明
图1是示出了社交搜索系统实施例的系统示意图;
图2A是示出了用户打分评论模块和数据库的模块图;
图2B是示出了交易评价模块和数据库的模块图;
图2C是示出了官网问答模块和数据库的模块图;
图2D是示出了社交圈推荐模块和数据库的模块图;
图2E是示出了官网认证模块和数据库的模块图;
图3是示出了根据本发明一个实施例的界面。
具体实施方式
下面结合附图和实施例对上述技术系统和办法做进一步的说明。在下面的部分,详细说明了本发明的系统和办法如何对网站网页进行评级,各子系统的权重参数的汇总应用。
本发明的实施例通过一个互联网搜索引擎系统、结合社交技术系统而实现。搜索引擎系统通过网络爬虫模块、网页库、索引模块后,网站网页数据进入数据库,等待用户搜索请求。那么,在这个数据库里的各个网页和网站已被系统编号索引,分别称为网页的文档标识号(doc ID)和网站标识号(site ID)。以下重点说明这个数据库和社交技术系统的数据交互。
图1是示出了社交搜索系统实施例的系统示意图。在该示例中,社交技术系统101包括了打分评价模块102、交易评价模块103、官网问答模块104、社交圈推荐模块105、官网认证模块106。通过社交技术系统101,用户可以对用户查询模块115输出的搜索结果进行反馈操作:打分评论、交易评论、官网问答、社交圈推荐;经过众多用户反馈操作之后,就改变了各个网站和网页的评级。
图2A是示出了用户打分评论模块和数据库的模块图。打分评论模块102是用户直接对搜索结果上的网站进行打分评论,打分评论的结果是用户体验的体现,反过来也反映了网站对应的该搜索关键词匹配度、网站质量、用户个性化要求。打分评论模块102包括用户打分评价部分201、打分统计系统202,其中打分统计系统202直接把打分统计存储到数据库,在被打分的网站再次搜索出来,就会在搜索结果上显示其最新的打分结果。
图2B是示出了交易评价模块和数据库的模块图。交易评价模103包括交易系统211、获得交易对方评价机制212、网站管理员(卖家)213。在买家用户和网站管理员卖家之间达成交易后,双方都获得评价对方的机会,这是基于真实成交基础上的评价,这种交易评价的价值远大于无交易评价的。如果用户买家给于卖家网站的交易评价是差评,积累到一定程度,就说明该网站离用户期望值相差大,甚至是诚信度低的网站。那么,这些交易评价数据就会影响到该网站在搜索结果中的排序。如果用户买家经常被卖家网站评价的个人值越高,那么,该用户对所评价过的网站的排序影响越大。
图2C是示出了官网问答模块和数据库的模块图。官网问答模块104包括用户提交问题221、网站做出回答222、网站管理员213。官网问答模块是由用户提交问题,网站做出回答,进行互动,有助用户对该网站打分评价的判断。
图2D是示出了社交圈推荐模块和数据库的模块图。社交圈推荐模块105包括用户查看推荐231、提交网站推荐232、社交圈(好友、关注、粉丝、专家)245。其中社交圈(好友、关注、粉丝、专家)是和用户有一定社交关系的,推荐的网站会更值得该用户信赖。社交圈(好友、关注、粉丝、专家)里不同关系角色推荐的网站,会给予相对应的推荐权重系数,会在搜索结果得到体现。一般来说,好友、关注、专家、粉丝、普通网友的权重系数自高往低。
图2E是示出了官网认证模块和数据库的模块图。官网认证模块106包括查询认证241、网站提交官网认证242、网站管理员213。官网认证模块为网站做官方认证,既是为官方问答模块、交易评价模块做铺垫,也是用减少用户误判了钓鱼网站、欺诈网站。
图3是示出了根据本发明一个实施例的界面。
以上是对社交技术系统各个模块和流程做说明,下面对社交技术系统影响到各个网站网页在搜索结果中的排序权重做个说明。
在一个示例中,网站A的一般搜索引擎pagerank评级值为Pa;用户i个人值为Ci,用户i对网站A打分评论值为Ri,对网站A的交易评价值为Si;某用户J社交圈(好友圈1j、关注圈2j、专家圈3j、粉丝圈4j)的推荐值Fmj和推荐权重系数Mmj分别对应(F1j、M1j;F2j、M2j;F3j、M3j;F4j、M4j)。网站A的官网认证值为Ga。同时,设定一般搜索引擎评级值、打分评论值、交易评价值、社交圈推荐值、官网认证值的搜索结果排序权重系数分别是D1、D2、D3、D4、D5,其中(D1+D2+D3+D4+D5=1)。
那么,网站A在某用户J的社交搜索引擎中索引排序权重值Qa为:
对于另外一个网站B在用户J的社交引擎中索引排序权重值Qb,
如果Qa>Qb,那么网站A在关键词匹配相当条件下的搜索结果中排在网站B的前面;
如果Qa<Qb,那么网站A在关键词匹配相当条件下的搜索结果中排在网站B的后面。
同时,在这个计算公式里可以看到,每个用户i对应的社交圈不同,得到的个性化的推荐搜索结果也不一样。从打分评价值和交易评价值中,用户可以有效甄别筛掉钓鱼网站、欺诈网站。
Claims (14)
1.一种基于社交的搜索办法,其特征在于,包括以下步骤:系统及用户设置网页或网站的主题分值、接收限制主题的搜索请求、确定用户的个人信息、基于所述个人信息根据搜索请求搜索满足主题分值的网页或在满足主题分值的网站内搜索并返回搜索结果。
2.根据权利要求1所述的搜索方法,其特征在于,包括以下步骤:先获取系统及用户设置网页或网站的主题分值的各子分值,再统计出网页或网站的主题分值,基于个人信息特征将所述网页或网站的主题分值作为索引的一部份。
3.根据权利要求2所述网页或网站主题分值的各子分值,其特征在于,包括以下分值:计算用户打分评价分值、交易评价分值、官网认证分值、社交圈推荐分值、一般传统搜索引擎网页或网站pagerank值。
4.根据权利要求3所述权利,其特征在于,所述用户打分评价分值、交易评价分值:用户对网页或网站的体验反馈和打分评价,反映其质量;打分评价分值和交易评价分值均由大量不同用户根据自己体验来完成,为该网页或网站在索引排序里的一个重要评级分值。
5.根据权利要求3所述权利,其特征在于,所述官网认证分值:社交搜索系统接受网站提交官网认证的请求,该网站通过其自身质量、主题相关性、诚信度的测评要素,获得系统给予的官网认证评级分值(即官网认证分值);官网认证分值作为该网页和网站在索引排序里的一个重要评级分值。
6.根据权利要求3所述权利,其特征在于,所述社交圈推荐分值:基于用户的个人信息,用户社交圈(好友、关注、粉丝、专家)推荐的网页或网站给予相应的推荐评价分值,并且作为该网页或网站在索引排序里的一个重要评级分值。
7.根据权利要求2所述的搜索方法,其特征在于,所述统计出网页或网站的主题分值,包括以下步骤:统计各子分值;将各子分值分别乘对应权重系数后相加之和作为所述网页或者网站的主题分值。
8.一种基于社交的搜索系统,其特征在于,一般传统搜索引擎系统和社交系统结合。
9.根据权利要求8所述的搜索系统,其特征在于,所述社交系统包括:用户打分评价模块、交易评价模块、官网认证模块、官网问答模块、社交圈推荐模块;
用户打分评论模块,用于接收、统计用户对网页或网站的打分评论;
交易评价模块,用于接收、统计用户和网站之间的相互评价对方交易质量的打分评论;
官网认证模块,用于接收、统计网站请求官网认证及网站认证评级分值;
官网问答模块,用于接收用户对已通过官网认证的网站提交问题及该网站对用户问题做出回答,问答质量影响用户对该网站的打分评价分值;
社交圈推荐模块,用于接收、统计用户社交圈(好友、关注、粉丝、专家)推荐的网站给予相应的推荐评价分值。
10.根据权利要求8所述的搜索系统,其特征在于,所述一般传统搜索系统包括:
数据库模块,与所述社交系统相连,用于存储缓存搜索数据、社交系统数据;
索引模块,与所述数据库模块及社交系统数据相连,用于存储所述网页网站主题分值的信息。
用户查询模块,与服务器、索引模块相连,用于搜索查询网站或网页及返回结果。
11.根据权利要求10所述的搜索系统,其特征在于,所述索引模块:将社交系统中的网页或网站主题分值与一般传统搜索引擎的网页或网站pagerank值按各自对应权重系数相乘后再相加之和作为最终的索引排序值,在索引模块中进行索引排序并存储。
12.根据权利要求11所述的搜索系统,其特征在于,所述索引排序值:在搜索请求返回结果中的每个网页结果,按照各自网页的索引排序值自高往低排列。
13.根据权利要求12所述的搜索系统,其特征在于,所述每个网页结果:搜索返回结果中的每个网页结果(含网页标题、URL、摘要)和用户对该网页结果所产生的内容(含用户打分评论、交易评论、官网认证标识)合并在系统里自动生成一条独立的新URL,反馈存储在数据库模块中。
14.根据权利要求12、13所述的搜索系统,其特征在于,所述搜索返回结果:通过用户查询模块的关键字,从数据库模块中获取匹配关键词并符合索引排序值的每个网页结果和用户对该网页结果所产生的内容,以及它们对应的独立新URL,作为返回搜索结果内容返回界面。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012100308066A CN103246677A (zh) | 2012-02-13 | 2012-02-13 | 基于社交的搜索办法及搜索系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012100308066A CN103246677A (zh) | 2012-02-13 | 2012-02-13 | 基于社交的搜索办法及搜索系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103246677A true CN103246677A (zh) | 2013-08-14 |
Family
ID=48926201
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012100308066A Pending CN103246677A (zh) | 2012-02-13 | 2012-02-13 | 基于社交的搜索办法及搜索系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103246677A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103745390A (zh) * | 2014-02-14 | 2014-04-23 | 珠海市君天电子科技有限公司 | 第三方网购商品差评方法及装置 |
CN104657353A (zh) * | 2013-11-18 | 2015-05-27 | 段卫东 | 在电子商务页面调用社交应用软件评议产品的方法和装置 |
WO2015096524A1 (zh) * | 2013-12-24 | 2015-07-02 | 北京奇虎科技有限公司 | 网页搜索方法及客户端 |
CN104796478A (zh) * | 2015-04-24 | 2015-07-22 | 中国联合网络通信集团有限公司 | 一种资源推荐方法及装置 |
CN105260849A (zh) * | 2015-10-21 | 2016-01-20 | 内蒙古科技大学 | 一种跨社交网络的科研人员评价方法 |
CN105354259A (zh) * | 2015-10-22 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 移动搜索方法和装置 |
CN106294578A (zh) * | 2016-07-27 | 2017-01-04 | 北京奇虎科技有限公司 | 一种定制搜索方法及装置 |
CN106485525A (zh) * | 2015-08-31 | 2017-03-08 | 百度在线网络技术(北京)有限公司 | 信息处理方法及装置 |
CN107741939A (zh) * | 2016-10-31 | 2018-02-27 | 腾讯科技(深圳)有限公司 | 一种网页信息的识别方法及装置 |
CN109902236A (zh) * | 2019-03-07 | 2019-06-18 | 成都数之联科技有限公司 | 一种基于非概率模型的垃圾网页降级方法 |
CN110807091A (zh) * | 2019-03-01 | 2020-02-18 | 王涵 | 一种酒店智能问答推荐与决策支持分析方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101526951A (zh) * | 2009-04-15 | 2009-09-09 | 腾讯科技(深圳)有限公司 | 搜索方法及搜索系统 |
CN101739461A (zh) * | 2009-12-24 | 2010-06-16 | 丘雷 | 由用户设置的多维排序方法 |
US20110191315A1 (en) * | 2010-02-04 | 2011-08-04 | Yahoo! Inc. | Method for reducing north ad impact in search advertising |
CN102541857A (zh) * | 2010-12-08 | 2012-07-04 | 腾讯科技(深圳)有限公司 | 一种网页排序方法和装置 |
-
2012
- 2012-02-13 CN CN2012100308066A patent/CN103246677A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101526951A (zh) * | 2009-04-15 | 2009-09-09 | 腾讯科技(深圳)有限公司 | 搜索方法及搜索系统 |
CN101739461A (zh) * | 2009-12-24 | 2010-06-16 | 丘雷 | 由用户设置的多维排序方法 |
US20110191315A1 (en) * | 2010-02-04 | 2011-08-04 | Yahoo! Inc. | Method for reducing north ad impact in search advertising |
CN102541857A (zh) * | 2010-12-08 | 2012-07-04 | 腾讯科技(深圳)有限公司 | 一种网页排序方法和装置 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104657353A (zh) * | 2013-11-18 | 2015-05-27 | 段卫东 | 在电子商务页面调用社交应用软件评议产品的方法和装置 |
CN104657353B (zh) * | 2013-11-18 | 2018-10-02 | 段卫东 | 在电子商务页面调用社交应用软件评议产品的方法和装置 |
WO2015096524A1 (zh) * | 2013-12-24 | 2015-07-02 | 北京奇虎科技有限公司 | 网页搜索方法及客户端 |
CN103745390A (zh) * | 2014-02-14 | 2014-04-23 | 珠海市君天电子科技有限公司 | 第三方网购商品差评方法及装置 |
CN103745390B (zh) * | 2014-02-14 | 2017-03-01 | 珠海市君天电子科技有限公司 | 第三方网购商品差评方法及装置 |
CN104796478A (zh) * | 2015-04-24 | 2015-07-22 | 中国联合网络通信集团有限公司 | 一种资源推荐方法及装置 |
CN104796478B (zh) * | 2015-04-24 | 2019-03-15 | 中国联合网络通信集团有限公司 | 一种资源推荐方法及装置 |
CN106485525A (zh) * | 2015-08-31 | 2017-03-08 | 百度在线网络技术(北京)有限公司 | 信息处理方法及装置 |
CN105260849A (zh) * | 2015-10-21 | 2016-01-20 | 内蒙古科技大学 | 一种跨社交网络的科研人员评价方法 |
CN105354259A (zh) * | 2015-10-22 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 移动搜索方法和装置 |
CN106294578A (zh) * | 2016-07-27 | 2017-01-04 | 北京奇虎科技有限公司 | 一种定制搜索方法及装置 |
CN106294578B (zh) * | 2016-07-27 | 2019-12-10 | 北京奇虎科技有限公司 | 一种定制搜索方法及装置 |
CN107741939A (zh) * | 2016-10-31 | 2018-02-27 | 腾讯科技(深圳)有限公司 | 一种网页信息的识别方法及装置 |
CN107741939B (zh) * | 2016-10-31 | 2020-05-12 | 腾讯科技(深圳)有限公司 | 一种网页信息的识别方法及装置 |
CN110807091A (zh) * | 2019-03-01 | 2020-02-18 | 王涵 | 一种酒店智能问答推荐与决策支持分析方法及系统 |
CN110807091B (zh) * | 2019-03-01 | 2023-08-18 | 王涵 | 一种酒店智能问答推荐与决策支持分析方法及系统 |
CN109902236A (zh) * | 2019-03-07 | 2019-06-18 | 成都数之联科技有限公司 | 一种基于非概率模型的垃圾网页降级方法 |
CN109902236B (zh) * | 2019-03-07 | 2021-06-11 | 成都数之联科技有限公司 | 一种基于非概率模型的垃圾网页降级方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103246677A (zh) | 基于社交的搜索办法及搜索系统 | |
Lappas et al. | The impact of fake reviews on online visibility: A vulnerability assessment of the hotel industry | |
US20190073597A1 (en) | Determining trustworthiness and compatibility of a person | |
US10417301B2 (en) | Analytics based on scalable hierarchical categorization of web content | |
US10452662B2 (en) | Determining search result rankings based on trust level values associated with sellers | |
US8615514B1 (en) | Evaluating website properties by partitioning user feedback | |
US20080140680A1 (en) | Systems and methods for verifying jobseeker data | |
CN104657879A (zh) | 基于用户参与的根据上下文的用于无保障递送的自动定价 | |
CN103729359A (zh) | 一种推荐搜索词的方法及系统 | |
CN102541972A (zh) | 基于各自目标匹配登广告者和用户 | |
CN104978346A (zh) | 提供用户评价信息的方法及系统 | |
TW201207651A (en) | Operationalizing search engine optimization | |
Stahl et al. | Marketplaces for digital data: Quo vadis? | |
CN101206744A (zh) | 一种在购物搜索引擎中融入商品自定义信息的方法 | |
CN103345517A (zh) | 模拟tf-idf相似性计算的协同过滤推荐算法 | |
Khraim | The impact of search engine optimization dimensions on companies using online advertisement in Jordan | |
CN105978729B (zh) | 一种基于用户上网日志及位置的手机信息推送系统及方法 | |
CN105408929A (zh) | 利用反向拍卖的加盟店推荐方法及推荐装置 | |
CA2862763A1 (en) | Computerized internet search system and method | |
Becker et al. | What happens after an ad click? quantifying the impact of landing pages in web advertising | |
TWI501096B (zh) | 排名用戶產生的網路內容 | |
TW201234204A (en) | Opportunity identification for search engine optimization | |
US20080082433A1 (en) | Online information marketplace | |
CN101789018A (zh) | 基于交互信息的网页点击描述文档构建方法及装置 | |
US10679227B2 (en) | Systems and methods for mapping online data to data of interest |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
DD01 | Delivery of document by public notice |
Addressee: Taoxin Network Co., Ltd. Document name: Notification of Publication and of Entering the Substantive Examination Stage of the Application for Invention |
|
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130814 |