CN101909018A - 根据用户浏览网页返回即时通信群组的方法与系统 - Google Patents

根据用户浏览网页返回即时通信群组的方法与系统 Download PDF

Info

Publication number
CN101909018A
CN101909018A CN2009101469025A CN200910146902A CN101909018A CN 101909018 A CN101909018 A CN 101909018A CN 2009101469025 A CN2009101469025 A CN 2009101469025A CN 200910146902 A CN200910146902 A CN 200910146902A CN 101909018 A CN101909018 A CN 101909018A
Authority
CN
China
Prior art keywords
group
network address
user
webpage
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009101469025A
Other languages
English (en)
Inventor
发明人姓名不公开
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN2009101469025A priority Critical patent/CN101909018A/zh
Publication of CN101909018A publication Critical patent/CN101909018A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种用户在浏览网页时返回即时通信群组的方法,包括实现一种客户端,这个客户端会自动探测用户当前浏览的网页的网址,让用户在获取网页相关群组的时候就可以不用输入关键字等信息;在服务器设有网址-群组的关系信息,可以快速地找出网址对应的即时通信群组,同时再利用用户的行为来调整或生成服务器上的网址-群组的关系信息。这样本发明简化了用户在浏览网页的时候想查找相关即时通信群组的流程,同时提高了返回群组的满意度,进而可以扩大即时通信群组的应用范围。

Description

根据用户浏览网页返回即时通信群组的方法与系统
技术领域
本发明涉及即时通讯领域,尤其是涉及即时通讯中群组的查找方式,同时还涉及了互联网的信息处理与数据挖掘领域。
背景技术
网络即时通讯(IM)工具发展到今天,已经被几乎所有的网民所接受,成为用户必不可少的软件工具,不但在平时的休闲娱乐中,而且在用户的工作中得到广泛的使用,因此用户对IM软件的易用性,稳定性,安全性等方面提出了较高的要求。现有的IM软件,已经实现了个人对个人的聊天体验,而且可以把用户聚集在一起组成群组,用户可以在群组的空间中自由的交流与沟通。用户通过获取群组的号码或关键字等信息,在IM软件的群组查找入口可以很方便的查找群组。
现有IM软件的查找群组的方法可以具体表示为,用户打开群组查找窗口,选择群组的某种特性相关的查找方式,如“查找校友录“、”分类查找“和“精确查找”等,然后再输入这个特性的某个关键字。客户端把这些信息发送到服务器,服务器返回满足此特性关键字的群组列表信息给客户端。如果用户在上网过程中,希望查找出他当前浏览内容相关的群组,则用户要先从其浏览网页内容中选择某个关键字,尝试用这个关键字来查找群组。如果获取结果不满意,则还可能另选关键字再尝试。此方式不是很方便,如果对用户来说他们的兴趣不是很高,他们就会放弃使用;同是用户对关键字选择的多样性上,可能把他们导入到不同的群里。如果可以简化这些操作,不需要用户去输入关键字也不需要尝试不同关键字就可以找到相关的群组,则可以开拓群组的使用范围。
发明内容
本发明要解决的技术问题在于提供一种返回群组的方法,根据用户正在浏览的网页,返回跟网页相关的即时通讯群组。同时互联网上有很多导航性的网页,对于这类网页也要能返回用户满意的即时通讯群组。
为了解决上述技术问题,本发明提供了一种返回群组的方法,包括:
客户端获取用户浏览网页的网址,发送携带该网址或者是指代该网址的某种编码或编号的查询请求。
服务器端设置有网址群组的关系信息库,服务器收到的请求后,解析出请求中携带的网址,并根据网址与群组对应关系信息获取相关群组并返回给客户端;
客户端将服务器返回的群组展现给用户。
优选的,客户端可以设置一种工作模式,用户每打开一个网页,客户端就自动获取该网页的网址,并向服务器发送携带该网址的查询请求。
优选的,上述网址-群组的关系信息库中的对应关系信息,包括网址对应网页内容与群组主题的相关性,网页内容可以用该网页中有代表性的若干关键字来表示。
上述的网址-群组的关系信息库中的对应关系信息能够通过用户行为生成和调整。用户行为包括用户浏览的网页与参与了的群组,通过挖掘网页与群组出现的规律,得到网址与群组的相关性。
对用户是否浏览了网页和是否参与了群组都设立了一些标准。优选的,用户浏览了某网页,是指用户浏览该网页时间超过某一设定值,如果用户浏览时间低于此设定值,则该网页不归入用户浏览的网页。优选的,如果用户在群组中发送消息次数超过设定值,认为用户参与了群组;如果用户在群组中的停留时间超过设定值,认为用户参与了群组;优选的,还对群组进行分类,不同类型的群组有不同的参与标准:如建立时间在一个设定值内的群组,消息的设定数可以为零,只要用户进入了这个群组就认为用户参与了群组交流。
优选的,根据用户行为生成和调整网址-群组的关系信息还包括对用户行为赋予相应的权重值。所述权重表示该用户行为在所有被分析的用户行为挖掘统计中的重要性。
优选的,上述根据用户行为生成和调整网址-群组关系信息,包括用户行为是否使用互联网搜索的分析步骤:预置网址规则库,如果用户浏览的网址符合该预置网址规则库,则对该用户行为赋予相应的权重值。
优选的,上述根据用户行为生成和调整网址-群组关系信息,包括用户行为发生时间先后的分析步骤。根据用户行为发生的时间的先后及顺序,给用户行为赋予相应的权重值。
优选的,所述一种返回即时通讯群组的方式,包括重复网址分析,将重复的网址对应为第二网址,进而获得与第二网址对应的群组。
优选的所述重复网址包括:网页内容相同的网址,搜索同一关键字的网址,及文章被分页后出现的各分页的网址。
其中对网页内容相同这种类型的重复网址的分析包括以下步骤。
对第一网页进行分析,得到其特征值,保存至网页特征库中。
对第二网页进行分析,得到其特征值,保存到网页特征库中。
如果达到预期设定相似度,则认为它们对应的网址是互为重复网址。
对网页内容相同这种类型的重复网址的分析还可以使用”canonical”标签。
优选的,上述重复网址分析还可以用于网址-群组的关系信息的生成与调整:将重复网址对应为第二网址,进而由第二网址取代与其对应重复网址参与用户行为的分析。
优选的,所述一种返回即时通讯群组的方式,服务器在返回相关群组的同时还返回与群组相关的网页。
本发明还提供了一种即时通讯系统,包括:
客户端和服务器,其中
客户端包括:
网址获取模块,获取用户浏览网页的网址;
命令生成模块,生成携带该网址或者是指代该网址的某种编码或编号的请求并向服务器发送;
群组展现模块,将服务器返回的群组展现给用户;
服务器包括:
网址-群组关系信息库:用于存储网址与群组对应关系信息;
命令处理模块,根据客户端发送的网址从网址-群组关系信息库中获得相关的群组,并将群组返回给客户端。
客户端可以设置一种模式,每打开一个网页,客户端就自动获取该网页的网址,并生成携带该网址的查询请求发给服务器。
上述的网址-群组的关系信息库中的对应关系信息,包括网址对应网页内容与群组的主题的相关性,网页的内容可以用该网页中有代表性的若干关键字来表示。
上述网址与群组对应关系信息能够通过用户的行为生成和调整,此时所述的网址-群组的关系信息可以由以下模块处理:
用户行为收集模块:从日志或从客户端发到服务器的信息流中收集用户行为的数据,取得用户浏览的网页与用户参与的群组的信息。客户端还包括用户行为辅助模块,为上述的用户行为收集模块提供必要用户行为数据。
基于用户行为的网址-群组的关系处理模块:挖掘统计用户行为中网页与群组出现的规律,得到网址与群组的相关性信息。
上述网址与群组对应关系信息通过用户的行为生成和调整,包括权重赋予模块,对用户行为赋予相应的权重值,所述权重表示该用户行为在所有被分析的用户行为挖掘统计中的重要性。优选的如果权重低于预置值,则在挖掘统计中去除该给用户行为。
上述即时通讯系统,还包括重复网址的分析模块:将重复的网址对应为第二网址,进而可以用来获得与第二网址对应的群组;进而由第二网址取代所有网页内容相同的网址参与用户行为的分析。
优选的重复网址包括:网页内容相同的网址,搜索同一关键字的网址,及文章被分页后的各分页的网址。
上述即时通讯系统,还包括服务器在返回相关群组的同时还返回与群组相关的网页。
与现有技术相比,本发明具有以下优点:
首先,本发明以用户浏览网的网址作为输入来返回群组,用户并不需要输入文字性的信息,简化用户在浏览网页时想看看相关即时通讯群组的操作。这样可以让即时通讯群组有更大范围的应用。
其次,本发明引入了根据用户行为来调整或生成网址-群组的关系信息,提高了返回群组的准确性,尤其对于导航性的网页,因为这类网页一般没有核心的关键字,不容易从内容方面建立网址与群组的关系信息。
再次,为了进一步保证网址-群组的关系的准确性与时效性,本发明对不同的用户行为赋予不同的权重值:在用户在使用搜索引擎查找时赋予相应权重值,对不同时间发生的用户行为赋予相应权重值;本发明还把重复的网址对应为第二网址,进而可以获得第二网址对应的群组,进而由第二网址取代重复的网址参与用户行为的分析。
附图说明
图1为所述一种返回即时通讯群组的方法的步骤流程图;
图2为所述一种基于频率统计的计算网址与群组的相关度的简单流程图;
图3为所述一种即时通讯系统的结构示意图
图4为所述一种网址-群组关系信息生成系统的结构示意图
具体实施方式
为了本发明的上述目的、特征和优点更加明显易懂,下面结合附图和具体实施方式对本发明作进一步的详细的说明。
本发明的核心思路是实现一种客户端,这个客户端会自动探测用户浏览的网页的网址,让用户在获取网页相关群组的时候就可以不用输入任何信息;在服务器设有网址-群组关系信息库,可以快速地找出网址对应的群组。本发明还包含网址-群组关系信息库的生成。优选的,为了得到更准确的网址与群组的关系信息,网址-群组关系信息的生成与调整包含了对用户行为的分析及对重复网址的分析。
参考图1,示出了本发明实现的一种返回即时通讯群组的方法的步骤流程图, 包括以下步骤。
步骤S11,本发明包括一个客户端在用户计算设备上,客户端成功登录后,只要用户新打开一个网页,客户端就自动获取新打开网页的网址,生成含有此网址其他相关信息的数据包,利用约定的套接字发送给网络侧服务器去获取本网页的相关群组。当然也可以在用户需要的时候再去取结果,比如客户端可以利用窗口函数生成“查找当前网页的群组”浮动小窗口,当用户点击此浮动小窗口,客户端取出当前用户正在浏览网页的网址,然后向服务器去发送携带该网址的查询请求。当然发给服务器的查询请求,携带的还可是指代该网址在系统中的一种编号,还可以指代该网址本身的一种编码,如进行特定的哈希计算,将网址转成另一字符串。
获取用户当前浏览网页的网址在不同的操作系统及不同的浏览器下有不同的实现方式,同一操作系统同一浏览器也有存在多种实现方式,这里说明在windows系统IE内核浏览器情况下的一种实现方式。在windows系统IE内核浏览器下,可以利用SHDocVw::ShellWindows来获取IE内核游览器所打开的所有网址及对应的窗口句柄,再通过SetWindowsHookEx跟踪IE窗口的激活记录。通过两者结合,得到最近一个被激活IE内核浏览器窗口的网址。可以认定这个网址就是用户当前在浏览的网址。为了让使用不同浏览器的用户均可以使用本客户端,本客户端获取网页功能应该要支持多种浏览器。当然本发明的客户端本身也可以是某一浏览器的插件,或是某一浏览器的部分,可以随浏览器软件一同发布。
步骤S12,从上述客户端发来的数据包里解析出网址,然后根据该网址从网址-群组的关系信息库里取出该网址对应的群组,将群组信息发送回客户端。返回信息包括每个群组的标题、描述、在线人数等信息。优选的,返回信息还包含网址与群组列表的相关程度的数值。网址-群组的关系信息库保存了网址与群组的相关程度的数值。
在网址与群组的关系信息的生成维护上,可以通过各种业务逻辑人工来维护,但由于本发明涉及网页是全网的海量网址,所以更需要有一种自动的维护网页与群组的关系信息的系统或算法。可以通过分析网址对应的网页内容与群组主题的相关性来建立网址与群组的关系。从网址对应的网页里找出最能代表这个网页内容的若干关键字,从群组的标题、描述和交流内容中提取最能代表这个群组的主题的若干关键字,计算两组关键字的匹配程度,如果匹配程度大于某一设定值,就认为应该网址与群组是相关的。优选的,还保存上述匹配程度作为该网址与群组的相关程度的数值。在网页内容里找出代表这个网页内容的关键字,可能使用TF-IDF算法。更进一步,可以在TF-IDF算法中加入网页结构因素(文字所处的位置、文字的字体、字形及字号、文字修饰等)分析,来更加有效地确定关键字的权重。也可以使用其他本领域技术人员所熟悉的方法来计算网址对应网页内容与群组的主题的相关性。特别的,现有的即时通讯系统都包括通过关键字查找群组的功能,这里就可以复用原来已经存在的关键字与群组的对应关系。
网址与群组还可能存在除内容之外的其他相关性。比如一个门户网站(如www.sohu.com)的首页会与一些热门事件的群组相关联,两者并没有明显的内容上的相关性。根据用户行为来生成与调整网址与群组的关系,能体现出网址与群组在时效性、用户兴趣等更泛化的相关性上。优选的,本发明包含步骤S14--根据用户行为来生成与调整网址与群组的相关性。
S13,把返回的网址相关群组展现给用户。展现内容包括每个群组的标题、描述、在线人数等信息。优先的,如果返回结果包括群组与网址的相关程度,各个群组可以依照对应相关程度的大小来排列,当然也可以别的显示方式来表示群组与网址的相关程度。
S11去取网页关联群组与S12浏览返回群组都希望在不影响或基本不影响用户浏览网页的情况下进行。用户可以设定每打开一个新的网页就从服务器取回相关群组,则获取群组的操作可以由客户端自动完成。展现群组的操作方式可以生成一个“浮动小窗口”,用户通过点击这个“浮动小窗口”时显示一个窗口,展现群组信息。当然还可以是本领域工作人员可以想到的别的方式,比如可以在桌面右下角托盘里生成一个图标,用户点击这个“图标”来展现群组;可以在浏览器上增加一个按钮,用户通过点击这个按钮来展现群组;可以在浏览器边上或在桌面边上生成一个可滑进滑出的窗口。除了让客户端自动去获取每一个网页相关的群组,还可以让用户手动去控制获取结果,这时从服务器取回群组与展示群组的都可以通过上述的操作一次完成:先从服务器取回群组,然后立刻展示。
S14对用户行为信息进行分析,调整或生成网址与群组的相关性。对用户行为信息进行分析,是指利用用户的隐性行为信息--用户浏览过的网页信息与参与过的群组信息,挖掘用户浏览过程中网页与群组出现的规律,得到网址与群组的相关程度数值。例如一种比较简单的挖掘就是如果用户在一个设定的时间间隔内浏览了一个网页又参与了一个群组,则认为此次行为中该网页与该群组是相关的。这里基于上面假设的介绍一种简单的统计算法--一种基于频率统计的算法,来根据用户行为统计网址与群组的相关程度数值。
如图2所示,一种基于频率统计的计算网址与群组的相关度的简单流程,其步骤包括:
步骤S21,统计某个时间内某个网址被浏览过的次数,记为A。
步骤S22,统计某个时间内某个群组被参与的次数,记为B。
步骤S23,统计某个时间内网址与群组同时被浏览或参与的次数,记为C。
同时是指两事件发生在同一用户上且时间时隔小于设定值。
步骤S24,计算出数据D=C/Max(A,B),其中Max(A,B)表示A、B两个数中数值较大的一个,可以认为D为该网址与该群组的相关度的有效值,也就是本方法所需要的网址与群组的相关程度数值。当然数据挖掘是一个比较复杂的技术,并不排除即时通信领域或数据挖掘领域技术人员采用别的模型与挖掘算法,通过网址与群组出现的规律来统计发掘网址与群组之间的关系。
对于用户是否浏览了某个网页,可以有很多参数。例如网页被打开的时间长短,网页在用户桌面的可见时间长短等,如果网页被打开的时候超过设定值,则认为用户参与了群组,如果网页在桌面的可见时间超过设定值,则认为用户参与了群组。
对于用户是不是参与了某个群组,也可以用很多方法。例如如果用户在群组里发送消息次数超过某个阀值,就认为用户参与了这个群组;再例如如果用户在群组中的停留时间超过某个阀值,也认为用户参与了这个群组,当然根据实际情况还可能有更多的形式来判断用户是不是参与了群组。
本发明方法还包括对群组进行分类,对不同类型的群组设定不同的群组参与的标准。一般来说,一个刚建立的群组参与人数较少,这个群组对于当前浏览者是否有价值在于当前浏览者是否关注它,所以消息数的阀值可以为零,用户只要向这个群组发送要求加入消息或进入这个群组,就认为用户参与了这个群组。这样如果很多人关注了一个新建群,它就可以与更多的网页更快地建立关系,有利于那些有价值的新建立的群组更快地形成规模。对于人数大于某一个范围(比如1000)的群组,这类情况多发生在一个社会热点新闻相关的群中,由于人数众多,用户在这里接受信息一般是单向的,即用户多是不参与讨论,但会关注其它用户讨论,设定相应的用户在群组停留时间的阀值(即上述停留时间的设定值),在用户在群组停留时间超过设定值就认为参与了这个群组。
本发明方法还包括对用户行为赋予相应权重值。所述权重值表示该用户行为在挖掘网址-群组的关系信息时,在所有被挖掘的用户行为中的重要性;对某一用户行为赋予权重值,那么该行为中所产生的网址与群组的关系在挖掘统计的时候要加以该权重值修正。优选的,某次用户行为的权重小于设定值,则不挖掘统计该用户行为中体现的网址与群组的关系。
优选的,对用户行为赋予相应权重值是对浏览过程赋予相应权重值,浏览过程是指用户的一次连续访问多个网页的活动,即如果相邻的两次网页访问之间的时间间隔大于预设值,则前部分属于一个浏览过程,后一部分属于另一个浏览过程。这样上述权重值的赋予就可以变成对浏览过程赋予相应的权重值。拿图2所示基于频率统计的算法来说,假设网页A与群组B都在权重为1的浏览过程中分别被浏览或参与了10次(但不发生在同时),又在一个权重为10的浏览过程中同时被浏览了1次。则根据步骤S21,A网址被浏览次数可以计算为:10(普通浏览)+1(权重10的浏览)*10(权重)=20次,S22步骤中B群组被参与次数可以计算为:10(普通浏览)*1(权重)+1(权重10的浏览)*10(权重)=20次,S23步骤中A与B同时发生的次数可以计算为:1(权重10的浏览)*10(权重)=10次,最后S24步骤我们可以算得网址A与群组B的关系为10/Max(20,20)=0.5。在此我们可以看到虽然A与B只是同时被浏览了一次,但因为发生在比较重要的浏览过程当中,他们的相关性还是很大,当然以上的算法只是一个举例,算法具体实现本专利不予以限定,且按浏览过程赋予权重是一种优选方法,并不限定于按浏览过程赋予权重。
对用户行为赋予相应权重值分析中,包含用户使用搜索引擎进行搜索的分析。所述搜索引擎包括通用搜索引擎、专业搜索引擎及一些站内的搜索引擎。对使用搜索引擎搜索的用户行为,赋予较高的权重值。一般经验认为,目前大众普遍所使用的搜索网站在用户输入关键字进行搜索后,关键字是通过HTTP协议中的GET方式发送的,即网址里会包含特殊键值对,用户查询的关键字就在这个特殊键值对里。比如在用百度搜索关键字“xmpp”时,得到的网址是www.baidu.com/s?wd=xmpp,其中键值对“wd=xmpp”含有用户查找的关键字xmpp。我们可以使用网址分析的方式,预置网址规则库,对符合网址规则的网址,认为使用了搜索引擎查找,赋予该的用户行为相应的权重值。优选的,根据使用搜索引擎进行搜索的次数对用户行为赋予相应权重值。对于网址规则库的表现形式,并不一定以数据库的形式出现,它可能是一个配置文件,也可能是硬编码在相关代码中。
对用户行为赋予相应权重值分析中,包含对行为发生前后的分析,对较早发生的用户行为赋予较低的权重。这里可以对所有用户行为按时间段进行划分,对不同时间段发生的用户行为赋予相应的权重值。也可以认为之前发生的用户行为的权重是当前用户行为权重的一个预置的倍数(倍数值小于1),而更早之前发生的用户行为的权重是当前用户行为权重的所述预置的倍数的平方,以此类推,越早发生的浏览过程其权重越小。当然不同时间发生的用户行为赋予相应权重值可以是本领域专业人员所熟悉别的方法。
对用户行为赋予相应权重值分析中,包含对使用非法网页的分析,将浏览非法网页的用户行为赋予较低权重值,所述的非法网页包括黄色网页或政治敏感网页。可以使用预置域名规则库,对含有符合该域名规则的网页的用户行为赋予相应的权重值;还可以使用预置关键字库:如果被分析的网址对应的网页中某一关键字符合预置关键字库并出现频率大于某一特定值,则认为是浏览了非法网页,赋予相应权重值。当然还包括其它本领域所熟知的方法来判断某一网址对应的网页是否为非法网页。这样用户在浏览非法网页的过程中所产生的网址与群组之间的关系就可以被弱化。
本发明的建立网址与群组的关系包括不同技术之间的组合处理:可以有多种技术共同得到网址与群组的相关性信息,优先的,由多种技术共同得到网址与群组的相关程度数值。所述不同技术包括:利用网址对应网页内容与群组的主题上的相关性,利用挖掘用户行为数据。当然还可以存在别的方法,每种方法都有各自的弱点与优势。可能通过以下几种组合思路,把各种生成网址与群组的技术进行组合处理,来弥补各自技术的弱点:
1)加权(Weight):加权多种技术结果。比如网页A与群组B的内容相关性为0.4,根据用户行为他的相关性为0.2,如是两种技术权重一样,则最后的相关性可以为(0.4+0.2)/2=0.3
2)混合(Mixed):同时采用多种技术给出多种群组结果为用户提供参考。比如网页A与群组B是内容上是相关的,网页A与群组C根据用户行为被证明是相关的,则浏览A网页的时候可以同时返回群组B与C。
3)变换(Switch):根据问题背景和实际情况或要求决定变换采用不同的技术。比如对于导航性的网页使用用户行为来分析与群组的相关性,对于文章性质的网页使用内容相关分析与群组的相关性。
4)特征组合(Feature combination):组合来自不同技术数据源的特征被另一种技术算法所采用。比如设立一种新的算法,把网页与群组的内容相关性数值,把网页与群组的用户行为相关性数值都作为这个新算法的输入。
5)层叠(Cascade):先用一种技术产生一种粗糙的推荐结果,第二种技术在此推荐结果的基础上进一步做出更精确的推荐。比如运用行为分析算法,得出网页A与100个群组相关,再在这100个群组里根据内容相关找出其中的10作为最后的结果。
6)特征扩充(Feature augmentation):一种技术产生附加的特征信息嵌入到另一种技术的特征输入中。
7)元级别(Meta-level):用一种方法产生的模型作为另一种方法的输入。特别的在上述的组合方法中,如果采用“混合”的思路,则客户端展现的时候可以表现出各个群组与当前网页的关系是属于哪种技术上的相关性。
如上所述的本发明提供一种返回群组的方法,包括重复网址分析:重复网址是指一些网址虽然不同,但浏览这些网址的用户都在关注同一个点。在根据网址去取群组之前,把重复的网址对应到第二网址上,进而获取第二网址对应的群组。一般来说,由于群组与网址关系信息生成系统的误差,比如在进行内容相关联分析时,同一文章的不同网页因存在背景噪音内容的干扰,得到的网页内容与群组主题的匹配度是不尽相同的;又如采用根据用户行为生成和调整网址与群组的关系信息的算法,对一个网站较短时间之前转载的文章,由于还缺乏用户行为数据,该新的网址与群组的关系信息是不准确的。通过把重复网址对应到第二网址上,就能获得更准确的群组列表。同时重复网址分析还可以用于网址与群组的关系生成和调整方法。在采用根据用户行为生成和调整网址与群组的关系的算法中,如果把这些重复的网址都对应到第二网址,则对于某组重复网址来说,其所有用户行为数据就会集中在同一个网址上,可以统计出更准确的网址与群组的关系。
在重复网址分析中,本发明可以对内容相同的网页进行分析。互联网上有很多重复内容的网页,他们有不同网址。网页内容重复网址的分析包括以下步骤:
对第一网页的网页内容进行分析,得到其特征值,保存至网页特征库中。
对第二网页的网页内容进行分析,得到其特征值,保存到网页特征库中。
如果这两个特征值达到预先设定的相似度,则认为这两个网页对应的网址是重复网址。所述特征值可以包括:正文标题用词,正文内容用词,段落数,长度以及正文词出现频率等,本发明并不对此加以限制,可以根据需要由本领域的技术人员选择即可。上述分析过程中,提取特征值的方法可以为:首先抽取网页中的内容信息(包括正文标题和正文的内容);然后提取正文的长度、段落数量等信息,接着对信息进行分词处理,统计正文中出现的词及其出现频率。对两网页分析提取特征值后,最后根据两网页上分别在提取的正文标量,正文长度,段落数量,正文词的出现频率等网页特征进行比较,如果达到预定的相似度,再认定两网页为内容重复网页,其网址为重复网址。重复网页网址除了特征比较外,还可以对页面里的rel=“canonical”属性来判断是不是重复网址。canonical tag是用于指定一个网页的标准网址,旨在改善内容重复的问题。例如,假设某个网上商店Myshop,其中某商品(id=18)的网址是:
http://myshop.com/item.php?id=18
此商品在另外一个网站(如cmarry.com)上有个广告链接,链接的网址是:
http://myshop.com/item.php?id=18&ref=cmarry.com
ref=cmarry.com表明这是来自网站cmarry.com的广告链接。此广告连接对应网页的<head>属性里就可以加上:
<link rel=″canonical″href=″http://myshop.com/item.php?id=18″/>,表示它是来自http://myshop.com/item.php?id=18的一份拷贝。tag:canonical一般用于站点内部的网址相互引用,而基本上不用于站点之间。然而,tag:canonical可能出现非正常使用,如把很多网址都指向一个内容完全不同的广告网址,所以在实际中可以将两种方法结合使用。
在重复网址分析中,本发明可以对搜索相同内容进行分析。由于用户不同的搜索引擎站点上使用搜索而产生不同的网址。比如,要查找“football”这个词的时候,如果使用google.com作为搜索引擎,它会发送一个如下的网页请求:
http://www.google.cn/search?hl=zh-CN&q=foot ball&meta=&aq=f&oq=在用baidu.com的时候会发送:
http://www.baidu.com/s?wd=football
但用户都只是在找football的信息,可以认为以上两个查询网址是重复的。对搜索的重复网址可以用网址规则分析方式,通过在客户或服务器则预置网址规则库,判定某个网址是来自某个搜索引擎网站,并解析出其中的关键字。优选的对于搜索引擎的重复网址对应的第二网址,可以把其查找的关键字视为特殊的一个网址,当然还可以把关键字变成网址的形式,比如在关键字前统一加上http://keyword/,于是上述关键字“football”就变成:http://keyword/football。现有即通信系统都支持以关键字来查找群组,而上述搜索引擎搜索网址核心就是关键字,所以现有的关键字-群组关系信息,可以与本发明所述的网址-群组关系信息以“加权”,“混合”等可能方式综合使用,返回更佳的群组结果。
在重复的网址分析中,本发明也特别针对那些因为文章字数较多而进行分页显示的网页进行分析。有别于内容(文章)重复的网页的网址,分页后的分页网址对应同一内容的不同分页部分。例如在MSN上文章“银监会主席刘明康澄清:松绑二套房贷是误读”被分成6页,有6个网址:
http://msn.ynet.com/view.jsp?oid=49244533
http://msn.ynet.com/view.jsp?oid=49244533&pageno=2
http://msn.ynet.com/view.jsp?oid=49244533&pageno=3
http://msn.ynet.com/view.jsp?oid=49244533&pageno=4
http://msn.ynet.com/view.jsp?oid=49244533&pageno=5
http://msn.ynet.com/view.jsp?oid=49244533&pageno=6
对于上面的网址,我们可以忽略pageno=?这一项。对分页网页的认定也可以通过前置网址规则库的形式进行判定,这个判定可以在客户端,也可以在服务器上进行。tag:canonical属性作为一种通用的重复网页标注标准,其实际应用中某些网站对文章分页也使用了tag:canonical。当然我们没有必要区分tag:canonical所关联的网址是分页网址还是重复网址,用户可以使用tag:canonical用来标注分页网址,但为了防止用户恶意性的标注,也可以用内容进行分析,内容不相同,但标题相同的情况我们就认为是分页网址。
总之,重复网址分析,是我们认为在用户在打开重复网址的时候关注的是同一件事情,包括不同搜索引擎上搜索相同的关键字,不同网址上浏览相同的文章,不同网址浏览的是同一文章的分页。tag:canonical一般是针对站内相同内容的不同网址的,但它可能被用在上述情况,为了防止tag:canonical被来恶意标注,我们需要做一些甄别。
如上所述的本发明提供一种返回群组的方法,返回给用户的群组信息还包括群组相关的网页。可以通过各种业务逻辑以人工方式添加的方式为群组增加其相关的网页。上述本发明的方法里所述的网址-群组的关系信息也可以起到辅助作用:比如当网址-群组的关系信息中相关程度数值小于设定值时,这个网址不能增加为这个群组所包含的网页,或当某个网址与群组关系信息中相关程度数值大于设定值时就自动增加为这个群组所相关的网页。
为了返回的群组信息还包含群组相关的网页,上述图1所示的本发明各个步骤需要做以下增强:S11步骤保持不变;S12步骤中需要包括群组相关的网址信息,当取出某个网址相关的群组列表后,要从群组相关的网址信息中取出各个群组包含的网页,然后将其传送回客户端。S13步骤要显示群组所相关的网页;S14步骤中收集用户打开了多少群组相关的网页,如数量超过设定值则认为用户参与了该群组。
如上所述的本发明提供一种返回群组的方法还可以进一步扩展:统计并展示群组与群组之间的关联性。当然群组与群组的关系也包括通过业务逻辑人工维护。优选的,包括将关联性很强的群组展现的时候放在一起,并可以将他们所相关的网页也放在一起。但只要采用了图1所示的本发明的方法并在其上面进行扩展,都属于本发明的衍生作品。
参考图3,为本发明一种即时通讯系统的结构示意图,包括以下部件:
本发明一种即时通讯系统分客户端与服务器两部分。其客户端包括网址自动获取模块S31,命令生成模块S32与群组展现模块S33。其服务器包括命令处理模块S35,并设置有网址-群组的关系信息库S36。
网址自动获取模块S31,获取用户浏览网页的网址。优选的,还可获取用户当前的在浏览网页的网址。
命令生成模块S32,发送一个包含该网址或者是指代该网址的某种编码或编号的消息,用以获取网址相关的群组。
群组展现模块S33,把返回的网址相关的群组列表展现给用户。展现内容
Figure B2009101469025D0000141
包括各群组标题、描述和在线人数等。优选的,如果返回结果还包括群组与网址的相关程度数值,各个群组可以按关程度的数值来排列,当然也可以别的显示方式来表示。
命令处理模块S35,处理从客户端接收的获取网址相关的群组的请求消息,从网址-群组的关系信息库中取出这个网址相关的群组列表,然后取出群组列表中每个群组对应相关信息,把这些信息发回客户端。
网址-群组的关系信息库S36,用于存储网址与群组的关系的信息。
所述的网址-群组关系信息库的生成可以由另外的系统来完成。优选的,所述另外的系统可以是多个系统,并包括图4所示的一种网址-群组关系信息生成系统,能根据用户行为来生成和调整网址与群组的关系。所述另外的系统还可以包含如下处理系统:利用网页内容与群组的标题、描述及交流内容上的相关性来建立网页对应网址与群组的相关性。特别是当系统刚建立时,用户行为数据比较稀疏的情况下,利用网址对应的网页内容与群组主题上的相关性来建立网页与群组的关系也是相当重要的。当然所有的这些系统也可以在本发明所述的一种即时通讯系统在相同服务器上运行。
所述的网址-群组关系信息库中的相关性信息包含一个连续的数值,数据值越大表示相关性越强。但有时并不是一个数值就可以表示相关性信息,假如网址-群组关系信息由多种方法(或系统)来生成,并通过“加权”、“混合”和“变换”的方式来融合各种方法的效果的时候,网址-群组的关系信息库里相关性信息可以包含多个数值或布尔值,每个数值或布尔表示一种方法的处理结果。当然系统中可以存在各种方法自己的处理结果信息库。总之,图3所示一种即时通讯系统包含一个网址-群组的关系信息库,从中可以找出一个网址相关的群组,优选的还可以得到他们的相关程度数值,其具体的存储与表示方式可以有所差异。
优选的,如果群组关系信息生成系统能使用用户行为信息来调整与优化网址-群组关系信息。上述即时通讯系统客户端还可能包含一个用户行为辅助收集模块S34,辅助网址-群组关系信息生成系统来得到用户行为的相关数据。具体来说,网址-群组关系信息生成系统要得到用户的如下行为数据:打开了哪些网页,这些网页何时被关闭,这些网页对用户的可见时间,还包括用户打开了哪些群组,这些群组所包含的网页有多少被打开过,用户在这些群组里停留了多少时间等。这些数据有些已经存在,比如用户打开了哪些网页,该数据已隐含在用户用网址获取相关群组的命令中,又如用户打开了哪些群组,该数据也已隐含在用户进入群组的即时通讯协议中;但有些数据则可能是不存在的,比如用户何时关闭的网页,这个时候就需要用户行为辅助收集模块取得该数据;还有一种情况是,虽然有些数据已经存在,但这些数据不易于从数据流或日志中获取,这时也可以由用户行为辅助收集模块代为收集与提交。
图3所示本发明一种即时通讯系统,在服务器中还包括重复网址的分析。所谓重复网址包括网页内容相同的不同网址,用户在不同搜索引擎网站搜索相同内容页产生的不同网址,以及一些较长的文章被分页后产生的不同网址。重复网址都可以对应到第二网址上面。对于一组重复的网址,如果上述的网址-群组的关系信息库并不是保存重复网址的相关群组,而只是保存了第二网址的相关的群组,-则上述命令处理模块S35还包括重复网址分析,得到第二网址,然后用第二网址来取出相关的群组。为了减轻服务器端的压力,重复网址分析可以全部或部分转移客户端上,比如搜索引擎会产生的大量重复网址,但网址规则库比较小且变化少,就可以转到客户端。
图3所示本发明一种即时通讯系统中,返回给用户的群组的信息还包括群组相关的网页。这时即时通讯服务器需要设有群组相关网页的信息库,上述命令处理模块S35要取出并返回群组相关的网址;上述群组展现模块S33展现的群组相关的网页信息;用户行为辅助收集模块S34包括收集用户打开了哪些群组相关的网址(这个数据会提交给根据用户行为信息来生成和调整网址-群组关系信息的系统)。
图3所示本发明一种即时通讯系统中,服务器若存在群组与群组之间的相关联信息,则处理模块S35可以取出并返回群组与群组之间的关系信息,展现模块S33展现群组与群组之间的关系信息,如关联性很高的群组放在一起,其包括的网页也可以混合在一起,这些都是发明的延伸。
参考图4,所示为本发明一种网址-群组关系信息生成系统的结构示意图。
包括以下部件:用户行为收集模块S41,从客户端到服务器的数据流或服务器系统日志中提取用户行为相关数据,然后传给网址-群组关系信息处理模块S42。收集的用户行为包括用户打开过的网页、网页从打开到关闭的时间、网页对用户的可能见时间;还包括用户向群组发送的消息数、用户向群组发送的申请加入与进入群组的协议命令,及用户从进入群组到离开群组的时间。可选的,用户行为收集模块还包括部署在客户端的辅助用户行为收集子模块。由于即时通讯系统一般的数据流或系统日志里还不存在所有上述用户行为信息所必需的原始数据,因此可以在客户端增加一个模块,帮助收集与提交更多用户数据。
在一个即时通讯系统中增加本发明所述的根据用户行为生成网址-群组关系信息的系统。如果原有系统中数据流量或日志提供格式不能满足本发明的需要,可以扩展或修改原来的消息协议与日志记录;当然也可以新增一种完全独立的消息格式或日志。总之数据流还是日志以及他们的具体格式本领域人员可以自行选择,本发明不作限制。
网址-群组关系处理模块S42,从来自S41的用户行为数据中取得用户浏览的网页与参与的群组,然后挖掘网页与群组出现的规律,得到网址与群组的对应关系。优选的,可以根据用户对网页与群组浏览的时间差和浏览的先后关系,给某次浏览中网址-群组的关联度进行定量。某次浏览中,用户浏览网址与参与群组时间差越小,则网址与群组的关联度越高。优选的,时间差大于某个值则认为没有关联。关联度与时间先后顺序也是有关系的,在某个网址之前的浏览过的群组和之后浏览过的群组相比,在之前的群组与这个网址的关联度比之后的群组与这个网址的关联度要小。
图4所示为本发明一种网址-群组的关系信息生成系统,除辅助用户行为信息收集的子模块放置在客户端外,其它模块都部署在服务器上。此网址-群组关系信息生成系统从即时通讯系统中得到用户行为数据,并为需要网址-群组的关系信息的即时通讯系统提供网址-群组的关系信息生成服务。当然本发明一种网址-群组的关系信息生成系统也可以与即时通讯系统放在相同服务器上,只要具有本发明所述的相同的功能,或具有相似单元模块,都属于本发明的保护范围。
为了保证关联性分析的准确性
Figure B2009101469025D0000171
所述一种网址-群组关系信息生成系统包括权重处理模块S43。对用户行为赋予相应权重值。所述权重值表示该用户行为在挖掘网址-群组的关系信息时,在所有被挖掘的用户行为中的重要性。
优选的,权重处理模块S43是针对浏览过程赋予的权重值。所述权重值用以表示该浏览过程在所有被分析的浏览过程中的重要性;浏览过程权重值高,其对应的在统计关联度时所占的比重也高;浏览过程权重值低,对应的统计关联度时所占比重也底。优选的,如果此浏览过程的权重值低于某个权值,则不统计该浏览过程中产生的网址与群组的关联关系。
对用户行为赋予的权重值,包括根据用户行为发生的时间先后赋予相应权重值。优选的,根据浏览过程发生的时间先后赋予相应权重值,越当前的浏览过程,权重值越高。这里可以对所有浏览过程按时间段进行划分,对不同时间段发生的浏览过程赋予相应的权重值。也可以设定之前的浏览过程权重值为当前浏览过程一个预置的倍数(倍数值为大于0,小于1的一个值)。比如当前的比重是1,之前比重是0.95,而更加之前比重是0.95*0.95以此类推越往前的比重越小。当然权重值可以叠加。
对用户行为赋予的权重值,还可以包括对使用搜索引擎搜索的用户行为赋予相应权重值。优选的,根据浏览过程是否包含使用搜索引擎搜索而赋予浏览过程相应的权重值:预置网址规则库,对符合一定规则的网址,认为使用了搜索引擎查找,赋予该的浏览过程相应的权重值。优选的还包括根据使用搜索引擎搜索的次数对浏览过程赋予相应的权重值。
对用户行为赋予的权重值,还可以包括对浏览非法网页的用户行为赋予相应权重值优选的,根据浏览过程是否包括非法网页,而赋予浏览过程相应的权重值:可以使用预置域名规则库,如果被分析的网址符合一定的域名规则,则认为是非法网页;还可以使用预置关键字库:如果被分析的网址对应的网页中某一关键字符合预置关键字库,并且出现频率大于某一特定值,则认为是非法网页。如果用户浏览的非法网页数量相对浏览所有网页数量的比重大于或等于预置的值,则赋予此浏览过程相应的权重值。
图4所示网址-群组关系信息生成系统,还包括重复网址处理模块,用来减少参与统计网址的数量,同时增强统计的效果。所述网址-群组关系处理模块在进行数据处理前,用重复网址处理模块对用户浏览的网址进行重复网址处理,将重复网址对应到第二网址(即它们的代表网址),进而可以由第二网址替代所有与第二网址网页内容相同的网址参与用户行为的分析。
图4所示网址-群组关系信息生成系统,还包括网址-群组关系库更新模块S44,用以更新即时通讯系统的网址-群组关系信息库。对于重复网址,如果所述即时通讯系统的网址-群组关系信息库保存所有重复网址与群组的关系,则根据所得到的第二网址与群组之间的关系来更新其所有的重复网址的与群组之间的关系信息。

Claims (20)

1.一种返回即时通信群组的方法,其特征在于,包括:
客户端获取用户当前浏览网页的网址,并向服务器发送携带该网址或者是指代该网址的某种编码或编号的查询请求;
服务器根据收到请求,解析出请求中携带的网址,并根据网址与群组对应关系信息获取相关群组并返回给客户端;
客户端将服务器返回的群组展现给用户。
2.根据权利要求1的方法,其特征在于,还包括:
每打开一个网页,客户端就自动获取该网页的网址,并向服务器发送携带该网址或者是指代该网址的某种编码或编号的查询请求。
3.根据权利要求1的方法,其特征在于:
所述网址与群组对应关系信息包括网址对应网页的内容与群组主题的对应关系。
4.根据权利要求1的方法,其特征在于:
所述网址与群组对应关系信息能够通过用户行为生成和调整:
获取用户浏览的网页与参与的群组,然后挖掘网页与群组出现的规律,得到网址与群组的对应关系。
5.根据权利要求4的方法,其特征在于,所述用户浏览网页包括:
如果用户浏览时间低于此设定值,则不归入用户浏览的网页。
6.根据权利要求4的方法,其特征在于,所述用户是否参与群组包括:
如果当用户在群组中发送消息超过设定值,则认为用户参与了群组。
如果当用户在群组中的停留时间超过了设定值,则认为用户参与了群组。
7.根据权利要求6的方法,其特征在于,还包括
对于不同类型的群组,所述消息数的设定值可以不同,所述群组中停留时间的设定值也可以不同。
8.根据权利要求4的方法,其特征在于,还包括:
对用户行为在生成和调整网址与群组对应关系时赋予相应的权重。
9.根据权利要求8的方法,其特征在于,还包括:
对使用互联网搜索的用户行为的分析:
预置网址规则库,如果用户浏览的网页的网址符合该预置网址规则库,赋予该用户行为相应的权重值。
10.根据权利要求8的方法,其特征在于,还包括:
还包括含有用户行为发生时间先后的分析:
根据用户行为发生的时间上的先后,赋予用户行为相应的权重值。
11.根据权利要求1的方法,其特征在于,还包括:
网页内容相同网址分析,将网页内容相同的网址对应为第二网址,进而可以获得与第二网址对应的群组。
12.根据权利要求4的方法,其特征在于,还包括:
网页内容相同网址分析,将网页内容相同的网址对应为第二网址,进而可以由第二网址代替所有与第二网址网页内容相同的网址参与用户行为的分析。
13.根据权利要求1的方法,其特征在于,还包括:
服务器在返回相关群组的同时还返回与群组相关的网页。
14.一种即时通讯系统,其特征在于,包括:
客户端和服务器,其中
客户端包括:
网址获取模块,获取用户浏览网页的网址;
命令生成模块,生成携带该网址或者是指代该网址的某种编码或编号的请求并向服务器发送;
群组展现模块,将服务器返回的群组展现给用户;
服务器包括:
网址-群组的关系信息库:用于存储网址与群组对应关系信息;
命令处理模块,根据客户端发送的网址从网址-群组的关系信息库中获得相关的群组,并将群组返回给客户端。
15.根据权利要求14的系统,其特征在于,还包括
每打开一个网页,客户端就自动获取该网页的网址,并生成携带该网址的查询请求发给服务器。
16.根据权利要求14的系统,其特征在于,
所述网址与群组对应关系信息包括网址对应网页的关键字与群组主题的对应关系。
17.根据权利要求14的系统,其特征在于,
所述网址与群组对应关系信息能够通过用户的行为生成和调整,此时网址-群组的关系信息可以由以下服务器中的模块处理:
用户行为收集模块:从日志或是客户端发到服务器的信息流中收集用户行为数据,取得用户浏览的网页与用户参与的群组的信息。
基于用户行为的网址-群组关系信息处理模块:挖掘用户行为中网页与群组出现的规律,得到网址与群组的相关性信息。
18.根据权利要求17的系统,其特征在于,服务器中还包括:
权重赋予模块,对用户行为赋予相应的权重值,所述权重表示该用户行为在所有被分析的用户行为统计中的重要性。
19.根据权利要求14的系统,其特征在于,服务器中还包括:
重复网址的分析模块:将网页内容相同的网址对应为第二网址,进而可以用来获得与该第二网址对应的群组;进而可以由这第二网址取代所有与第二网址网页内容相同的网址参与用户行为的分析。
20.根据权利要求14的系统,其特征在于,还包括:
服务器在返回相关群组的同时还返回与群组相关的网页
Figure F2009101469025C0000031
CN2009101469025A 2009-06-05 2009-06-05 根据用户浏览网页返回即时通信群组的方法与系统 Pending CN101909018A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101469025A CN101909018A (zh) 2009-06-05 2009-06-05 根据用户浏览网页返回即时通信群组的方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101469025A CN101909018A (zh) 2009-06-05 2009-06-05 根据用户浏览网页返回即时通信群组的方法与系统

Publications (1)

Publication Number Publication Date
CN101909018A true CN101909018A (zh) 2010-12-08

Family

ID=43264341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101469025A Pending CN101909018A (zh) 2009-06-05 2009-06-05 根据用户浏览网页返回即时通信群组的方法与系统

Country Status (1)

Country Link
CN (1) CN101909018A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102546469A (zh) * 2011-12-29 2012-07-04 北京百度网讯科技有限公司 一种搜索触发的即时通讯群组建立方法和装置
CN102662837A (zh) * 2012-03-29 2012-09-12 奇智软件(北京)有限公司 一种浏览器的测试方法和系统
CN102789497A (zh) * 2012-07-13 2012-11-21 北京江民新科技术有限公司 一种动态网址导航的方法
CN103077229A (zh) * 2013-01-04 2013-05-01 广东一一五科技有限公司 用户群组匹配方法及系统
CN103218561A (zh) * 2013-03-18 2013-07-24 珠海市君天电子科技有限公司 一种保护浏览器的防篡改方法和装置
CN104714889A (zh) * 2012-03-29 2015-06-17 北京奇虎科技有限公司 一种浏览器的测试方法和系统
CN105407040A (zh) * 2015-11-11 2016-03-16 掌赢信息科技(上海)有限公司 即时通讯方法及设备
CN106254220A (zh) * 2016-08-16 2016-12-21 北京小米移动软件有限公司 即时通讯群组的管理方法及装置
CN107193937A (zh) * 2011-05-09 2017-09-22 腾讯科技(深圳)有限公司 一种搜索信息的方法及信息搜索装置
CN109495373A (zh) * 2017-09-13 2019-03-19 温世文 一种根据用户浏览网页返回即时通信群组的方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1372214A (zh) * 2001-02-19 2002-10-02 意蓝科技股份有限公司 使用者行为导向的网络行销系统及其处理方法
US20050102358A1 (en) * 2003-11-10 2005-05-12 Gold Stuart A. Web page monitoring and collaboration system
CN101079066A (zh) * 2007-06-29 2007-11-28 深圳市中科新业信息科技发展有限公司 一种网络审计中的数据分析系统及其方法
CN101105795A (zh) * 2006-10-27 2008-01-16 北京搜神网络技术有限责任公司 基于网络行为的个性化推荐方法和系统
CN101217515A (zh) * 2008-01-03 2008-07-09 腾讯科技(深圳)有限公司 基于问题分类推送问题的系统及方法
CN101377833A (zh) * 2007-08-31 2009-03-04 高维海 用浏览器访问互联网的用户之间相互交流的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1372214A (zh) * 2001-02-19 2002-10-02 意蓝科技股份有限公司 使用者行为导向的网络行销系统及其处理方法
US20050102358A1 (en) * 2003-11-10 2005-05-12 Gold Stuart A. Web page monitoring and collaboration system
CN101105795A (zh) * 2006-10-27 2008-01-16 北京搜神网络技术有限责任公司 基于网络行为的个性化推荐方法和系统
CN101079066A (zh) * 2007-06-29 2007-11-28 深圳市中科新业信息科技发展有限公司 一种网络审计中的数据分析系统及其方法
CN101377833A (zh) * 2007-08-31 2009-03-04 高维海 用浏览器访问互联网的用户之间相互交流的方法
CN101217515A (zh) * 2008-01-03 2008-07-09 腾讯科技(深圳)有限公司 基于问题分类推送问题的系统及方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193937B (zh) * 2011-05-09 2021-02-05 腾讯科技(深圳)有限公司 一种搜索信息的方法及信息搜索装置
CN107193937A (zh) * 2011-05-09 2017-09-22 腾讯科技(深圳)有限公司 一种搜索信息的方法及信息搜索装置
CN102546469A (zh) * 2011-12-29 2012-07-04 北京百度网讯科技有限公司 一种搜索触发的即时通讯群组建立方法和装置
CN102546469B (zh) * 2011-12-29 2016-09-07 北京百度网讯科技有限公司 一种搜索触发的即时通讯群组建立方法和装置
CN104714889A (zh) * 2012-03-29 2015-06-17 北京奇虎科技有限公司 一种浏览器的测试方法和系统
CN102662837B (zh) * 2012-03-29 2015-04-29 北京奇虎科技有限公司 一种浏览器的测试方法和系统
CN102662837A (zh) * 2012-03-29 2012-09-12 奇智软件(北京)有限公司 一种浏览器的测试方法和系统
CN102789497A (zh) * 2012-07-13 2012-11-21 北京江民新科技术有限公司 一种动态网址导航的方法
CN103077229B (zh) * 2013-01-04 2016-04-06 广东一一五科技有限公司 用户群组匹配方法及系统
CN103077229A (zh) * 2013-01-04 2013-05-01 广东一一五科技有限公司 用户群组匹配方法及系统
CN103218561A (zh) * 2013-03-18 2013-07-24 珠海市君天电子科技有限公司 一种保护浏览器的防篡改方法和装置
CN105407040A (zh) * 2015-11-11 2016-03-16 掌赢信息科技(上海)有限公司 即时通讯方法及设备
CN106254220A (zh) * 2016-08-16 2016-12-21 北京小米移动软件有限公司 即时通讯群组的管理方法及装置
CN106254220B (zh) * 2016-08-16 2019-06-04 北京小米移动软件有限公司 即时通讯群组的管理方法及装置
CN109495373A (zh) * 2017-09-13 2019-03-19 温世文 一种根据用户浏览网页返回即时通信群组的方法及系统

Similar Documents

Publication Publication Date Title
CN101909018A (zh) 根据用户浏览网页返回即时通信群组的方法与系统
CN103577416B (zh) 扩展查询方法及系统
CN103118111B (zh) 一种基于多个数据交互中心的数据进行信息推送的方法
US20130013616A1 (en) Systems and Methods for Natural Language Searching of Structured Data
US20090276729A1 (en) Adaptive user feedback window
CN105930469A (zh) 基于Hadoop的个性化旅游推荐系统及方法
CN104885081A (zh) 搜索系统和相应方法
CN102999560A (zh) 用社交网络特征提高姓名和其它搜索查询的搜索引擎结果页面的相关性
CN102073699A (zh) 用于基于用户行为来改善搜索结果的方法、装置和设备
CN104899315A (zh) 推送用户信息的方法和装置
CN105045864B (zh) 一种数字化资源个性化推荐方法
CN113297457B (zh) 一种高精准性的信息资源智能推送系统及推送方法
CN104050243B (zh) 一种将搜索与社交相结合的网络搜索方法及其系统
CN101661490B (zh) 搜索引擎、其客户端及搜索网页的方法
JP5552582B2 (ja) コンテンツ検索装置
CN103262079B (zh) 检索装置及检索方法
CN102063454A (zh) 一种搜索与应用相结合的方法和设备
CN104572719A (zh) 信息收集方法及装置
KR101140724B1 (ko) 개념 네트워크 기반 사용자 프로파일 구성 방법 및 시스템과 이를 이용한 개인화 질의 확장 시스템
Nawazish et al. Integrating “Random Forest” with Indexing and Query Processing for Personalized Search
CN103312584A (zh) 一种在网络社区中发布信息的方法与设备
KR101180371B1 (ko) 폭소노미 기반 개인화 웹 검색 방법 및 이를 수행하는 시스템
WO2008032037A1 (en) Method and system for filtering and searching data using word frequencies
Pradana et al. An Android-based Hoax Detection for Social Media
KR20130023977A (ko) 시간 정보를 활용한 블로그 카테고리 분류 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
DD01 Delivery of document by public notice

Addressee: Pan Xiaofeng

Document name: Notification of Publication of the Application for Invention

DD01 Delivery of document by public notice

Addressee: Pan Xiaofeng

Document name: Notification of before Expiration of Request of Examination as to Substance

C10 Entry into substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: 102208, Beijing, Changping, Longhua, Huilongguan Park, 16 East Building, unit 1, 201

Applicant after: Pan Xiaofeng

Address before: 100220, Beijing, Changping District, Huilongguan, four Yue long zone 10, building 1, unit 102

Applicant before: Pan Xiaofeng

SE01 Entry into force of request for substantive examination
DD01 Delivery of document by public notice

Addressee: Pan Xiaofeng

Document name: Notification of Patent Invention Entering into Substantive Examination Stage

Addressee: Pan Xiaofeng

Document name: Notification of Passing Examination on Formalities

DD01 Delivery of document by public notice

Addressee: Pan Xiaofeng

Document name: the First Notification of an Office Action

DD01 Delivery of document by public notice
DD01 Delivery of document by public notice

Addressee: Pan Xiaofeng

Document name: Notification that Application Deemed to be Withdrawn

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20101208