CN102088419B - 一种在社交网络中查找好友信息的方法和系统 - Google Patents
一种在社交网络中查找好友信息的方法和系统 Download PDFInfo
- Publication number
- CN102088419B CN102088419B CN2009102417776A CN200910241777A CN102088419B CN 102088419 B CN102088419 B CN 102088419B CN 2009102417776 A CN2009102417776 A CN 2009102417776A CN 200910241777 A CN200910241777 A CN 200910241777A CN 102088419 B CN102088419 B CN 102088419B
- Authority
- CN
- China
- Prior art keywords
- content
- module
- message
- page
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Abstract
本发明公开了一种在社交网络中查找好友信息的方法和系统,消息抓取模块获得好友产生的消息记录并存储,用户输入登录信息给主控模块,并将浏览的页面发送给主控模块,主控模块根据页面获取关键词列表,并将用户的登录信息和关键词列表发送给好友优选模块,好友优选模块根据用户的登录信息和关键词列表检索相关消息记录,并对消息记录进行评分,再汇总每个好友的分值并排序,选择分值最高的好友信息,发送给主控模块,主控模块将好友信息返回给客户端,用户可以选择好友进行互动。采用了本发明的技术方案,能够让用户在浏览感兴趣的页面或窗体内容时,找到与自己同样对页面内容感兴趣的好友进行互动。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种在社交网络中查找好友信息的方法和系统。
背景技术
在浏览页面时,浏览者有和可能感兴趣的好友进行分享、交流或互动的需求,现有的系统或方法均不能满足快速有效方便地找到对同一内容对象的需要,具体表现在:
一般来说,每人有许多好友,好友自己或在与别人交流时有大量的消息更新,以不同的形式(如短信,即时通信工具,网络空间)分布在不同的存储空间(如本地即时通信消息历史、博客、社交网站和微博等),个人无法关注和了解全部好友的最近的全部信息,因此在觉得当前页面可能有用的情况下,要找到在关注或对此内容感兴趣的好友是非常不方便的,需要花费大量的时间来查找多人的消息记录。
发明内容
本发明的目的在于提出一种在社交网络中查找好友信息的方法和系统,能够让用户在浏览感兴趣的页面内容时,找到与自己同样对页面内容感兴趣的好友进行互动。
为达此目的,本发明采用以下技术方案:
一种在社交网络中查找好友信息的方法,包括以下步骤:
A、消息抓取模块根据用户登记的好友信息从好友消息数据源获得好友产生的消息记录,并以消息记录文件方式存储在消息存储模块中;
B、用户通过客户端输入登录信息给主控模块,并将浏览的页面的地址、页面内容或者页面的选取内容发送给主控模块;
C、主控模块根据浏览的页面的地址、页面内容或者页面的选取内容获取关键词列表;
D、主控模块将用户的登录信息和关键词列表发送给好友优选模块,好友优选模块再将用户的登录信息和关键词列表转发给消息查询模块,消息查询模块根据用户的登录信息和关键词列表检索符合的消息记录,并返回给好友优选模块;
E、好友优选模块对检索出来的所有消息记录的相关度进行评分,并汇总每个好友的分值,进行排序;
F、好友优选模块选择预设数量的分值最高的好友信息,发送给主控模块;
G、主控模块将好友信息返回给客户端,用户根据好友信息选择好友进行互动。
步骤F中,好友优选模块还通过消息查询模块从消息存储模块获取每个所述好友的预设数量的相关度分值最高的消息记录,发送给主控模块;
步骤G中,主控模块将所述预设数量的相关度分值最高的消息记录与对应的好友信息一起返回给客户端,用户根据好友信息和消息记录选择好友进行互动。
步骤A还包括以下步骤:
消息索引模块根据切词词典对消息记录文件建立消息记录到对应词的映射表和词到对应消息记录的映射表,并以消息索引文件方式存储在消息索引模块中;
步骤D中,消息查询模块根据用户的登录信息和关键词列表从消息索引文件中的词到对应消息记录的映射表检索符合的消息记录;
步骤E中,好友优选模块根据消息索引文件中的消息记录到对应词的映射 表对所有检索到的消息记录的相关度进行评分。
步骤C中,如果主控模块从客户端获得的是页面的地址,则主控模块通过以下步骤获取关键词列表:
C1、内容抓取模块遍历页面,从中抓取内容,并以内容文档文件方式存储在内容存储模块中;
C2、内容关键词分析模块对每个内容文档中的所有词进行评分,并进行排序,选择预设数量的分值最高的词作为内容文档的关键词列表进行存储;
C3、主控模块根据页面的地址获取所述页面的内容对应的关键词列表。
步骤C1还包括以下步骤:
内容索引模块根据切词词典对内容文档进行切词,给每个词赋予编号,从而获得内容文档到词编号的映射表,并以内容索引文件方式存储;
内容索引模块建立内容统计信息表,记录内容文档中每个词在不同字段中出现的频次;
步骤C2中,内容关键词分析模块根据内容文档到词编号的映射表和内容统计信息表,对每个内容文档中的所有词进行评分,并进行排序,选择预设数量的分值最高的词作为内容文档的关键词列表,存储到内容查询模块;
步骤C3中,主控模块将页面的地址发送给内容查询模块,内容查询模块获取所述页面的内容对应的关键词列表,并返回给主控模块。
内容关键词分析模块对每个内容文档中的所有词进行评分包括以下步骤:
对内容文档的不同字段设置不同的位置权重系数,对不同的词频设置不同的词频权重系数,对内容文档中的每个词根据其所在的字段和词频计算出每个词的总分值。
如果内容关键词分析模块在内容文档中找到一个词出现在关键词字段,则将所述词作为所述内容文档的关键词。
步骤C中,如果主控模块从客户端获得的是页面的地址,则主控模块通过 以下步骤获取关键词列表:
主控模块向客户端发出获取关键词列表的请求,用户通过客户端输入所述页面的关键词列表,并发送给主控模块。
步骤C中,如果主控模块从客户端获得的是页面内容或者页面的选取内容,则主控模块通过以下步骤获取关键词列表:
主控模块将页面内容或者页面的选取内容发送给内容查询模块,内容查询模块将页面内容或者页面的选取内容转发给内容索引模块;
内容索引模块根据切词词典对页面内容或者页面选取内容进行切词,给每个词赋予编号,建立页面内容或者页面选取内容到词编号的映射表;
内容关键词分析模块根据页面内容或者页面选取内容到词编号的映射表,对页面内容或者页面选取内容中的所有词根据出现的字段和词频进行评分,并进行排序,选择预设数量的分值最高的词作为页面选取内容的关键词列表,发送给内容查询模块;
主控模块从内容查询模块获取页面内容或者页面选取内容的关键词列表。
步骤D中,还包括以下步骤:
用户或者主控模块对关键词列表中的关键词之间增加运算符,形成关键词搜索匹配规则,再发送给好友优选模块。
步骤A中,好友消息数据源包括用户客户端本地存储的用户与好友通信的历史消息记录、社交网络中存储的用户与好友通信的历史消息记录、社交网络中好友产生的可查看或可搜索的消息,以及存储在消息中转模块上的用户与好友通过移动通信设备通信的历史消息记录,消息记录包括消息记录编号、接收者帐号、发送者帐号、消息收发时间和消息文字。
步骤E中,好友优选模块采用以下公式对消息记录的相关度进行评分:
单个消息记录的分数=消息记录所属的时间区间权重*好友联系频次区间权重*∑(第i个关键词的顺序权重*第i个关键词在整个消息中出现的频次区 间权重)。
一种在社交网络中查找好友信息的系统,包括客户端、互动管理模块、主控模块、用户和好友信息管理模块、内容查询模块、内容关键词分析模块、内容索引模块、内容存储模块、内容抓取模块、好友优选模块、消息查询模块、消息索引模块、消息存储模块、消息抓取模块和消息中转模块,其中,
客户端与互动管理模块连接,用于通过互动管理模块提供的统一接口与好友进行互动;
客户端与主控模块连接,用于向主控模块提供好友信息、登录信息和浏览的页面的地址、页面内容、页面的选取内容或者关键词,并从主控模块接收选择后的好友信息;
主控模块与用户和好友信息管理模块连接,用于将客户端提供的用户信息和好友信息发送到用户和好友信息管理模块进行存储;
主控模块与内容查询模块连接,用于向内容查询模块发送用户浏览的页面的地址、页面内容或者页面的选取内容,并从内容查询模块获取页面、页面内容或者页面的选取内容对应的关键词列表;
内容索引模块分别与内容查询模块和内容存储模块连接,用于从内容查询模块获取页面内容或者页面的选取内容,建立页面内容、页面选取内容到词编号的映射表,从内容存储模块获取内容文档文件,建立内容文档到词编号的映射表和内容统计信息表;
内容关键词分析模块与内容索引模块连接,用于从内容索引模块获取内容文档到词编号的映射表和内容统计信息表,或者页面内容、页面选取内容到词编号的映射表,并对词进行评分,获得页面、页面内容或者页面的选取内容对应的关键词列表;
内容关键词分析模块与内容查询模块连接,用于将页面、页面内容或者页面的选取内容对应的关键词列表发送给内容查询模块;
内容存储模块与内容抓取模块连接,用于存储内容抓取模块从页面中抓取的内容;
主控模块与好友优选模块连接,用于向好友优选模块发送用户登录信息和关键词列表,并从好友优选模块获取好友信息和消息记录;
好友优选模块与消息查询模块连接,用于向消息查询模块发送用户登录信息和关键词列表,并从消息查询模块获取消息记录,进行消息记录的评分和好友排序;
消息查询模块分别与消息索引模块和消息存储模块连接,用于从消息索引模块检索出消息记录,并从消息存储模块获取消息记录;
消息索引模块与消息存储模块连接,用于从消息存储模块获取消息记录文件,并建立消息索引文件;
消息存储模块与消息抓取模块连接,用于从消息抓取模块获取消息记录;
消息抓取模块分别与用户和好友信息管理模块、客户端、社交网络和消息中转模块连接,用于从用户和好友信息管理模块获取用户和好友信息,并根据用户和好友信息获取用户客户端本地存储的用户与好友通信的历史消息记录、社交网络中存储的用户与好友通信的历史消息记录和好友产生的可查看或可搜索的消息,以及存储在消息中转模块上的用户与好友通过移动通信设备通信的历史消息记录。
采用了本发明的技术方案,能够就页面的内容,分析出关键词,能够从多种渠道收集和分析社交网络中好友的最新和以往消息记录,根据关键词和好友消息的匹配优选方法分析出感兴趣的好友,将感兴趣的好友排名靠前,让对同一事物感兴趣的用户和好友们通过统一接口进行互动。
附图说明
图1是本发明具体实施方式中查找好友信息系统的结构示意图。
图2是本发明具体实施方式中查找好友信息的流程图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
图1是本发明具体实施方式中查找好友信息系统的结构示意图。如图1所示,该系统包括客户端101、互动管理模块102、主控模块103、用户和好友信息管理模块104、内容查询模块105、内容关键词分析模块106、内容索引模块107、内容存储模块108、内容抓取模块109、好友优选模块110、消息查询模块111、消息索引模块112、消息存储模块113、消息抓取模块114和消息中转模块115。
客户端与互动管理模块连接,通过互动管理模块提供的统一接口与好友进行互动。
客户端与主控模块连接,向主控模块提供好友信息、登录信息和浏览的页面的地址、页面内容、页面的选取内容或者关键词,并从主控模块接收选择后的好友信息。
主控模块与用户和好友信息管理模块连接,将客户端提供的用户信息和好友信息发送到用户和好友信息管理模块进行存储。
主控模块与内容查询模块连接,向内容查询模块发送用户浏览的页面的地址、页面内容或者页面的选取内容,并从内容查询模块获取页面、页面内容或者页面的选取内容对应的关键词列表。
内容索引模块分别与内容查询模块和内容存储模块连接,从内容查询模块获取页面内容或者页面的选取内容,建立页面内容、页面选取内容到词编号的映射表,从内容存储模块获取内容文档文件,建立内容文档到词编号的映射表和内容统计信息表。
内容关键词分析模块与内容索引模块连接,从内容索引模块获取内容文档到词编号的映射表和内容统计信息表,或者页面内容、页面选取内容到词编号的映射表,并对词进行评分,获得页面、页面内容或者页面的选取内容对应的关键词列表。
内容关键词分析模块与内容查询模块连接,将页面、页面内容或者页面的选取内容对应的关键词列表发送给内容查询模块。
内容存储模块与内容抓取模块连接,存储内容抓取模块从页面中抓取的内容。
主控模块与好友优选模块连接,向好友优选模块发送用户登录信息和关键词列表,并从好友优选模块获取好友信息和消息记录。
好友优选模块与消息查询模块连接,向消息查询模块发送用户登录信息和关键词列表,并从消息查询模块获取消息记录,进行消息记录的评分和好友排序。
消息查询模块分别与消息索引模块和消息存储模块连接,从消息索引模块检索出消息记录,并从消息存储模块获取消息记录。
消息索引模块与消息存储模块连接,从消息存储模块获取消息记录文件,并建立消息索引文件。
消息存储模块与消息抓取模块连接,从消息抓取模块获取消息记录。
消息抓取模块分别与用户和好友信息管理模块、客户端、社交网络和消息中转模块连接,从用户和好友信息管理模块获取用户和好友信息,并根据用户和好友信息获取用户客户端本地存储的用户与好友通信的历史消息记录、社交网络中存储的用户与好友通信的历史消息记录和好友产生的可查看或可搜索的消息,以及存储在消息中转模块上的用户与好友通过移动通信设备通信的历史消息记录。
上述客户端和各种模块可以是通过网络连接的两个程序或系统,也可以是 同一个程序的两个部分或运行在同一台计算设备上的两个或多个程序。
图2是本发明具体实施方式中进行即时通信的流程图。如图2所示,进行即时通信的流程包括以下步骤:
步骤201、用户客户端将好友信息通过主控模块登记到用户和好友信息管理模块。
消息抓取模块根据用户和好友信息管理模块中用户登记的好友信息从好友消息数据源获得好友产生的消息记录,并以消息记录文件方式存储在消息存储模块中。
好友消息数据源包括用户客户端本地存储的用户与好友通信的历史消息记录、社交网络中存储的用户与好友通信的历史消息记录(比如QQ、MSN、开心网等社交网站)、社交网络(比如博客和微博)中好友产生的可查看或可搜索的消息,以及存储在消息中转模块上的用户与好友通过移动通信设备通信的历史消息记录,消息记录包括消息记录编号、接收者帐号、发送者帐号、消息收发时间和消息文字。
对于这三种好友消息数据源采取不同的方式获取消息记录。
从用户客户端中抓取消息记录是从用户的本地计算机的好友通信工具(如即时通信工具)的消息历史记录中抓取数据,发送给本地计算机中的消息抓取模块;或者在用户允许的情况下,在用户的本地计算机安装消息抓取模块,并将消息记录传送到远程网络的消息抓取模块。
从社交网络抓取消息记录是根据用户登记的好友信息,从多种渠道(如微博、博客、社交网站等)收集社交网络的消息,可以以网络爬虫的方式抓取,也可以利用编程接口的形式从内容源网站获取,也可以由社交网络向消息抓取模块提交数据。
移动设备一般是通过消息中转模块进行会话通信,消息在消息中转模块存有记录,消息抓取模块则从会话记录文件中直接获取消息记录;或者在用户允 许的情况下,消息抓取模块从消息传递与存储设备(如移动通信网关)中获取会话消息历史记录;或者在有计算能力的移动设备上安装消息抓取模块,并将消息记录传送到远程网络的消息抓取模块。
步骤202、消息索引模块根据切词词典对消息记录文件建立消息记录到对应词的映射表和词到对应消息记录的映射表,并以消息索引文件方式存储在消息索引模块中。
消息索引模块在建立映射表的同时也建立消息记录统计信息表,如在每个时间区间消息记录收发的频次,消息记录中使用正面词汇和反面词汇的情况等。
其中消息记录到对应词的映射表的数据结构如表1所示。
表1
字段名称 | 长度 | 备注 |
好友标识 | 8bytes | 唯一标识好友的编号 |
消息记录编号 | 8bytes | 唯一标识消息记录的编号 |
词数目 | 8bytes | 词的个数 |
数组:词编号和位置列表 | 8bytes*N | 位置是指词在消息词列表中 的顺序号。 |
词到对应消息记录的映射表的数据结构如表2所示。
表2
字段名称 | 长度 |
词数目 | 8bytes |
词1…N | |
词编号 | 8bytes |
消息记录数目 | 8bytes |
数组:消息记录编号及词在消息中 的位置列表 | 8bytes*N |
步骤203、用户通过客户端输入登录信息给主控模块,并将浏览的页面的 地址、页面内容或者页面的选取内容发送给主控模块。
客户端可以是网络浏览器或其它展示页面的程序(如文字处理软件)、或者网页或窗体的包含嵌入式界面元素的程序、浏览器或其他软件的插件或扩展的形式、包含浮动式或弹出式页面或窗体元素的程序、移动终端的程序或者其他程序。
浏览的页面是指包含文字等内容的数据集合,可以是网页,可以是窗体,也可以是其它形式(如文字处理软件中的页面)。
页面的地址可以是网页的地址或页面的惟一标识。
页面内容是用户浏览页面的全部内容。
页面的选取内容是用户在浏览的页面中选取的部分内容。
步骤204、主控模块根据浏览的页面的地址、页面内容或者页面的选取内容获取关键词列表。
如果主控模块从客户端获得的是页面的地址,则主控模块通过以下步骤获取关键词列表:
首先,内容抓取模块遍历页面,从中抓取内容,并以内容文档文件方式存储在内容存储模块中,内容索引模块根据切词词典对内容文档进行切词,给每个词赋予编号,从而获得内容文档到词编号的映射表,并以内容索引文件方式存储。内容索引模块同时建立内容统计信息表,记录内容文档中每个词在不同字段中出现的频次。
其中内容文档到词编号的映射表的数据结构如表3所示。
表3
字段名称 | 长度 | 备注 |
文档编号 | 8bytes | 唯一标识文档的编号 |
词数目 | 8bytes | 词的个数 |
数组:词编 号和位置 | 8bytes*N | 位置信息包括在哪个字段(如标题,首 句,关键词列表,正文)。如果出现多次, 则用位置列表表示。 |
其次,内容关键词分析模块根据内容文档到词编号的映射表和内容统计信息表,对每个内容文档中的所有词进行评分,并进行排序,选择预设数量(比如3个)的分值最高的词作为内容文档的关键词列表,存储到内容查询模块。
内容关键词分析模块对每个内容文档中的所有词进行评分是对内容文档的不同字段设置不同的位置权重系数,对不同的词频设置不同的词频权重系数,对内容文档中的每个词根据其所在的字段和词频计算出每个词的总分值,可以是分值之和,也可以是分值的加权平均等。
例如,位置字段的权重系数为:
关键词:9
标题:0.8
摘要:0.6
首句:0.5
正文:0.2
词频区间的权重系数为:
词频>10:0.8
词频5-10:0.7
词频3-5:0.6
词频1-2:0.5
如果内容关键词分析模块找到内容文档中的一个词出现在关键词字段,则将所述词作为该内容文档的关键词。例如在新闻中出现的“关键词:iphone手机双模”,或博客中的“标签:iphone手机双模”。
最后,主控模块将页面的地址发送给内容查询模块,内容查询模块获取页面的内容对应的关键词列表,并返回给主控模块。
有一种特殊情况,当用户通过客户端浏览页面时,主控模块可以向客户端 发出获取关键词列表的请求,比如弹出一个输入框,用户通过客户端输入页面的关键词列表,并发送给主控模块。
如果主控模块从客户端获得的是页面内容或者页面的选取内容,则主控模块通过以下步骤获取关键词列表:
主控模块将页面内容或者页面的选取内容发送给内容查询模块,内容查询模块将页面内容或者页面的选取内容转发给内容索引模块。
内容索引模块根据切词词典对页面内容或者页面选取内容进行切词,给每个词赋予编号,从而获得页面内容或者页面选取内容到词编号的映射表。
内容关键词分析模块根据页面内容或者页面选取内容到词编号的映射表,对页面内容或者页面选取内容中的所有词根据出现的词频进行评分,并进行排序,选择预设数量的分值最高的词作为页面选取内容的关键词列表,发送给内容查询模块。
主控模块从内容查询模块获取页面内容或者页面选取内容的关键词列表。
对于上述三种方式获得的关键词词表,用户或者主控模块对关键词列表中的关键词之间增加运算符,形成关键词搜索规则,再发送给好友优选模块。
搜索多个关键词通常按照“并”运算进行,也可以按自定义的匹配规则进行,如关键词1 AND关键词2 OR关键词3,表示取关键词1和关键词2结果的并集,再把并集结果和关键词3的结果进行或集运算。
系统可以自动生成匹配规则,也可以人工指定匹配规则,也可以由系统自动生成和人工指定相结合的方式产生匹配规则。
例如:经常需要进行“非”运算的规则有:根据国家政策法规定义的屏蔽词,网站黑名单等;经常需要进行“或”运算的规则有:同义词的匹配规则。
步骤205、主控模块将用户的登录信息和关键词列表发送给好友优选模块,好友优选模块再将用户的登录信息和关键词列表转发给消息查询模块,消息查询模块根据用户的登录信息和关键词列表从消息索引文件中的词到对应 消息记录的映射表检索符合的消息记录,并返回给好友优选模块。
步骤206、好友优选模块根据消息索引文件中的消息记录到对应词的映射表对所有消息记录的相关度进行评分,并汇总每个好友的分值,进行排序。基本的评分规则是离当前时间越近的分数越高,按联系频次越高的分数越高,包含关键词列表中越靠前的关键词和出现频次越高的关键词的消息的分数越高,这些因素综合计分得到单个消息记录的分数。
好友优选模块可以采用以下公式对消息记录的相关度进行评分:
单个消息记录的分数=消息记录所属的时间区间权重*好友联系频次区间权重*∑(第i个关键词的顺序权重*第i个关键词在整个消息中出现的频次区间权重)。
说明:
1、消息记录所属的时间区间是指根据消息产生的时间和当前时间的差计算它落在哪个时间区间(如最近5分钟,30分钟,5小时,2天,30天等),按时间区间的远近赋于不同的权重,离当前时间越近的权重越大。
2、好友联系频率为消息统计信息的一部分,为在该时间区间内消息记录的频次,包括不匹配关键字的消息记录的计数,也包括各个消息传送渠道的消息记录计数。该权重系数的设置方法为频次越大,权重越高。如频次大于50,权重设为1,频次20-50的权重设为0.8,以此类推。
3、第i个关键词是内容的关键词列表中第i个关键词,i指列表中的顺序号。不同顺序号的关键词对应不同的权重系数,如第1个关键词的权重系数设为0.6,第2个关键词的权重设为0.3,第3个关键词的权重设为0.1。
4、第i个关键词的频次区间权重,如关键词出现大于5次,则权重设为0.9,3-5次,权重则为0.7,以此类推。
5、如果关键词列表中有N个关键词,则汇总N个关键词在消息中的顺序权重*频次区间权重得分
6、本公式为基本打分方法,在实际使用过程中可以加入其他参数或计分方法。
步骤207、好友优选模块选择预设数量(比如3个)的分值最高的好友信息和通过消息查询模块从消息存储模块获取每个好友的预设数量的(比如一条)相关度分值最高的消息记录,发送给主控模块。
步骤208、主控模块将获得的好友信息和每个好友信息对应的一条相关度最高的消息记录返回给客户端,用户根据好友信息和消息记录选择好友,通过互动管理模块提供的统一接口与好友进行互动,比如会话、游戏等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (13)
1.一种在社交网络中查找好友信息的方法,其特征在于,包括以下步骤:
A、消息抓取模块根据用户登记的好友信息从好友消息数据源获得好友产生的消息记录,并以消息记录文件方式存储在消息存储模块中;
B、用户通过客户端输入登录信息给主控模块,并将浏览的页面的地址、页面内容或者页面的选取内容发送给主控模块;
C、主控模块根据浏览的页面的地址、页面内容或者页面的选取内容获取关键词列表;
D、主控模块将用户的登录信息和关键词列表发送给好友优选模块,好友优选模块再将用户的登录信息和关键词列表转发给消息查询模块,消息查询模块根据用户的登录信息和关键词列表检索符合的消息记录,并返回给好友优选模块;
E、好友优选模块对检索出来的所有消息记录的相关度进行评分,并汇总每个好友的分值,进行排序;
F、好友优选模块选择预设数量的分值最高的好友信息,发送给主控模块;
G、主控模块将好友信息返回给客户端,用户根据好友信息选择好友进行互动。
2.根据权利要求1所述的一种在社交网络中查找好友信息的方法,其特征在于,步骤F中,好友优选模块还通过消息查询模块从消息存储模块获取每个所述好友的预设数量的相关度分值最高的消息记录,发送给主控模块;
步骤G中,主控模块将所述预设数量的相关度分值最高的消息记录与对应的好友信息一起返回给客户端,用户根据好友信息和消息记录选择好友进行互动。
3.根据权利要求1所述的一种在社交网络中查找好友信息的方法,其特征在于,步骤A还包括以下步骤:
消息索引模块根据切词词典对消息记录文件建立消息记录到对应词的映射表和词到对应消息记录的映射表,并以消息索引文件方式存储在消息索引模块中;
步骤D中,消息查询模块根据用户的登录信息和关键词列表从消息索引文件中的词到对应消息记录的映射表检索符合的消息记录;
步骤E中,好友优选模块根据消息索引文件中的消息记录到对应词的映射表对所有检索到的消息记录的相关度进行评分。
4.根据权利要求1或者2所述的一种在社交网络中查找好友信息的方法,其特征在于,步骤C中,如果主控模块从客户端获得的是页面的地址,则主控模块通过以下步骤获取关键词列表:
C1、内容抓取模块遍历页面,从中抓取内容,并以内容文档文件方式存储在内容存储模块中;
C2、内容关键词分析模块对每个内容文档中的所有词进行评分,并进行排序,选择预设数量的分值最高的词作为内容文档的关键词列表进行存储;
C3、主控模块根据页面的地址获取所述页面的内容对应的关键词列表。
5.根据权利要求4所述的一种在社交网络中查找好友信息的方法,其特征在于,步骤C1还包括以下步骤:
内容索引模块根据切词词典对内容文档进行切词,给每个词赋予编号,从而获得内容文档到词编号的映射表,并以内容索引文件方式存储;
内容索引模块建立内容统计信息表,记录内容文档中每个词在不同字段中出现的频次;
步骤C2中,内容关键词分析模块根据内容文档到词编号的映射表和内容统计信息表,对每个内容文档中的所有词进行评分,并进行排序,选择预设数量的分值最高的词作为内容文档的关键词列表,存储到内容查询模块;
步骤C3中,主控模块将页面的地址发送给内容查询模块,内容查询模块获取所述页面的内容对应的关键词列表,并返回给主控模块。
6.根据权利要求5所述的一种在社交网络中查找好友信息的方法,其特征在于,内容关键词分析模块对每个内容文档中的所有词进行评分包括以下步骤:
对内容文档的不同字段设置不同的位置权重系数,对不同的词频设置不同的词频权重系数,对内容文档中的每个词根据其所在的字段和词频计算出每个词的总分值。
7.根据权利要求5所述的一种在社交网络中查找好友信息的方法,其特征在于,如果内容关键词分析模块在内容文档中找到一个词出现在关键词字段,则将所述词作为所述内容文档的关键词。
8.根据权利要求1或者2所述的一种在社交网络中查找好友信息的方法,其特征在于,步骤C中,如果主控模块从客户端获得的是页面的地址,则主控模块通过以下步骤获取关键词列表:
主控模块向客户端发出获取关键词列表的请求,用户通过客户端输入所述页面的关键词列表,并发送给主控模块。
9.根据权利要求1或者2所述的一种在社交网络中查找好友信息的方法,其特征在于,步骤C中,如果主控模块从客户端获得的是页面内容或者页面的选取内容,则主控模块通过以下步骤获取关键词列表:
主控模块将页面内容或者页面的选取内容发送给内容查询模块,内容查询模块将页面内容或者页面的选取内容转发给内容索引模块;
内容索引模块根据切词词典对页面内容或者页面选取内容进行切词,给每个词赋予编号,建立页面内容或者页面选取内容到词编号的映射表;
内容关键词分析模块根据页面内容或者页面选取内容到词编号的映射表,对页面内容或者页面选取内容中的所有词根据出现的字段和词频进行评分,并进行排序,选择预设数量的分值最高的词作为页面选取内容的关键词列表,发送给内容查询模块;
主控模块从内容查询模块获取页面内容或者页面选取内容的关键词列表。
10.根据权利要求1所述的一种在社交网络中查找好友信息的方法,其特征在于,步骤D中,还包括以下步骤:
用户或者主控模块对关键词列表中的关键词之间增加运算符,形成关键词搜索匹配规则,再发送给好友优选模块。
11.根据权利要求1所述的一种在社交网络中查找好友信息的方法,其特征在于,步骤A中,好友消息数据源包括用户客户端本地存储的用户与好友通信的历史消息记录、社交网络中存储的用户与好友通信的历史消息记录、社交网络中好友产生的可查看或可搜索的消息,以及存储在消息中转模块上的用户与好友通过移动通信设备通信的历史消息记录,消息记录包括消息记录编号、接收者帐号、发送者帐号、消息收发时间和消息文字。
12.根据权利要求1或者3所述的一种在社交网络中查找好友信息的方法,其特征在于,步骤E中,好友优选模块采用以下公式对消息记录的相关度进行评分:
单个消息记录的分数=消息记录所属的时间区间权重*好友联系频次区间权重*∑(第i个关键词的顺序权重*第i个关键词在整个消息中出现的频次区间权重)。
13.一种在社交网络中查找好友信息的系统,其特征在于,包括客户端、互动管理模块、主控模块、用户和好友信息管理模块、内容查询模块、内容关键词分析模块、内容索引模块、内容存储模块、内容抓取模块、好友优选模块、消息查询模块、消息索引模块、消息存储模块、消息抓取模块和消息中转模块,其中,
客户端与互动管理模块连接,用于通过互动管理模块提供的统一接口与好友进行互动;
客户端与主控模块连接,用于向主控模块提供好友信息、登录信息和浏览的页面的地址、页面内容、页面的选取内容或者关键词,并从主控模块接收选择后的好友信息;
主控模块与用户和好友信息管理模块连接,用于将客户端提供的用户信息和好友信息发送到用户和好友信息管理模块进行存储;
主控模块与内容查询模块连接,用于向内容查询模块发送用户浏览的页面的地址、页面内容或者页面的选取内容,并从内容查询模块获取页面、页面内容或者页面的选取内容对应的关键词列表;
内容索引模块分别与内容查询模块和内容存储模块连接,用于从内容查询模块获取页面内容或者页面的选取内容,建立页面内容、页面选取内容到词编号的映射表,从内容存储模块获取内容文档文件,建立内容文档到词编号的映射表和内容统计信息表;
内容关键词分析模块与内容索引模块连接,用于从内容索引模块获取内容文档到词编号的映射表和内容统计信息表,或者页面内容、页面选取内容到词编号的映射表,并对词进行评分,获得页面、页面内容或者页面的选取内容对应的关键词列表;
内容关键词分析模块与内容查询模块连接,用于将页面、页面内容或者页面的选取内容对应的关键词列表发送给内容查询模块;
内容存储模块与内容抓取模块连接,用于存储内容抓取模块从页面中抓取的内容;
主控模块与好友优选模块连接,用于向好友优选模块发送用户登录信息和关键词列表,并从好友优选模块获取好友信息和消息记录;
好友优选模块与消息查询模块连接,用于向消息查询模块发送用户登录信息和关键词列表,并从消息查询模块获取消息记录,进行消息记录的评分和好友排序;
消息查询模块分别与消息索引模块和消息存储模块连接,用于从消息索引模块检索出消息记录,并从消息存储模块获取消息记录;
消息索引模块与消息存储模块连接,用于从消息存储模块获取消息记录文件,并建立消息索引文件;
消息存储模块与消息抓取模块连接,用于从消息抓取模块获取消息记录;
消息抓取模块分别与用户和好友信息管理模块、客户端、社交网络和消息中转模块连接,用于从用户和好友信息管理模块获取用户和好友信息,并根据用户和好友信息获取用户客户端本地存储的用户与好友通信的历史消息记录、社交网络中存储的用户与好友通信的历史消息记录和好友产生的可查看或可搜索的消息,以及存储在消息中转模块上的用户与好友通过移动通信设备通信的历史消息记录。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102417776A CN102088419B (zh) | 2009-12-07 | 2009-12-07 | 一种在社交网络中查找好友信息的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102417776A CN102088419B (zh) | 2009-12-07 | 2009-12-07 | 一种在社交网络中查找好友信息的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102088419A CN102088419A (zh) | 2011-06-08 |
CN102088419B true CN102088419B (zh) | 2012-08-15 |
Family
ID=44100037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009102417776A Expired - Fee Related CN102088419B (zh) | 2009-12-07 | 2009-12-07 | 一种在社交网络中查找好友信息的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102088419B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107093099A (zh) * | 2017-03-10 | 2017-08-25 | 重庆软易科技有限公司 | 一种网络交易系统及方法 |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102833176B (zh) * | 2011-06-13 | 2018-01-26 | 腾讯科技(深圳)有限公司 | 获取信息的方法、装置和系统 |
CN102833179B (zh) * | 2011-06-17 | 2018-03-27 | 腾讯科技(深圳)有限公司 | 一种消息发送方法和服务器 |
CN102571910B (zh) | 2011-11-16 | 2014-08-13 | 腾讯科技(深圳)有限公司 | 在社交网络中查找附近用户的方法和服务器 |
CN102436500A (zh) * | 2011-12-02 | 2012-05-02 | 苏州慧飞信息科技有限公司 | 一种基于网站的社交系统 |
CN103136272A (zh) * | 2011-12-02 | 2013-06-05 | 腾讯科技(深圳)有限公司 | 一种基于网络社区搜索的搜索方法和装置 |
US9298826B2 (en) * | 2012-01-05 | 2016-03-29 | International Business Machines Corporation | Goal-oriented user matching among social networking environments |
CN103246670B (zh) | 2012-02-09 | 2016-02-17 | 深圳市腾讯计算机系统有限公司 | 微博排序、搜索、展示方法和系统 |
CN102629919B (zh) * | 2012-03-27 | 2015-10-21 | 上海量明科技发展有限公司 | 即时通信中用以添加联系人的方法、客户端及系统 |
US8639704B2 (en) * | 2012-04-04 | 2014-01-28 | Gface Gmbh | Inherited user rating |
CN103389853B (zh) * | 2012-05-11 | 2016-08-03 | 金蝶软件(中国)有限公司 | 微博展示方法和系统 |
CN102722566B (zh) * | 2012-06-04 | 2015-04-15 | 上海电力学院 | 社交网络中潜在好友查询方法 |
CN103823808A (zh) * | 2012-11-16 | 2014-05-28 | 云壤(北京)信息技术有限公司 | 利用微博短链的网页搜索系统及网页搜索方法 |
CN104052765A (zh) * | 2013-03-12 | 2014-09-17 | 蓝燕君 | 媒体信息传播方法及系统 |
US9794358B1 (en) * | 2013-04-05 | 2017-10-17 | Hrl Laboratories, Llc | Inferring the location of users in online social media platforms using social network analysis |
US10255352B1 (en) | 2013-04-05 | 2019-04-09 | Hrl Laboratories, Llc | Social media mining system for early detection of civil unrest events |
US10726090B1 (en) | 2013-04-05 | 2020-07-28 | Hrl Laboratories, Llc | Per-user accuracy measure for social network based geocoding algorithms |
CN104123296A (zh) * | 2013-04-26 | 2014-10-29 | 阿里巴巴集团控股有限公司 | 一种生成消息索引以便向接收者呈现消息的方法及装置 |
CN103390244B (zh) * | 2013-07-24 | 2016-04-20 | 南京欣网互联信息技术有限公司 | 一种具有运营商特色的用户好友关系聚合方法及聚合平台 |
CN103617267B (zh) * | 2013-12-03 | 2017-05-10 | 北京奇虎科技有限公司 | 社交化扩展搜索方法及装置、系统 |
TWI514175B (zh) * | 2013-12-11 | 2015-12-21 | Mitake Information Corp | 社群網站搜尋結果資料排序顯示之裝置、方法與系統 |
CN106713111B (zh) * | 2015-11-17 | 2020-04-07 | 腾讯科技(深圳)有限公司 | 一种添加好友的处理方法、终端及服务器 |
CN105787800B (zh) * | 2016-03-30 | 2020-01-10 | 省广营销集团有限公司 | 一种智能化的社交平台潜在人脉检索装置、系统及方法 |
US10496686B2 (en) * | 2016-06-13 | 2019-12-03 | Baidu Usa Llc | Method and system for searching and identifying content items in response to a search query using a matched keyword whitelist |
CN109064251A (zh) * | 2018-06-29 | 2018-12-21 | 北京小米智能科技有限公司 | 电商商品排序方法和装置 |
CN111223533B (zh) * | 2019-12-24 | 2024-02-13 | 深圳市联影医疗数据服务有限公司 | 一种医疗数据检索方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1750519A (zh) * | 2005-11-01 | 2006-03-22 | 中国移动通信集团公司 | 即时消息数据共享的方法 |
CN1949732A (zh) * | 2006-10-12 | 2007-04-18 | 百度在线网络技术(北京)有限公司 | 网络社区与搜索的结合的方法以及系统 |
-
2009
- 2009-12-07 CN CN2009102417776A patent/CN102088419B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1750519A (zh) * | 2005-11-01 | 2006-03-22 | 中国移动通信集团公司 | 即时消息数据共享的方法 |
CN1949732A (zh) * | 2006-10-12 | 2007-04-18 | 百度在线网络技术(北京)有限公司 | 网络社区与搜索的结合的方法以及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107093099A (zh) * | 2017-03-10 | 2017-08-25 | 重庆软易科技有限公司 | 一种网络交易系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102088419A (zh) | 2011-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102088419B (zh) | 一种在社交网络中查找好友信息的方法和系统 | |
CN100514337C (zh) | 关键词的联想信息生成系统和生成方法 | |
CN102622450B (zh) | 用户的浏览器历史的相关性排序 | |
CN102096717B (zh) | 搜索方法及搜索引擎 | |
CN101189608B (zh) | 用于分析用户的Web历史的系统和方法 | |
CN101183364B (zh) | 一种信息搜索方法、搜索引擎客户端/服务器及系统 | |
CN105389389B (zh) | 一种网络舆情传播态势媒体联动分析方法 | |
CN103365833B (zh) | 一种基于上下文场景的输入候选词提示方法及系统 | |
CN103246703B (zh) | 一种用于确定应用词库的方法和设备 | |
US20110093455A1 (en) | Search and retrieval methods and systems of short messages utilizing messaging context and keyword frequency | |
CN105701216A (zh) | 一种信息推送方法及装置 | |
CN102236677A (zh) | 一种基于问答系统的信息匹配方法及系统 | |
CN102426610A (zh) | 微博搜索排名方法及微博搜索引擎 | |
US20100169352A1 (en) | Novel systems and methods for transmitting syntactically accurate messages over a network | |
CN104615627B (zh) | 一种基于微博平台的事件舆情信息提取方法及系统 | |
CN100578506C (zh) | 网络信息搜索方法及搜索系统 | |
CN102722501A (zh) | 搜索引擎及其实现方法 | |
CN103577504A (zh) | 一种投放个性化内容的方法和装置 | |
CN101997933A (zh) | 一种网址提供方法、装置及系统 | |
CN102722499A (zh) | 搜索引擎及其实现方法 | |
KR101123697B1 (ko) | 공통 관심 사용자 검색장치 및 방법 | |
CN102214183A (zh) | 按页面反馈内容与固定排名相结合的搜索引擎查询方法 | |
CN103064880A (zh) | 一种基于搜索信息向用户提供网站选择的方法、装置和系统 | |
CN102333084A (zh) | 基于用户属性的信息推送方法及系统 | |
CN103942268A (zh) | 搜索与应用相结合的方法、设备以及应用接口 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120815 Termination date: 20131207 |