CN102646134A - 一种用于确定消息记录中的消息会话的方法和设备 - Google Patents

一种用于确定消息记录中的消息会话的方法和设备 Download PDF

Info

Publication number
CN102646134A
CN102646134A CN2012100893591A CN201210089359A CN102646134A CN 102646134 A CN102646134 A CN 102646134A CN 2012100893591 A CN2012100893591 A CN 2012100893591A CN 201210089359 A CN201210089359 A CN 201210089359A CN 102646134 A CN102646134 A CN 102646134A
Authority
CN
China
Prior art keywords
message
session
theme
user
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100893591A
Other languages
English (en)
Inventor
王耀
叶青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN2012100893591A priority Critical patent/CN102646134A/zh
Publication of CN102646134A publication Critical patent/CN102646134A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明的目的是提供一种用于确定消息记录中消息会话的方法与设备。具体地,获取待处理的一个或多个消息记录;获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;根据所述消息内容信息,确定一个或多个会话主题;将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,获得相应的消息会话。与现有技术相比,本发明通过结合消息记录的消息内容信息,确定相应会话主题,将与该会话主题相对应的消息记录进行聚合,从而获得与会话主题相对应的消息会话,不仅方便了用户浏览相关评论内容,而且进一步地提升了用户的社区交流访问体验。

Description

一种用于确定消息记录中的消息会话的方法和设备
技术领域
本发明涉及互联网技术领域,尤其涉及一种用于确定消息记录中的消息会话的技术。
背景技术
在互联网已经成为不可或缺工具的今天,人们通常通过网络发表文章、上传相册、发表见解等,共享网络为自己的工作、生活、娱乐提供的快捷、方便服务。现有的人们利用互联网查看他人对其共享或关注内容的评论的过程中,通常当用户登录该网站时,会收到相应的评论通知,但看不到具体的评论内容。而用户希望登录该网站即可看到其他所有用户对其文章等进行评论的全部内容,无需打开相应的文章,或者,根据用户的意愿,优先为其提供其所需的相关评论内容。而且,由于互联网的开放性,对于同一内容往往在多处受到评论,例如,其他用户对某用户在社区网站发表的文章进行评论时,有人在空间对其文章内容本身进行了评论,有人在贴吧对其文章标题进行了评论,还有人在微博、站内信等地方对其文章进行相关评论。如何将这些涉及同一内容却“散落在多处的”评论整理为一个消息会话,以便当该用户登陆该社区网站时,可以自动收到当前其他用户关于其文章的一个或多个方面的所有评论内容,例如并以会话的形式展现。
因此,如何便捷、有效地确定消息记录中的消息会话,以支持用户浏览相关评论内容,并提升用户的社区交流访问体验,成为本领域技术人员亟需解决的问题之一。
发明内容
本发明的目的是提供一种用于确定消息记录中消息会话的方法与设备。
根据本发明的一个方面,提供了一种用于确定消息记录中消息会话的方法,该方法包括以下步骤:
a获取待处理的一个或多个消息记录;
b获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;
c根据所述消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;
d对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话。
根据本发明的另一方面,还提供了一种用于确定消息记录中消息会话的设备,该设备包括:
记录获取装置,用于获取待处理的一个或多个消息记录;
信息获取装置,用于获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;
主题确定装置,用于根据所述消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;
会话获取装置,用于对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话。
与现有技术相比,本发明通过结合消息记录的消息内容信息,确定相应会话主题,将与该会话主题相对应的消息记录进行聚合,从而获得与会话主题相对应的消息会话,不仅方便了用户浏览相关评论内容,而且进一步地提升了用户的社区交流访问体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的用于确定消息记录中的消息会话的设备示意图;
图2示出根据本发明一个优选实施例的用于确定消息记录中的消息会话的设备示意图;
图3示出根据本发明另一个方面的用于确定消息记录中的消息会话的方法流程图;
图4示出根据本发明一个优选实施例的用于确定消息记录中的消息会话的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的用于确定消息记录中的消息会话的确定设备1。其中,确定设备1包括记录获取装置111、信息获取装置112、主题确定装置113和会话获取装置114。具体地,记录获取装置111获取待处理的一个或多个消息记录;信息获取装置112获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;主题确定装置113根据所述消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;会话获取装置114对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话。在此,确定设备1包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在此,云由基于云计算(CloudComputing)的大量计算机或网络服务器构成。本领域技术人员应能理解上述确定设备1仅为举例,其他现有的或今后可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
具体地,记录获取装置111通过诸如新闻网站、论坛网站或社交网站第三方设备提供的应用程序接口(API),或者通过JSP、ASP等动态网页技术、或者通过http、https等约定通信方式,获取来自不同数据源的待处理的一个或多个消息记录。其中,所述数据源包括但不限于以下至少任一项:1)用户空间;2)站内信;3)微博;4)社区网站。本领域技术人员应能理解上述数据源仅为举例,其他现有的或今后可能出现的数据源如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
例如,用户A在其百度空间中发表一篇题名为《分布式系统-PNUTS》的文章,用户B在浏览了该篇文章之后,发表了对该篇文章相关评论,如对文章的内容本身进行评论、对该文章的标题进行评论等,记录获取装置111通过诸如社交网站等第三方设备提供的应用程序接口(API),或者通过JSP、ASP等动态网页技术、或者通过http、https等约定通信方式,获取到用户B对该篇文章《分布式系统-PNUTS》的评论内容。
本领域技术人员应能理解上述获取待处理的一个或多个消息记录仅的方式仅为举例,其他现有的或今后可能出现的获取待处理的一个或多个消息记录仅的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
信息获取装置112通过诸如所述消息记录的文件格式中包含的所述消息记录的自述信息、或者通过所述消息记录中的记录字段与设定的记录相关信息间的映射关系,从所述消息记录中提取其记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息。在此,所述消息索引信息包括但不限于以下至少任一项:
-所述消息记录的消息产生时间;
-所述消息记录的消息来源;
-所述消息记录的消息类型;
-所述消息记录的消息提交用户信息。
例如,假设用户B在阅读了用户A在其百度空间中发表一篇题名为《分布式系统-PNUTS》的文章之后,发表以下评论内容:“lz,对PNUTS阐述甚详,可否解答以下问题,记录级别master的问题,比如master选取如何达到效率最佳,如何面对2个修改合并冲突?合并冲突据说是需要client自行来处理。”上述消息记录的文件格式为HTML文件,信息获取装置112根据该HTML文件中的自述信息,其描述了该HTML文件的相关信息,如发布日期、作者、来源、摘要等,从与上述消息记录的该HTML文件的自述信息中提取其记录相关信息,如来源http://hi.baidu.com/wkccs/blog/item/4ee706dd.html、发表时间2011年5月3日、评论提交者的用户id及具体评论内容的文本等。
本领域技术人员应能理解上述获取记录相关信息的方式仅为举例,其他现有的或今后可能出现的获取记录相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
主题确定装置113根据信息获取装置112获取的所述消息记录的记录相关信息中的所述消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录。具体地,主题确定装置113根据信息获取装置112获取的所述消息记录的记录相关信息中的所述消息内容信息,通过诸如基于字符串匹配的方法、或者通过基于理解的分词方法、或者通过基于统计的分词方法,对所述消息内容信息进行分词处理,以获得与所述消息内容信息所对应的消息记录相对应的消息关键词,例如,用户A在其百度空间中发表了一篇题名为《分布式系统-PNUTS》,假设信息获取装置112获取的其他用户对该篇文章的评论记录的具体内容为:
用户B的评论:“lz,对PNUTS阐述甚详,不错不错,可否解答以下问题,记录级别master的问题,比如master选取如何达到效率最佳,如何面对2个修改合并冲突?合并冲突据说是需要client自行来处理。”
用户C的评论:“根据文章内容,PNUTS主要为Web应用设计,而不是离线数据分析(相比于Hadoop/HBase),实际可理解为master-master模式,其一致性体现在由于记录都需通过master修改,master再复制到其他IDC,因此可达到所有IDC数据的最终一致性;其可用性体现在由于所有IDC都有每条记录的本地数据,应用可以根据策略返回本地cache或最新版本,本地修改只要commit到YMB即可认为修改成功,任一IDC发生故障不影响访问。”
用户D的评论:“总结的不错,看来,PNUTS可以很好的适合geographic replication模式,记录publish到本地YMB则认为成功,免除Dynamo方式需要等待多个Data Center返回的latency,如果发生master在异地则需要将请求forward到异地,但是由于存在master转移的策略,需要forward的情况比较少。”
用户E的评论:“用户D总结的很好,但是,当record的master不可用时候,实现上似乎有些可疑之处哦。”
用户F的评论:“期待达人回答用户B提出的问题,可发至我的站内信箱,在此先行谢过。”
主题确定装置113对用户B的消息内容进行分词处理后,得到相应关键词“记录、master”,对用户C的消息内容进行分词处理后,得到相应关键词“PNUTS、一致性、可用性、IDC”,对用户D的消息内容进行分词处理后,得到相应关键词“master、转移”,对用户E的消息内容进行分词处理后,得到相应关键词“record、master”,对用户F的消息内容进行分词处理后,得到相应关键词“回答问题、站内信”。
本领域技术人员应能理解上述获取消息关键词的方法仅为举例,其他现有的或今后可能出现的获取消息关键词的方法如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
然后主题确定装置113根据所述消息关键词,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录。在此,主题确定装置113根据所述消息关键词确定会话主题的方法包括但不限于以下至少任一项:
1)根据所述消息关键词及其对应的候选主题的概率,确定所述消息记录所对应的候选主题;根据所述候选主题,所述消息记录进行分类处理,以获得一个或多个消息分类及其会话主题,其中,每个消息分类包括一个或多个所述消息记录。具体地,主题确定装置113通过诸如访问存储有消息关键词所对应的候选主题的概率的第三方数据库,或者对现有主题确定的消息记录进行统计,来获得消息关键词所对应的候选主题的概率,然后通过诸如最大似然估计或贝叶斯参数估计等方法,确定消息记录所对应的候选主题,进而根据所述候选主题,对所述消息记录进行分类处理,以获得一个或多个消息分类及其会话主题。例如,接上例,假设主题确定装置113通过现有主题确定的消息记录统计得到消息关键词与其所对应的候选主题的概率的关系为:
记录/record-对文章内容的评论的概率为0.7
记录/record-对文章评论内容的评论的概率为0.1
master-对文章内容的评论的概率为1
PNUTS-对文章内容的评论的概率为0.8
PNUTS-对文章标题的评论的概率为0.2
一致性、可用性-对文章内容的评论的概率为1
IDC-对文章内容的评论的概率为0.6
IDC-对文章评论内容的评论的概率为0.2
转移-对文章评论内容的评论的概率为0.5
回答问题-对文章评论内容的评论的概率为0.8
站内信-对文章评论内容的评论的概率为0.8
主题确定装置113根据获得的上述消息关键词所对应的候选主题的概率通过最大似然估计或贝叶斯参数估计等方法,确定消息记录所对应的候选主题,进而根据所述候选主题,对所述消息记录进行分类处理,以获得一个或多个消息分类及其会话主题。例如,主题确定装置113确定用户B的消息记录所对应的候选主题为对文章内容的评论,用户C的消息记录所对应的候选主题为对文章内容的评论,用户D的消息记录所对应的候选主题为对文章内容的评论,用户E的消息记录所对应的候选主题为对文章内容的评论,用户F的消息记录所对应的候选主题为对文章评论内容的评论,即当前候选主题包括对文章内容的评论和对文章评论内容的评论两种,主题确定装置113根据得到的两种候选主题,对所述消息记录进行分类整理,得到以对文章内容的评论为会话主题的消息记录及以对文章评论内容的评论为会话主题的消息记录。
2)根据所述消息关键词,对所述消息记录进行聚类处理,以获得一个或多个消息聚类及其会话主题,其中,每个消息聚类包括一个或多个所述消息记录。具体地,主题确定装置113通过诸如对所述消息内容信息进行分词获得其关键词,进而获得与所述消息内容信息所对应的消息记录相对应的关键词描述向量,根据所述关键词描述向量,对所述消息记录进行聚类,以获得一个或多个消息聚类及其会话主题。例如,接上例,主题确定装置113获得的用户B的评论内容的关键词描述向量为“记录、master”、用户C的评论内容的关键词描述向量为“PNUTS、一致性、可用性、IDC”、用户D的评论内容的关键词描述向量为“master、转移”、用户E的评论内容的关键词描述向量为“record、master”、用户F的评论内容的关键词描述向量为“回答问题、站内信”,根据该关键词描述向量,将具有相同关键词描述向量或相似关键词描述向量的消息记录进行聚类,即将用户B和用户E的评论记录聚类,或者将用户B、用户D和用户E的评论记录聚类,获得一个或多个消息聚类及其会话主题,如将用户B和用户E的评论记录聚类得到的会话主题为“记录master”,将用户B、用户D和用户E的评论记录聚类得到的会话主题为“master”。
本领域技术人员应能理解上述根据消息关键词确定一个或多个会话主题的方式仅为举例,其他现有的或今后可能出现的根据消息关键词确定一个或多个会话主题的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,会话获取装置114对于主题确定装置113确定的所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息,如所述消息记录的消息产生时间、所述消息记录的消息提交用户信息等进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话。例如,接上例,假设用户B、用户C、用户D、用户E和用户F对用户A在其空间发表的文章《分布式系统-PNUTS》的评论属于同一个会话主题,例如对文章内容的评论,且各评论时间的先后顺序为用户B、用户D、用户C、用户E和用户F,会话获取装置114根据所述消息记录的消息产生时间,对主题确定装置113确定的以对文章内容的评论为会话主题用户B、用户D、用户C、用户E的消息记录聚合在一起,获得以对文章内容的评论为会话主题的消息会话。又如,会话获取装置114还可根据所述消息记录的消息提交用户信息,将会话主题中的消息记录聚合,获得相应会话,如将用户D提交的评论内容聚合在一起,获得用户D提交的所有评论内容。再如,会话获取装置114还可根据所述消息记录的消息提交用户信息,并结合所述消息记录的消息产生时间,将会话主题中的消息记录聚合,获得相应会话。
本领域技术人员应能理解上述对所述消息记录进行聚合的方式仅为举例,其他现有的或今后可能出现的对所述消息记录进行聚合的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优先地,主题确定装置113根据所述消息内容信息,确定一个或多个会话主题之后,其中,每个会话主题对应一个或多个所述消息记录,还可从所述一个或多个会话主题中筛选出优选会话主题;接着,会话获取装置114对于所述优选会话主题,将与所述优选会话主题相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述优选会话主题相对应的消息会话。具体地,主题确定装置113根据信息获取装置112获取的所述消息记录的记录相关信息中的所述消息内容信息,通过诸如基于字符串匹配的方法、或者通过基于理解的分词方法、或者通过基于统计的分词方法,对所述消息内容信息进行分词处理,以获得与所述消息内容信息所对应的消息记录相对应的消息关键词,采用统计的方法,统计每一关键词出现的次数,将出现次数最多的关键词作为优选会话主题。例如,用户A在其百度空间中发表了一篇题名为《分布式系统-PNUTS》,假设主题确定装置113对用户B的消息内容进行分词处理后,得到相应关键词“记录、master”,对用户C的消息内容进行分词处理后,得到相应关键词“PNUTS、一致性、可用性、IDC”,对用户D的消息内容进行分词处理后,得到相应关键词“master、转移”,对用户E的消息内容进行分词处理后,得到相应关键词“record、master”,对用户F的消息内容进行分词处理后,得到相应关键词“回答问题、站内信”,统计得到的关键词出现的次数分别为:记录/record出现2次,master出现3次,PNUTS、一致性、可用性、IDC、转移、回答问题、站内信各出现1次,主题确定装置113将出现次数最多的关键词“master”作为优选会话主题。
本领域技术人员应能理解上述筛选优选会话主题的方法仅为举例,其他现有的或今后可能出现的筛选优选会话主题的方法如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,会话获取装置114对于所述优选会话主题,将与所述优选会话主题相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述优选会话主题相对应的消息会话。例如,接上例,会话获取装置114将与优选会话主题“master”相对应的用户B、用户D和用户E发表的评论内容按所述消息索引信息,如所述消息记录的消息产生时间、所述消息记录的消息提交用户信息等进行聚合,以获得与所述优选会话主题相对应的消息会话。
优选地,确定设备1的各个装置之间是持续不断工作的。具体地,记录获取装置111持续获取待处理的一个或多个消息记录;信息获取装置112持续获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;主题确定装置113持续根据所述消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;会话获取装置114持续对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话。在此,本领域技术人员应理解“持续”是指确定设备1的各装置分别不断进行消息记录的获取、记录相关信息的获取、会话主题的确定及消息会话的获得,直至该确定设备1在较长时间内停止消息记录的获取。
在一个优选实施例中(参考图1),确定设备1包括记录获取装置111、信息获取装置112、主题确定装置113、会话获取装置114和第一提供装置(未示出)。其中,记录获取装置111包括请求获取单元(未示出)和记录获取单元(未示出)。以下参照图1对该优选实施例进行描述:具体地,请求获取单元获取用户提交的会话访问请求;记录获取单元根据所述会话访问请求,获取与所述会话访问请求相匹配的消息记录,以作为待处理的一个或多个消息记录;信息获取装置112获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;主题确定装置113根据所述消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;会话获取装置114对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话;第一提供装置将所述消息会话提供给所述用户。其中,信息获取装置112、主题确定装置113和会话获取装置114与图1所示对应装置相同或相似,故此处不再赘述,并通过引用的方式包含于此。
具体地,请求获取单元通过诸如新闻网站、论坛网站或社交网站第三方设备所提供的应用程序接口(API)、或者通过http、https等约定通信方式获取用户通过用户设备提交的会话访问请求。例如,用户A在其百度空间中发表了一篇题名为《分布式系统-PNUTS》的文章,当其登陆该空间时,鼠标悬浮于空间网页上任何位置处,展现可选择菜单,如按消息记录的消息提交者的用户属性提供、提供某时间段内的消息记录等,用户点击相应菜单,浏览器将用户的相应会话请求信息发送至确定设备1。
本领域技术人员应能理解上述获取用户提交的会话访问请求的方式仅为举例,其他现有的或今后可能出现的获取用户提交的会话访问请求的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
记录获取单元根据所述会话访问请求,通过诸如新闻网站、论坛网站或社交网站第三方设备提供的应用程序接口(API),或者通过JSP、ASP等动态网页技术、或者通过http、https等约定通信方式获取与所述会话访问请求相匹配的消息记录,以作为待处理的一个或多个消息记录。例如,假设用户A希望浏览其空间好友用户B对其文章的评论,记录获取单元根据请求获取单元获取的用户A的上述会话访问请求,获取与所述会话访问请求相匹配的消息记录,即用户B对用户A的文章发表的评论记录,将其作为待处理的一个或多个消息记录。
第一提供装置将获取装置114获取的所述消息会话通过诸如http或https等约定通信方式提供至所述用户,如该用户的用户设备,供用户浏览。
在另一个优选实施例中(参考图1),确定设备1包括记录获取装置111、信息获取装置112、主题确定装置113、会话获取装置114、请求获取装置(未示出)、优选记录获取装置(未示出)和第二提供装置(未示出)。以下参照图1对该优选实施例进行描述:具体地,记录获取装置111获取待处理的一个或多个消息记录;信息获取装置112获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;请求获取装置获取用户提交的会话访问请求;优选记录获取装置根据所述会话访问请求,在所述一个或多个消息记录中进行筛选,以获得一个或多个优选消息记录,其中,所述优选消息记录的消息相关信息与所述会话访问请求相匹配;主题确定装置113根据所述优选消息记录的消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;会话获取装置114对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话;第二提供装置将所述消息会话提供给所述用户。其中,记录获取装置111、信息获取装置112和会话获取装置114与图1所示对应装置相同或相似,故此处不再赘述,并通过引用的方式包含于此。
具体地,请求获取装置通过诸如新闻网站、论坛网站或社交网站第三方设备所提供的应用程序接口(API)、或者通过http、https等约定通信方式获取用户通过用户设备提交的会话访问请求。其中请求获取装置与请求获取单元获取用户提交的会话访问请求的方式相同,为简单起见,在此不再赘述,并通过引用的方式包含于此。
优选记录获取装置根据请求获取装置获取的所述会话访问请求,在记录获取装置111获取的所述一个或多个消息记录中进行筛选,以获得一个或多个优选消息记录,其中,所述优选消息记录的消息相关信息与所述会话访问请求相匹配。例如,优选记录获取装置可根据请求获取装置获取的会话访问请求中特定字段所携带的会话主题信息、参与会话的特定用户的信息、会话的时间信息等,在所述一个或多个消息记录中进行筛选,以获得一个或多个优选消息记录。又如,优选记录获取装置还可根据请求获取装置获取的会话访问请求中特定字段所携带的发起该会话访问请求的用户的相关信息,如用户基本属性、会话访问记录、地理位置信息等,在所述一个或多个消息记录中进行筛选,以获得一个或多个优选消息记录。
本领域技术人员应能理解上述获得一个或多个优选消息记录的方法仅为举例,其他现有的或今后可能出现的获得一个或多个优选消息记录的方法如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,主题确定装置113根据所述优选消息记录的消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录。具体地,主题确定装置113对优选记录获取装置获取的一个或多个优选消息记录的消息内容信息,通过诸如基于字符串匹配的方法、或者通过基于理解的分词方法、或者通过基于统计的分词方法,对所述消息内容信息进行分词处理,以获得与所述消息内容信息所对应的消息记录相对应的消息关键词,采用统计的方法,统计每一关键词出现的次数,将出现次数最多的关键词作为优选会话主题。例如,假设优选记录获取装置获得的是在2011年10月1日至2011年10月7日期间其他用户对用户A百度空间中的相册“2011国庆旅游”的评论记录,假设主题确定装置113对用户G的消息内容进行分词处理后,得到关键词“鼓浪屿、漂亮”,对用户H的消息内容进行分词处理后,得到关键词“帅气、Trista”,对用户I的消息内容进行分词处理后,得到关键词“鼓浪屿”,统计得到的关键词出现的次数分别为:鼓浪屿出现2次,漂亮出现1次,帅气、Trista各出现1次,主题确定装置113将出现次数最多的关键词“鼓浪屿”作为会话主题。
第二提供装置将会话获取装置114获取的所述消息会话通过诸如http或https等约定通信方式提供至所述用户,如该用户的用户设备,供用户浏览。
图2示出根据本发明一个优选实施例的用于确定消息记录中的消息会话设备示意图。确定设备1包括记录获取装置211、信息获取装置212、主题确定装置213、会话获取装置214、检测装置215、会话确定装置216和第三提供装置217。以下参照图2对该优选实施例进行描述:具体地,记录获取装置211获取待处理的一个或多个消息记录;信息获取装置212获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;主题确定装置213根据所述优选消息记录的消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;会话获取装置214对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话;检测装置215检测是否满足向用户发送所述消息会话的触发条件;当满足所述触发条件时,会话确定装置216确定与所述触发条件相匹配的消息会话;第三提供装置217将所匹配的消息会话提供给所述用户。其中,记录获取装置211、信息获取装置212、主题确定装置213和会话获取装置214与图1所示对应装置相同或相似,故此处不再赘述,并通过引用的方式包含于此。
具体地,检测装置215通过诸如新闻网站、论坛网站或社交网站第三方设备提供的应用程序接口(API)、或者通过JSP、ASP等动态网页技术,检测是否满足向用户发送所述消息会话的触发条件,其中,所述触发条件包括但不限于以下至少任一项:
-获取所述用户所执行的页面访问操作;
-获取所述用户发送的会话访问请求。
例如,当所述触发条件包括获取所述用户所执行的页面访问操作时,如用户登录其百度空间的网站,当其登录该网站时,检测装置215即检测到用户所执行的页面访问操作。又如,当所述触发条件包括获取所述用户发送的会话访问请求时,如用户在其空间页面通过鼠标点击提供会话主题的菜单等,检测装置215即检测到所述用户发送的会话访问请求。
本领域技术人员应能理解上述触发条件与检测是否满足向用户发送所述消息会话的触发条件的方式仅为举例,其他现有的或今后可能出现的触发条件或检测是否满足向用户发送所述消息会话的触发条件的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
当满足所述触发条件时,会话确定装置216对会话获取装置214获得的所述消息会话进行查询,确定与所述触发条件相匹配的消息会话。例如,用户A在其百度空间发表了一篇文章,会话获取装置214获得的所述消息会话为其他用户对用户A的该篇文章的文章内容评论为会话主题的消息会话和其他用户对用户A的该篇文章的文章标题评论为会话主题的消息会话,当用户A在其空间页面通过鼠标点击提供以文章内容评论为会话主题的菜单时,会话确定装置216对会话获取装置214获得的所述消息会话进行查询,确定的是与该用户的提供以文章内容评论为会话主题的会话访问请求相匹配的消息会话。
本领域技术人员应能理解上述确定与所述触发条件相匹配的消息会话的方法仅为举例,其他现有的或今后可能出现的确定与所述触发条件相匹配的消息会话的方法如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,第三提供装置217将会话确定装置216确定的与所述触发条件相匹配的消息会话通过诸如http或https等约定通信方式提供至所述用户,如该用户的用户设备,供用户浏览。
优选地,当满足所述触发条件时,会话确定装置216对会话获取装置214获得的所述消息会话进行查询,确定与所述触发条件相匹配的消息会话与会话主题;第三提供装置217将所匹配的消息会话与会话主题提供给所述用户。例如,用户登录其百度空间的网站时,会话确定装置216确定的是其他用户对该用户在其百度空间中发表的文章、相册等的以文章内容评论为主题、以文章标题评论为主题、以整个相册评论为主题等所有评论内容及其对应会话主题。又如,当用户在其空间页面通过鼠标点击提供以文章内容评论为会话主题的菜单时,会话确定装置216确定的是与该用户的提供以文章内容评论为会话主题的会话访问请求相匹配的消息会话与会话主题。
本领域技术人员应能理解上述确定与所述触发条件相匹配的消息会话与会话主题的方法仅为举例,其他现有的或今后可能出现的确定与所述触发条件相匹配的消息会话与会话主题的方法如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,第三提供装置217将会话确定装置216确定的与所述触发条件相匹配的消息会话与会话主题通过诸如http或https等约定通信方式提供至所述用户,如该用户的用户设备,供用户浏览。
更优选地,检测装置215检测到的获取所述用户发送的会话访问请求,其中,所述会话访问请求中还可包括会话主题的优先级信息;第三提供装置217根据所述优先级信息,将所匹配的消息会话与会话主题提供给所述用户。例如,用户通过用户设备向服务器发送会话访问请求时,可通过会话访问设置setting的方式设置消息会话与会话主题的优先级,如通过url参数或者post消息体发送给服务器,消息体格式使用bitmap的方式指定特定的bit位对应特定的设置。int类型有4字节,共32个比特位;最低一位设置是否提供以文章内容为主题的会话,倒数第二位设置是否提供以文章标题为主题的会话,倒数第三位设置是否使用通过优先级提供消息会话与会话主题,isLoadContent=0x01,isLoadTitle=0x02,isUsePriority=0x04,如果用户希望只提供以文章内容为主题的会话而不提供以文章标题为主题的会话,并且使用优先级,那么上传的setting可以通过url?setting=0x05&priority=5,表明只显示priority大于5的会话主题及其对应消息会话。在此,所述会话主题的优先级信息还可在确定设备1中设置,或在与确定设备1通过网络相连接的第三方设备中设置。
本领域技术人员应能理解上述在会话访问请求中设置会话主题优先级信息的方式仅为举例,其他现有的或今后可能出现的在会话访问请求中设置会话主题优先级信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,第三提供装置217根据所述优先级信息,将所匹配的消息会话与会话主题,通过诸如http或https等约定通信方式提供至所述用户,如该用户的用户设备,供用户浏览。
在一个优选实施例中(参考图2),确定设备1包括记录获取装置211、信息获取装置212、主题确定装置213、会话获取装置214、检测装置215、会话确定装置216、选择操作获取装置(未示出)和第四提供装置(未示出)。以下参照图2对该优选实施例进行描述:具体地,记录获取装置211获取待处理的一个或多个消息记录;信息获取装置212获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;主题确定装置213根据所述优选消息记录的消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;会话获取装置214对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话;检测装置215检测是否满足向用户发送所述消息会话的触发条件;当满足所述触发条件时,会话确定装置216确定与所述触发条件相匹配的消息会话;选择操作获取装置获取用户的对所匹配的会话主题的选择操作;第四提供装置将与所述选择操作相对应的所述消息会话提供给所述用户。其中,记录获取装置211、信息获取装置212、主题确定装置213、会话获取装置214、检测装置215和会话确定装置216与图2所示对应装置相同或相似,故此处不再赘述,并通过引用的方式包含于此。
具体地,选择操作获取装置通过诸如新闻网站、论坛网站或社交网站等第三方设备提供的应用程序接口(API),或者通过JSP、ASP等动态网页技术获取用户的对所匹配的会话主题的选择操作。例如,用户A在其百度空间中发表了一篇题名为《分布式系统-PNUTS》的文章,当其登陆该空间时,鼠标悬浮于空间网页上任何位置处,展现可选择菜单,如按对文章的内容评论为会话主题、按对文章的标题评论为会话主题等,用户点击相应菜单,选择操作获取装置即获取了用户的对所匹配的会话主题的选择操作。
本领域技术人员应能理解上述获取用户对所述一个或多个会话主题的选择操作的方式仅为举例,其他现有的或今后可能出现的获取用户对所述一个或多个会话主题的选择操作的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
第四提供装置将与选择操作获取装置获取的所述选择操作相对应的所述消息会话,通过诸如http或https等约定通信方式提供至所述用户,如该用户的用户设备,供用户浏览。
图3示出根据本发明另一个方面的用于确定消息记录中的消息会话方法流程图。
具体地,在步骤S301中,确定设备1获取待处理的一个或多个消息记录;在步骤S302中,确定设备1获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;在步骤S303中,确定设备1根据所述消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;在步骤S304中,确定设备1对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话。在此,确定设备1包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成。本领域技术人员应能理解上述确定设备1仅为举例,其他现有的或今后可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
具体地,在步骤S301中,确定设备1通过诸如新闻网站、论坛网站或社交网站等第三方设备提供的应用程序接口(API),或者通过JSP、ASP等动态网页技术、或者通过http、https等约定通信方式,获取来自不同数据源的待处理的一个或多个消息记录。其中,所述数据源包括但不限于以下至少任一项:1)用户空间;2)站内信;3)微博;4)社区网站。本领域技术人员应能理解上述数据源仅为举例,其他现有的或今后可能出现的数据源如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
例如,用户A在其百度空间中发表一篇题名为《分布式系统-PNUTS》的文章,用户B在浏览了该篇文章之后,发表了对该篇文章相关评论,如对文章的内容本身进行评论、对该文章的标题进行评论等,在步骤S301中,确定设备1通过诸如新闻网站、论坛网站或社交网站等第三方设备提供的应用程序接口(API),或者通过JSP、ASP等动态网页技术、或者通过http、https等约定通信方式,获取到用户B对该篇文章《分布式系统-PNUTS》的评论内容。
本领域技术人员应能理解上述获取待处理的一个或多个消息记录仅的方式仅为举例,其他现有的或今后可能出现的获取待处理的一个或多个消息记录仅的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S302中,确定设备1通过诸如所述消息记录的文件格式中包含的所述消息记录的自述信息、或者通过所述消息记录中的记录字段与设定的记录相关信息间的映射关系,从所述消息记录中提取其记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息。在此,所述消息索引信息包括但不限于以下至少任一项:
-所述消息记录的消息产生时间;
-所述消息记录的消息来源;
-所述消息记录的消息类型;
-所述消息记录的消息提交用户信息。
例如,假设用户B在阅读了用户A在其百度空间中发表一篇题名为《分布式系统-PNUTS》的文章之后,发表以下评论内容:“lz,对PNUTS阐述甚详,可否解答以下问题,记录级别master的问题,比如master选取如何达到效率最佳,如何面对2个修改合并冲突?合并冲突据说是需要client自行来处理。”上述消息记录的文件格式为HTML文件,在步骤S302中,确定设备1根据该HTML文件中的自述信息,其描述了该HTML文件的相关信息,如发布日期、作者、来源、摘要等,从与上述消息记录的该HTML文件的自述信息中提取其记录相关信息,如来源http://hi.baidu.com/wkccs/blog/item/4ee706dd.html、发表时间2011年5月3日、评论提交者的用户id及具体评论内容的文本等。
本领域技术人员应能理解上述获取记录相关信息的方式法仅为举例,其他现有的或今后可能出现的获取记录相关信息的方式法如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S303中,确定设备1根据其在步骤S302中获取的所述消息记录的记录相关信息中的所述消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录。具体地,在步骤S303中,确定设备1根据其在步骤S302中获取的所述消息记录的记录相关信息中的所述消息内容信息,通过诸如基于字符串匹配的方法、或者通过基于理解的分词方法、或者通过基于统计的分词方法,对所述消息内容信息进行分词处理,以获得与所述消息内容信息所对应的消息记录相对应的消息关键词,例如,用户A在其百度空间中发表了一篇题名为《分布式系统-PNUTS》,假设在步骤S302中,确定设备1获取的其他用户对该篇文章的评论记录的具体内容为:
用户B的评论:“lz,对PNUTS阐述甚详,不错不错,可否解答以下问题,记录级别master的问题,比如master选取如何达到效率最佳,如何面对2个修改合并冲突?合并冲突据说是需要client自行来处理。”
用户C的评论:“根据文章内容,PNUTS主要为Web应用设计,而不是离线数据分析(相比于Hadoop/HBase),实际可理解为master-master模式,其一致性体现在由于记录都需通过master修改,master再复制到其他IDC,因此可达到所有IDC数据的最终一致性;其可用性体现在由于所有IDC都有每条记录的本地数据,应用可以根据策略返回本地cache或最新版本,本地修改只要commit到YMB即可认为修改成功,任一IDC发生故障不影响访问。”
用户D的评论:“总结的不错,看来,PNUTS可以很好的适合geographic replication模式,记录publish到本地YMB则认为成功,免除Dynamo方式需要等待多个Data Center返回的latency,如果发生master在异地则需要将请求forward到异地,但是由于存在master转移的策略,需要forward的情况比较少。”
用户E的评论:“用户D总结的很好,但是,当record的master不可用时候,实现上似乎有些可疑之处哦。”
用户F的评论:“期待达人回答用户B提出的问题,可发至我的站内信箱,在此先行谢过。”
在步骤S303中,确定设备1对用户B的消息内容进行分词处理后,得到相应关键词“记录、master”,对用户C的消息内容进行分词处理后,得到相应关键词“PNUTS、一致性、可用性、IDC”,对用户D的消息内容进行分词处理后,得到相应关键词“master、转移”,对用户E的消息内容进行分词处理后,得到相应关键词“record、master”,对用户F的消息内容进行分词处理后,得到相应关键词“回答问题、站内信”。
本领域技术人员应能理解上述获取消息关键词的方法仅为举例,其他现有的或今后可能出现的获取消息关键词的方法如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
然后在步骤S303中,确定设备1根据所述消息关键词,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录。在此,在步骤S303中,确定设备1根据所述消息关键词确定会话主题的方法包括但不限于以下至少任一项:
1)根据所述消息关键词及其对应的候选主题的概率,确定所述消息记录所对应的候选主题;根据所述候选主题,所述消息记录进行分类处理,以获得一个或多个消息分类及其会话主题,其中,每个消息分类包括一个或多个所述消息记录。具体地,在步骤S303中,确定设备1通过诸如访问存储有消息关键词所对应的候选主题的概率的第三方数据库,或者对现有主题确定的消息记录进行统计,来获得消息关键词所对应的候选主题的概率,然后通过诸如最大似然估计或贝叶斯参数估计等方法,确定消息记录所对应的候选主题,进而根据所述候选主题,对所述消息记录进行分类处理,以获得一个或多个消息分类及其会话主题。例如,接上例,假设在步骤S303中,确定设备1通过现有主题确定的消息记录统计得到消息关键词与其所对应的候选主题的概率的关系为:
记录/record-对文章内容的评论的概率为0.7
记录/record-对文章评论内容的评论的概率为0.1
master-对文章内容的评论的概率为1
PNUTS-对文章内容的评论的概率为0.8
PNUTS-对文章标题的评论的概率为0.2
一致性、可用性-对文章内容的评论的概率为1
IDC-对文章内容的评论的概率为0.6
IDC-对文章评论内容的评论的概率为0.2
转移-对文章评论内容的评论的概率为0.5
回答问题-对文章评论内容的评论的概率为0.8
站内信-对文章评论内容的评论的概率为0.8
在步骤S303中,确定设备1根据获得的上述消息关键词所对应的候选主题的概率通过最大似然估计或贝叶斯参数估计等方法,确定消息记录所对应的候选主题,进而根据所述候选主题,对所述消息记录进行分类处理,以获得一个或多个消息分类及其会话主题。例如,在步骤S303中,确定设备1确定用户B的消息记录所对应的候选主题为对文章内容的评论,用户C的消息记录所对应的候选主题为对文章内容的评论,用户D的消息记录所对应的候选主题为对文章内容的评论,用户E的消息记录所对应的候选主题为对文章内容的评论,用户F的消息记录所对应的候选主题为对文章评论内容的评论,即当前候选主题包括对文章内容的评论和对文章评论内容的评论两种,在步骤S303中,确定设备1根据得到的两种候选主题,对所述消息记录进行分类整理,得到以对文章内容的评论为会话主题的消息记录及以对文章评论内容的评论为会话主题的消息记录。
2)根据所述消息关键词,对所述消息记录进行聚类处理,以获得一个或多个消息聚类及其会话主题,其中,每个消息聚类包括一个或多个所述消息记录。具体地,在步骤S303中,确定设备1通过诸如对所述消息内容信息进行分词获得其关键词,进而获得与所述消息内容信息所对应的消息记录相对应的关键词描述向量,根据所述关键词描述向量,对所述消息记录进行聚类,以获得一个或多个消息聚类及其会话主题。例如,接上例,在步骤S303中,确定设备1获得的用户B的评论内容的关键词描述向量为“记录、master”、用户C的评论内容的关键词描述向量为“PNUTS、一致性、可用性、IDC”、用户D的评论内容的关键词描述向量为“master、转移”、用户E的评论内容的关键词描述向量为“record、master”、用户F的评论内容的关键词描述向量为“回答问题、站内信”,根据该关键词描述向量,将具有相同关键词描述向量或相似关键词描述向量的消息记录进行聚类,即将用户B和用户E的评论记录聚类,或者将用户B、用户D和用户E的评论记录聚类,获得一个或多个消息聚类及其会话主题,如将用户B和用户E的评论记录聚类得到的会话主题为“记录master”,将用户B、用户D和用户E的评论记录聚类得到的会话主题为“master”。
本领域技术人员应能理解上述根据消息关键词确定一个或多个会话主题的方式法仅为举例,其他现有的或今后可能出现的根据消息关键词确定一个或多个会话主题的方式法如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S304中,确定设备1对于其在步骤S303中确定的所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息,如所述消息记录的消息产生时间、所述消息记录的消息提交用户信息等进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话。例如,接上例,假设用户B、用户C、用户D、用户E和用户F对用户A在其空间发表的文章《分布式系统-PNUTS》的评论属于同一个会话主题,例如对文章内容的评论,且各评论时间的先后顺序为用户B、用户D、用户C、用户E和用户F,在步骤S304中,确定设备1根据所述消息记录的消息产生时间,对其在步骤S303中确定的以对文章内容的评论为会话主题用户B、用户D、用户C、用户E的消息记录聚合在一起,获得以对文章内容的评论为会话主题的消息会话。又如,在步骤S304中,确定设备1还可根据所述消息记录的消息提交用户信息,将会话主题中的消息记录聚合,获得相应会话,如将用户D提交的评论内容聚合在一起,获得用户D提交的所有评论内容。再如,在步骤S304中,确定设备1还可根据所述消息记录的消息提交用户信息,并结合所述消息记录的消息产生时间,将会话主题中的消息记录聚合,获得相应会话。
本领域技术人员应能理解上述对所述消息记录进行聚合的方式仅为举例,其他现有的或今后可能出现的对所述消息记录进行聚合的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优先地,在步骤S303中,确定设备1根据所述消息内容信息,确定一个或多个会话主题之后,其中,每个会话主题对应一个或多个所述消息记录,还可从所述一个或多个会话主题中筛选出优选会话主题;接着,在步骤S304中,确定设备1对于所述优选会话主题,将与所述优选会话主题相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述优选会话主题相对应的消息会话。具体地,在步骤S303中,确定设备1根据其在步骤S302中获取的所述消息记录的记录相关信息中的所述消息内容信息,通过诸如基于字符串匹配的方法、或者通过基于理解的分词方法、或者通过基于统计的分词方法,对所述消息内容信息进行分词处理,以获得与所述消息内容信息所对应的消息记录相对应的消息关键词,采用统计的方法,统计每一关键词出现的次数,将出现次数最多的关键词作为优选会话主题。例如,用户A在其百度空间中发表了一篇题名为《分布式系统-PNUTS》,假设在步骤S303中,确定设备1对用户B的消息内容进行分词处理后,得到相应关键词“记录、master”,对用户C的消息内容进行分词处理后,得到相应关键词“PNUTS、一致性、可用性、IDC”,对用户D的消息内容进行分词处理后,得到相应关键词“master、转移”,对用户E的消息内容进行分词处理后,得到相应关键词“record、master”,对用户F的消息内容进行分词处理后,得到相应关键词“回答问题、站内信”,统计得到的关键词出现的次数分别为:记录/record出现2次,master出现3次,PNUTS、一致性、可用性、IDC、转移、回答问题、站内信各出现1次,在步骤S303中,确定设备1将出现次数最多的关键词“master”作为优选会话主题。
本领域技术人员应能理解上述筛选优选会话主题的方法仅为举例,其他现有的或今后可能出现的筛选优选会话主题的方法如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S304中,确定设备1对于所述优选会话主题,将与所述优选会话主题相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述优选会话主题相对应的消息会话。例如,接上例,在步骤S304中,确定设备1将与优选会话主题“master”相对应的用户B、用户D和用户E发表的评论内容按所述消息索引信息,如所述消息记录的消息产生时间、所述消息记录的消息提交用户信息等进行聚合,以获得与所述优选会话主题相对应的消息会话。
优选地,确定设备1的各个步骤之间是持续不断工作的。具体地,在步骤S301中,确定设备1持续获取待处理的一个或多个消息记录;在步骤S302中,确定设备1持续获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;在步骤S303中,确定设备1持续根据所述消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;在步骤S304中,确定设备1持续对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话。在此,本领域技术人员应理解“持续”是指确定设备1的各步骤分别不断进行消息记录的获取、记录相关信息的获取、会话主题的确定及消息会话的获得,直至该确定设备1在较长时间内停止消息记录的获取。
在一个优选实施例中(参考图3),确定设备1包括步骤S301、步骤S302、步骤S303、步骤S304、步骤S308(未示出),其中,步骤S301包括步骤S3011(未示出)和步骤S3012(未示出)。以下参照图3对该优选实施例进行描述:具体地,在步骤S3011中,确定设备1获取用户提交的会话访问请求;在步骤S3012中,确定设备1根据所述会话访问请求,获取与所述会话访问请求相匹配的消息记录,以作为待处理的一个或多个消息记录;在步骤S302中,确定设备1获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;在步骤S303中,确定设备1根据所述消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;在步骤S304中,确定设备1对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话;在步骤S308中,确定设备1将所述消息会话提供给所述用户。其中,步骤S302、步骤S303和步骤S304与图3所示对应步骤相同或相似,故此处不再赘述,并通过引用的方式包含于此。
具体地,在步骤S3011中,确定设备1通过诸如新闻网站、论坛网站或社交网站等第三方设备所提供的应用程序接口(API)、或者通过http、https等约定通信方式获取用户通过用户设备提交的会话访问请求。例如,用户A在其百度空间中发表了一篇题名为《分布式系统-PNUTS》的文章,当其登陆该空间时,鼠标悬浮于空间网页上任何位置处,展现可选择菜单,如按消息记录的消息提交者的用户属性提供、提供某时间段内的消息记录等,用户点击相应菜单,浏览器将用户的相应会话请求信息发送至确定设备1服务器。
本领域技术人员应能理解上述获取用户提交的会话访问请求的方式仅为举例,其他现有的或今后可能出现的获取用户提交的会话访问请求的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S3012中,确定设备1根据所述会话访问请求,通过诸如新闻网站、论坛网站或社交网站等第三方设备提供的应用程序接口(API),或者通过JSP、ASP等动态网页技术、或者通过http、https等约定通信方式获取与所述会话访问请求相匹配的消息记录,以作为待处理的一个或多个消息记录。例如,假设用户A希望浏览其空间好友用户B对其文章的评论,记录获取单元根据请求获取单元获取的用户A的上述会话访问请求,获取与所述会话访问请求相匹配的消息记录,即用户B对用户A的文章发表的评论记录,将其作为待处理的一个或多个消息记录。
在步骤S308中,确定设备1将其在步骤S304中获取的所述消息会话通过诸如http或https等约定通信方式提供至所述用户,如该用户的用户设备,供用户浏览。
在另一个优选实施例中(参考图3),以下参照图3对该优选实施例进行描述:具体地,在步骤S301中,确定设备1获取待处理的一个或多个消息记录;在步骤S301中,确定设备1获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;在步骤S309(未示出)中,确定设备1获取用户提交的会话访问请求;在步骤S310(未示出)中,确定设备1根据所述会话访问请求,在所述一个或多个消息记录中进行筛选,以获得一个或多个优选消息记录,其中,所述优选消息记录的消息相关信息与所述会话访问请求相匹配;在步骤S302中,确定设备1获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;在步骤S303中,确定设备1根据所述优选消息记录的消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;在步骤S304中,确定设备1对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话;在步骤S311(未示出)中,确定设备1将所述消息会话提供给所述用户。其中,步骤S301、步骤S302和S304与图3所示对应步骤相同或相似,故此处不再赘述,并通过引用的方式包含于此。
具体地,在步骤S309(未示出)中,确定设备1通过诸如新闻网站、论坛网站或社交网站等第三方设备所提供的应用程序接口(API)、或者通过http、https等约定通信方式获取用户通过用户设备提交的会话访问请求。其中在步骤S309(未示出)中,确定设备1与其在步骤S3011中获取用户提交的会话访问请求的方式相同,为简单起见,在此不再赘述,并通过引用的方式包含于此。
在步骤S310(未示出)中,确定设备1根据其在步骤在S309(未示出)中获取的所述会话访问请求,在其在步骤S301中获取的所述一个或多个消息记录中进行筛选,以获得一个或多个优选消息记录,其中,所述优选消息记录的消息相关信息与所述会话访问请求相匹配。例如,在步骤S310(未示出)中,确定设备1可根据其在步骤在S309(未示出)中获取的会话访问请求中特定字段所携带的会话主题信息、参与会话的特定用户的信息、会话的时间信息等,在所述一个或多个消息记录中进行筛选,以获得一个或多个优选消息记录。又如,在步骤S310(未示出)中,确定设备1还可根据其在步骤在S309(未示出)中获取的会话访问请求中特定字段所携带的发起该会话访问请求的用户的相关信息,如用户基本属性、会话访问记录、地理位置信息等,在所述一个或多个消息记录中进行筛选,以获得一个或多个优选消息记录。
本领域技术人员应能理解上述获得一个或多个优选消息记录的方法仅为举例,其他现有的或今后可能出现的获得一个或多个优选消息记录的方法如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S303中,确定设备1根据所述优选消息记录的消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录。具体地,在步骤S303中,确定设备1对优选记录获取装置获取的一个或多个优选消息记录的消息内容信息,通过诸如基于字符串匹配的方法、或者通过基于理解的分词方法、或者通过基于统计的分词方法,对所述消息内容信息进行分词处理,以获得与所述消息内容信息所对应的消息记录相对应的消息关键词,采用统计的方法,统计每一关键词出现的次数,将出现次数最多的关键词作为优选会话主题。例如,假设在步骤S310中,确定设备1获得的是在2011年10月1日至2011年10月7日期间其他用户对用户A百度空间中的相册“2011国庆旅游”的评论记录,假设在步骤S303中,确定设备1对用户G的消息内容进行分词处理后,得到关键词“鼓浪屿、漂亮”,对用户H的消息内容进行分词处理后,得到关键词“帅气、Trista”,对用户I的消息内容进行分词处理后,得到关键词“鼓浪屿”,统计得到的关键词出现的次数分别为:鼓浪屿出现2次,漂亮出现1次,帅气、Trista各出现1次,在步骤S303中,确定设备1将出现次数最多的关键词“鼓浪屿”作为会话主题。
在步骤S311(未示出)中,确定设备1将其在步骤S304中获取的所述消息会话通过诸如http或https等约定通信方式提供至所述用户,如该用户的用户设备,供用户浏览。
图4示出根据本发明一个优选实施例的用于确定消息记录中的消息会话方法流程图。
以下参照图4对该优选实施例进行描述:具体地,在步骤S401中,确定设备1获取待处理的一个或多个消息记录;在步骤S402中,确定设备1获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;在步骤S403中,确定设备1根据所述优选消息记录的消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;在步骤S404中,确定设备1对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话;在步骤S405中,确定设备1检测是否满足向用户发送所述消息会话的触发条件;当满足所述触发条件时,在步骤S406中,确定设备1确定与所述触发条件相匹配的消息会话;在步骤S407中,确定设备1将所匹配的消息会话提供给所述用户。其中,步骤S401、步骤S402、步骤S403和步骤S404与图3所示对应步骤相同或相似,故此处不再赘述,并通过引用的方式包含于此。
具体地,在步骤S405中,确定设备1通过诸如新闻网站、论坛网站或社交网站等第三方设备提供的应用程序接口(API)、或者通过JSP、ASP等动态网页技术,检测是否满足向用户发送所述消息会话的触发条件,其中,所述触发条件包括但不限于以下至少任一项:
-获取所述用户所执行的页面访问操作;
-获取所述用户发送的会话访问请求。
例如,当所述触发条件包括获取所述用户所执行的页面访问操作时,如用户登录其百度空间的网站,当其登录该网站时,在步骤S405中,确定设备1即检测到用户所执行的页面访问操作。又如,当所述触发条件包括获取所述用户发送的会话访问请求时,如用户在其空间页面通过鼠标点击提供会话主题的菜单等,在步骤S405中,确定设备1即检测到所述用户发送的会话访问请求。
本领域技术人员应能理解上述触发条件与检测是否满足向用户发送所述消息会话的触发条件的方式法仅为举例,其他现有的或今后可能出现的触发条件与检测是否满足向用户发送所述消息会话的触发条件的方式法如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
当满足所述触发条件时,在步骤S406中,确定设备1对其在步骤S404中获得的所述消息会话进行查询,确定与所述触发条件相匹配的消息会话。例如,用户A在其百度空间发表了一篇文章,在步骤S404中,确定设备1获得的所述消息会话为其他用户对用户A的该篇文章的文章内容评论为会话主题的消息会话和其他用户对用户A的该篇文章的文章标题评论为会话主题的消息会话,当用户A在其空间页面通过鼠标点击提供以文章内容评论为会话主题的菜单时,在步骤S405中,确定设备1对其在步骤S404中获得的所述消息会话进行查询,确定的是与该用户的提供以文章内容评论为会话主题的会话访问请求相匹配的消息会话。
本领域技术人员应能理解上述确定与所述触发条件相匹配的消息会话的方法仅为举例,其他现有的或今后可能出现的确定与所述触发条件相匹配的消息会话的方法如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S407中,确定设备1将其在步骤S406中确定的与所述触发条件相匹配的消息会话通过诸如http或https等约定通信方式提供至所述用户,如该用户的用户设备,供用户浏览。
优选地,当满足所述触发条件时,在步骤S406中,确定设备1对其在步骤S404中获得的所述消息会话进行查询,确定与所述触发条件相匹配的消息会话与会话主题;在步骤S407中,确定设备1将所匹配的消息会话与会话主题提供给所述用户。例如,用户登录其百度空间的网站时,在步骤S406中,确定设备1确定的是其他用户对该用户在其百度空间中发表的文章、相册等的以文章内容评论为主题、以文章标题评论为主题、以整个相册评论为主题等所有评论内容及其对应会话主题。又如,当用户在其空间页面通过鼠标点击提供以文章内容评论为会话主题的菜单时,在步骤S406中,确定设备1确定的是与该用户的提供以文章内容评论为会话主题的会话访问请求相匹配的消息会话与会话主题。
本领域技术人员应能理解上述确定与所述触发条件相匹配的消息会话与会话主题的方法仅为举例,其他现有的或今后可能出现的确定与所述触发条件相匹配的消息会话与会话主题的方法如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S407中,确定设备1将其在步骤S406中确定的与所述触发条件相匹配的消息会话与会话主题通过诸如http或https等约定通信方式提供至所述用户,如该用户的用户设备,供用户浏览。
更优选地,在步骤S405中,确定设备1检测到的获取所述用户发送的会话访问请求,其中,所述会话访问请求中还可包括会话主题的优先级信息;在步骤S407中,确定设备1根据所述优先级信息,将所匹配的消息会话与会话主题提供给所述用户。例如,用户通过用户设备向服务器发送会话访问请求时,可通过会话访问设置setting的方式设置消息会话与会话主题的优先级,如通过url参数或者post消息体发送给服务器,消息体格式使用bitmap的方式指定特定的bit位对应特定的设置。int类型有4字节,共32个比特位;最低一位设置是否提供以文章内容为主题的会话,倒数第二位设置是否提供以文章标题为主题的会话,倒数第三位设置是否使用通过优先级提供消息会话与会话主题,isLoadContent=0x01,isLoadTitle=0x02,isUsePriority=0x04,如果用尸希望只提供以文章内容为主题的会话而不提供以文章标题为主题的会话,并且使用优先级,那么上传的setting可以通过url?setting=0x05&priority=5,表明只显示priority大于5的会话主题及其对应消息会话。在此,所述会话主题的优先级信息还可在确定设备1中设置,或在与确定设备1通过网络相连接的第三方设备中设置。
本领域技术人员应能理解上述在会话访问请求中设置会话主题优先级信息的方式仅为举例,其他现有的或今后可能出现的在会话访问请求中设置会话主题优先级信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S407中,确定设备1根据所述优先级信息,将所匹配的消息会话与会话主题,通过诸如http或https等约定通信方式提供至所述用户,如该用户的用户设备,供用户浏览。
在一个优选实施例中(参考图4),以下参照图4对该优选实施例进行描述:具体地,在步骤S401中,确定设备1获取待处理的一个或多个消息记录;请求获取装置获取用户提交的会话访问请求;在步骤S402中,确定设备1获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;在步骤S403中,确定设备1根据所述优选消息记录的消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;在步骤S404中,确定设备1对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话;在步骤S405中,确定设备1检测是否满足向用户发送所述消息会话的触发条件;当满足所述触发条件时,在步骤S406中,确定设备1确定与所述触发条件相匹配的消息会话;在步骤S412(未示出)中,确定设备1获取用户的对所匹配的会话主题的选择操作;在步骤S413(未示出)中,确定设备1将与所述选择操作相对应的所述消息会话提供给所述用户。其中,步骤S401、步骤S402、步骤S403、步骤S404、步骤S405、步骤S406与图4所示对应装置步骤相同或相似,故此处不再赘述,并通过引用的方式包含于此。
具体地,在步骤S412(未示出)中,确定设备1通过诸如新闻网站、论坛网站或社交网站等第三方设备提供的应用程序接口(API),或者通过JSP、ASP等动态网页技术获取用户的对所匹配的会话主题的选择操作。例如,用户A在其百度空间中发表了一篇题名为《分布式系统-PNUTS》的文章,当其登陆该空间时,鼠标悬浮于空间网页上任何位置处,展现可选择菜单,如按对文章的内容评论为会话主题、按对文章的标题评论为会话主题等,用户点击相应菜单,在步骤S412(未示出)中,确定设备1即获取了用户的对所匹配的会话主题的选择操作。
本领域技术人员应能理解上述获取用户对所述一个或多个会话主题的选择操作的方式仅为举例,其他现有的或今后可能出现的获取用户对所述一个或多个会话主题的选择操作的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S413(未示出)中,确定设备1将与其在步骤S412中获取的所述选择操作相对应的所述消息会话,通过诸如http或https等约定通信方式提供至所述用户,如该用户的用户设备,供用户浏览。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (20)

1.一种由计算机实现的用于确定消息记录中的消息会话的方法,其中,该方法包括以下步骤:
a获取待处理的一个或多个消息记录;
b获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;
c根据所述消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;
d对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话。
2.根据权利要求1所述的方法,其中,所述步骤c包括:
-对所述消息内容信息进行分词处理,以获得与所述消息内容信息所对应的消息记录相对应的消息关键词;
-根据所述消息关键词及其对应的候选主题的概率,确定所述消息记录所对应的候选主题;
-根据所述候选主题,所述消息记录进行分类处理,以获得一个或多个消息分类及其会话主题,其中,每个消息分类包括一个或多个所述消息记录。
3.根据权利要求1所述的方法,其中,所述步骤c包括:
-对所述消息内容信息进行分词处理,以获得与所述消息内容信息所对应的消息记录相对应的消息关键词;
-根据所述消息关键词,对所述消息记录进行聚类处理,以获得一个或多个消息聚类及其会话主题,其中,每个消息聚类包括一个或多个所述消息记录。
4.根据权利要求1至3中任一项所述的方法,其中,所述步骤c包括:
-根据所述消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;
-从所述一个或多个会话主题中筛选出优选会话主题;
其中,所述步骤d包括:
-对于所述优选会话主题,将与所述优选会话主题相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述优选会话主题相对应的消息会话。
5.根据权利要求1至4中任一项所述的方法,其中,所述步骤a包括:
-获取用户提交的会话访问请求;
-根据所述会话访问请求,获取与所述会话访问请求相匹配的消息记录,以作为待处理的一个或多个消息记录;
其中,该方法还包括:
-将所述消息会话提供给所述用户。
6.根据权利要求1至4中任一项所述的方法,其中,该方法还包括:
-获取用户提交的会话访问请求;
-根据所述会话访问请求,在所述一个或多个消息记录中进行筛选,以获得一个或多个优选消息记录,其中,所述优选消息记录的消息相关信息与所述会话访问请求相匹配;
其中,所述步骤c包括:
-根据所述优选消息记录的消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;
其中,该方法还包括:
-将所述消息会话提供给所述用户。
7.根据权利要求1至6中任一项所述的方法,其中,该方法还包括:
-检测是否满足向用户发送所述消息会话的触发条件;
x当满足所述触发条件时,确定与所述触发条件相匹配的消息会话;
y将所匹配的消息会话提供给所述用户;
其中,所述触发条件包括以下至少任一项:
-获取所述用户所执行的页面访问操作;
-获取所述用户发送的会话访问请求。
8.根据权利要求7所述的方法,其中,所述步骤x包括:
-当满足所述触发条件时,确定与所述触发条件相匹配的消息会话与会话主题;
其中,所述步骤y包括:
-将所匹配的消息会话与会话主题提供给所述用户。
9.根据权利要求8所述的方法,其中,所述触发条件包括获取所述用户发送的会话访问请求,其中,所述会话访问请求中包括会话主题的优先级信息;
其中,所述步骤y包括:
-根据所述优先级信息,将所匹配的消息会话与会话主题提供给所述用户。
10.根据权利要求8或9所述的方法,其中,该方法还包括:
-获取用户的对所匹配的会话主题的选择操作;
-将与所述选择操作相对应的所述消息会话提供给所述用户。
11.一种用于确定消息记录中的消息会话的设备,其中,该设备包括:
记录获取装置,用于获取待处理的一个或多个消息记录;
信息获取装置,用于获取所述消息记录的记录相关信息,其中,所述记录相关信息包括所述消息记录的消息索引信息与消息内容信息;
主题确定装置,用于根据所述消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;
会话获取装置,用于对于所述一个或多个会话主题中至少一个,将与所述一个或多个会话主题中至少一个相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述一个或多个会话主题中至少一个相对应的消息会话。
12.根据权利要求11所述的设备,其中,所述主题确定装置用于:
-对所述消息内容信息进行分词处理,以获得与所述消息内容信息所对应的消息记录相对应的消息关键词;
-根据所述消息关键词及其对应的候选主题的概率,确定所述消息记录所对应的候选主题;
-根据所述候选主题,所述消息记录进行分类处理,以获得一个或多个消息分类及其会话主题,其中,每个消息分类包括一个或多个所述消息记录。
13.根据权利要求11所述的设备,其中,所述主题确定装置用于:
-对所述消息内容信息进行分词处理,以获得与所述消息内容信息所对应的消息记录相对应的消息关键词;
-根据所述消息关键词,对所述消息记录进行聚类处理,以获得一个或多个消息聚类及其会话主题,其中,每个消息聚类包括一个或多个所述消息记录。
14.根据权利要求11至13中任一项所述的设备,其中,所述主题确定装置用于:
-根据所述消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;
-从所述一个或多个会话主题中筛选出优选会话主题;
其中,所述会话获取装置用于:
-对于所述优选会话主题,将与所述优选会话主题相对应的所述消息记录,按所述消息索引信息进行聚合,以获得与所述优选会话主题相对应的消息会话。
15.根据权利要求11至14中任一项所述的设备,其中,所述记录获取装置包括:
请求获取单元,用于获取用户提交的会话访问请求;
记录获取单元,用于根据所述会话访问请求,获取与所述会话访问请求相匹配的消息记录,以作为待处理的一个或多个消息记录;
其中,该设备还包括:
第一提供装置,用于将所述消息会话提供给所述用户。
16.根据权利要求11至14中任一项所述的设备,其中,该设备还包括:
请求获取装置,用于获取用户提交的会话访问请求;
优选记录获取装置,用于根据所述会话访问请求,在所述一个或多个消息记录中进行筛选,以获得一个或多个优选消息记录,其中,所述优选消息记录的消息相关信息与所述会话访问请求相匹配;
其中,所述主题确定装置用于:
-根据所述优选消息记录的消息内容信息,确定一个或多个会话主题,其中,每个会话主题对应一个或多个所述消息记录;
其中,该设备还包括:
第二提供装置,用于将所述消息会话提供给所述用户。
17.根据权利要求11至16中任一项所述的设备,其中,该设备还包括:
检测装置,用于检测是否满足向用户发送所述消息会话的触发条件;
会话确定装置,用于当满足所述触发条件时,确定与所述触发条件相匹配的消息会话;
第三提供装置,用于将所匹配的消息会话提供给所述用户;
其中,所述触发条件包括以下至少任一项:
-获取所述用户所执行的页面访问操作;
-获取所述用户发送的会话访问请求。
18.根据权利要求17所述的设备,其中,所述会话确定装置用于:
-当满足所述触发条件时,确定与所述触发条件相匹配的消息会话与会话主题;
其中,所述第三提供装置用于:
-将所匹配的消息会话与会话主题提供给所述用户。
19.根据权利要求18所述的设备,其中,所述触发条件包括获取所述用户发送的会话访问请求,其中,所述会话访问请求中包括会话主题的优先级信息;
其中,所述第三提供装置用于:
-根据所述优先级信息,将所匹配的消息会话与会话主题提供给所述用户。
20.根据权利要求18或19所述的设备,其中,该设备还包括:
选择操作获取装置,用于获取用户的对所匹配的会话主题的选择操作;
第四提供装置,用于将与所述选择操作相对应的所述消息会话提供给所述用户。
CN2012100893591A 2012-03-29 2012-03-29 一种用于确定消息记录中的消息会话的方法和设备 Pending CN102646134A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100893591A CN102646134A (zh) 2012-03-29 2012-03-29 一种用于确定消息记录中的消息会话的方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100893591A CN102646134A (zh) 2012-03-29 2012-03-29 一种用于确定消息记录中的消息会话的方法和设备

Publications (1)

Publication Number Publication Date
CN102646134A true CN102646134A (zh) 2012-08-22

Family

ID=46658953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100893591A Pending CN102646134A (zh) 2012-03-29 2012-03-29 一种用于确定消息记录中的消息会话的方法和设备

Country Status (1)

Country Link
CN (1) CN102646134A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104035961A (zh) * 2014-05-09 2014-09-10 北京航空航天大学 社交网络群体识别方法和系统
CN104065628A (zh) * 2013-03-22 2014-09-24 腾讯科技(深圳)有限公司 会话处理方法和装置
CN104915359A (zh) * 2014-03-14 2015-09-16 华为技术有限公司 主题标签推荐方法及装置
CN105450497A (zh) * 2014-07-31 2016-03-30 国际商业机器公司 生成聚类模型以及基于该聚类模型进行聚类的方法和装置
CN106034065A (zh) * 2015-03-13 2016-10-19 腾讯科技(深圳)有限公司 信息展示方法及装置
CN107636651A (zh) * 2015-08-24 2018-01-26 谷歌有限责任公司 使用自然语言处理生成主题索引
CN108491135A (zh) * 2018-03-14 2018-09-04 北京达佳互联信息技术有限公司 信息展示方法、装置、计算机设备和存储介质
CN108632127A (zh) * 2017-03-15 2018-10-09 阿里巴巴集团控股有限公司 会话筛选方法及装置
WO2018188347A1 (zh) * 2017-04-11 2018-10-18 武汉斗鱼网络科技有限公司 信息交互方法及装置
CN110545233A (zh) * 2019-08-09 2019-12-06 五八有限公司 一种信息推送方法、装置、电子设备及存储介质
CN112612391A (zh) * 2020-12-28 2021-04-06 维沃移动通信有限公司 消息处理方法、装置和电子设备
CN112769673A (zh) * 2019-11-05 2021-05-07 钉钉控股(开曼)有限公司 沟通记录的生成、推荐和展示方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001090947A1 (en) * 2000-05-22 2001-11-29 Overture Services, Inc. Method and apparatus for identifying related searches in a database search system
CN101119326A (zh) * 2006-08-04 2008-02-06 腾讯科技(深圳)有限公司 一种即时通信会话记录的管理方法及装置
CN101506767A (zh) * 2005-04-22 2009-08-12 谷歌公司 相对于分类体系来分类诸如文档和/或聚类的对象以及从这种分类导出的数据结构
CN101593200A (zh) * 2009-06-19 2009-12-02 淮海工学院 基于关键词频度分析的中文网页分类方法
CN102073641A (zh) * 2009-11-19 2011-05-25 富士通株式会社 对消费者生成媒体信息进行处理的方法、装置和程序
CN102117321A (zh) * 2010-01-06 2011-07-06 微软公司 主题区讨论的自动发现聚集和组织

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001090947A1 (en) * 2000-05-22 2001-11-29 Overture Services, Inc. Method and apparatus for identifying related searches in a database search system
CN101506767A (zh) * 2005-04-22 2009-08-12 谷歌公司 相对于分类体系来分类诸如文档和/或聚类的对象以及从这种分类导出的数据结构
CN101119326A (zh) * 2006-08-04 2008-02-06 腾讯科技(深圳)有限公司 一种即时通信会话记录的管理方法及装置
CN101593200A (zh) * 2009-06-19 2009-12-02 淮海工学院 基于关键词频度分析的中文网页分类方法
CN102073641A (zh) * 2009-11-19 2011-05-25 富士通株式会社 对消费者生成媒体信息进行处理的方法、装置和程序
CN102117321A (zh) * 2010-01-06 2011-07-06 微软公司 主题区讨论的自动发现聚集和组织

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104065628A (zh) * 2013-03-22 2014-09-24 腾讯科技(深圳)有限公司 会话处理方法和装置
CN104915359A (zh) * 2014-03-14 2015-09-16 华为技术有限公司 主题标签推荐方法及装置
CN104915359B (zh) * 2014-03-14 2019-05-28 华为技术有限公司 主题标签推荐方法及装置
CN104035961A (zh) * 2014-05-09 2014-09-10 北京航空航天大学 社交网络群体识别方法和系统
CN104035961B (zh) * 2014-05-09 2017-06-06 北京航空航天大学 社交网络群体识别方法和系统
CN105450497A (zh) * 2014-07-31 2016-03-30 国际商业机器公司 生成聚类模型以及基于该聚类模型进行聚类的方法和装置
CN106034065A (zh) * 2015-03-13 2016-10-19 腾讯科技(深圳)有限公司 信息展示方法及装置
CN107636651A (zh) * 2015-08-24 2018-01-26 谷歌有限责任公司 使用自然语言处理生成主题索引
CN108632127A (zh) * 2017-03-15 2018-10-09 阿里巴巴集团控股有限公司 会话筛选方法及装置
US11018882B2 (en) 2017-03-15 2021-05-25 Alibaba Group Holding Limited Session filtering method and device
WO2018188347A1 (zh) * 2017-04-11 2018-10-18 武汉斗鱼网络科技有限公司 信息交互方法及装置
CN108491135A (zh) * 2018-03-14 2018-09-04 北京达佳互联信息技术有限公司 信息展示方法、装置、计算机设备和存储介质
CN110545233A (zh) * 2019-08-09 2019-12-06 五八有限公司 一种信息推送方法、装置、电子设备及存储介质
CN110545233B (zh) * 2019-08-09 2022-03-04 五八有限公司 一种信息推送方法、装置、电子设备及存储介质
CN112769673A (zh) * 2019-11-05 2021-05-07 钉钉控股(开曼)有限公司 沟通记录的生成、推荐和展示方法及装置
CN112612391A (zh) * 2020-12-28 2021-04-06 维沃移动通信有限公司 消息处理方法、装置和电子设备
CN112612391B (zh) * 2020-12-28 2022-06-10 维沃移动通信有限公司 消息处理方法、装置和电子设备

Similar Documents

Publication Publication Date Title
CN102646134A (zh) 一种用于确定消息记录中的消息会话的方法和设备
US11397784B2 (en) Structured user graph to support querying and predictions
Simpson et al. Zooniverse: observing the world's largest citizen science platform
US10776885B2 (en) Mutually reinforcing ranking of social media accounts and contents
CN109983455A (zh) 在在线社交网络上多样化媒体搜索结果
US20120042020A1 (en) Micro-blog message filtering
US20200159764A1 (en) Method for Processing and Displaying Real-Time Social Data on Map
CN102713965A (zh) 数据源的可缩放主题聚集
CN105144165B (zh) 用于增强搜索结果的社交注释
JP6563428B2 (ja) 検索結果におけるライブ事象の画面表示
JP2016177764A (ja) 施設推定方法、デバイス及びプログラム
TW200951734A (en) Social aspects of content aggregation, syndication, sharing, and updating
CN103891245A (zh) 位置知晓的内容检测
Vickey et al. Twitter classification model: the ABC of two million fitness tweets
US11586635B2 (en) Methods and systems for ranking comments on a post in an online service
US20130110865A1 (en) Image Endorsements
WO2020033117A9 (en) Dynamic and continous onboarding of service providers in an online expert marketplace
CN105474203A (zh) 文档的上下文搜索
CN106796599A (zh) 基于附近位置解释用户查询
CN109033447B (zh) 一种人脸识别数据可视化系统
JP7003481B2 (ja) ソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランキング
Lutu Web 2.0 computing and social media as solution enablers for economic development in Africa
KR20140099154A (ko) 재능기부 및 요청 시스템
Oduor Software architectures for social influence: analysis of Facebook, Twitter, Yammer and FourSquare
DE112015004704T5 (de) Identifizieren von Lernsituationen für die Kontextsuche

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120822