CN104252461A - 监测感兴趣主题的方法和系统 - Google Patents

监测感兴趣主题的方法和系统 Download PDF

Info

Publication number
CN104252461A
CN104252461A CN201310257892.9A CN201310257892A CN104252461A CN 104252461 A CN104252461 A CN 104252461A CN 201310257892 A CN201310257892 A CN 201310257892A CN 104252461 A CN104252461 A CN 104252461A
Authority
CN
China
Prior art keywords
interest
subject
node
group
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310257892.9A
Other languages
English (en)
Other versions
CN104252461B (zh
Inventor
严骏驰
王俞
龚旻
胡国强
齐轶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CN201310257892.9A priority Critical patent/CN104252461B/zh
Priority to US14/297,770 priority patent/US9584608B2/en
Publication of CN104252461A publication Critical patent/CN104252461A/zh
Priority to US15/277,088 priority patent/US9912769B2/en
Application granted granted Critical
Publication of CN104252461B publication Critical patent/CN104252461B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/216Handling conversation history, e.g. grouping of messages in sessions or threads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Computer Hardware Design (AREA)
  • Multimedia (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Cardiology (AREA)

Abstract

本发明公开了一种监测感兴趣主题的方法和系统,该方法包括:基于感兴趣主题的第一集合,选择参与所述第一集合中的一个或多个感兴趣主题的至少一个关键节点组成的关键节点的组;以及监视所述组中的一个或多个关键节点所发布的内容,以找到感兴趣主题的第二集合。根据本发明的各个实施例,通过基于感兴趣主题的第一集合,选择参与第一集合中的一个或多个感兴趣主题的关键节点的组,作为要监视的对象,从而相比于监视所有用户节点而减少了要监视的节点所发布的内容的数量,使得能够高效、低成本和实时地找到诸如热点新闻或热点事件的感兴趣主题。

Description

监测感兴趣主题的方法和系统
技术领域
本发明涉及监测感兴趣主题的方法和系统,更具体地,涉及一种在社交网络中通过选择关键节点来监测感兴趣主题的方法和系统。
背景技术
随着诸如Twitter、微博等社交网络的出现,人与人之间的信息分享和交流变得越来越方便。人们可以在社交网络上发表帖子、转发或评论别人发表的帖子,从而与他人分享新闻或实时事件的信息,并交换他们的看法。据称,Twitter具有超过约5亿的活跃用户,且每天产生超过约3.4亿的tweet帖子,而新浪微博也具有超过约3亿的注册用户,且每天产生约1亿条微博。监测这些帖子或微博中的热点新闻或事件可以帮助决策者更好地了解公众意愿和商业趋势等等,但是,如何在如此巨大的帖子或微博量中监测诸如热点新闻或事件的感兴趣主题成为难题。传统的感兴趣主题的监测是通过提取全部用户节点的全部帖子或微博,从所有帖子或微博中进行内容处理、例如关键字检测等,来找到诸如热点新闻或事件的感兴趣主题,然而,这样的大数量的内容处理耗时且低效。
发明内容
根据本发明的一个方面,提供了一种监测感兴趣主题的方法,包括:基于感兴趣主题的第一集合,选择参与所述第一集合中的一个或多个感兴趣主题的至少一个关键节点来组成关键节点的组;以及监视所述组中的一个或多个关键节点所发布的内容,以找到感兴趣主题的第二集合。
根据本发明的另一个方面,提供了一种监测感兴趣主题的系统,包括:选择装置,被配置为基于感兴趣主题的第一集合,选择参与所述第一集合中的一个或多个感兴趣主题的至少一个关键节点来组成关键节点的组;以及监视装置,被配置为监视所述组中的一个或多个关键节点所发布的内容,以找到感兴趣主题的第二集合。
根据本发明的各个方面,通过基于感兴趣主题的第一集合,选择参与第一集合中的一个或多个感兴趣主题的至少一个关键节点来组成关键节点的组,作为要监视的对象,从而相比于监视所有用户节点而减少了要监视的节点所发布的内容的数量,使得能够高效、低成本和实时地找到诸如热点新闻或热点事件的感兴趣主题。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。
图2示出了根据本发明的一个实施例的监测感兴趣主题的方法的流程图。
图3示出了应用图2所示的监测感兴趣主题的方法的框架示意例子。
图4示出了应用图2所示的监测感兴趣主题的方法的时序示意例子。
图5示出了根据本发明的另一个实施例的监测感兴趣主题的系统的方框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
所属技术领域的技术人员知道,本发明可以实现为系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,这些计算机程序指令通过计算机或其它可编程数据处理装置执行,产生了实现流程图和/或框图中的方框中规定的功能/操作的装置。
也可以把这些计算机程序指令存储在能使得计算机或其它可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令就产生出一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置(instruction means)的制造品(manufacture)。
也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其它可编程装置上执行的指令能够提供实现流程图和/或框图中的方框中规定的功能/操作的过程。
图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图1所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图1未显示,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
现在参考图2。图2示出了根据本发明的一个实施例的监测感兴趣主题的方法200的流程图。图2中的监测感兴趣主题的方法200包括:步骤S201,基于感兴趣主题的第一集合,选择参与所述第一集合中的一个或多个感兴趣主题的至少一个关键节点来组成关键节点的组;以及步骤S202,监视所述组中的一个或多个关键节点所发布的内容,以找到感兴趣主题的第二集合。
根据本发明的该实施例,通过基于感兴趣主题的第一集合,选择参与第一集合中的一个或多个感兴趣主题的至少一个关键节点来组成关键节点的组,作为要监视的对象,从而相比于监视所有用户节点而减少了要监视的节点所发布的内容的数量,使得能够高效、低成本和实时地找到诸如热点新闻或热点事件的感兴趣主题。
注意,在一个实施例中,感兴趣主题的第一集合可以是在第一特定时间段T1内的已知感兴趣主题的集合,其可以通过多种已知方式从以下信息源获取:例如,在第一特定时间段T1内(例如,在星期六和星期日两天中)累积的来自诸如央视等新闻节目的已知的新闻、来自诸如新浪、搜狐等新闻门户网站的已知的热点新闻排名信息等、来自诸如百度、谷歌等搜索引擎网站的已知的搜索关键字排名信息等、来自新浪微博、腾讯微博、Twitter、开心网等社交网站的已知的热点关注新闻事件排名信息等等。即,在第一特定时间段T1内的已知感兴趣主题的第一集合可以包括在第一特定时间段T1内的媒体的热点新闻、搜索网站的搜索排名事件、社交网站的热点事件中的一种或多种。当然,该感兴趣主题的第一集合还可以通过其他外来的导向性信息来获得。如此,这样的该感兴趣主题的第一集合可以作为在所有用户节点中选择少量关键用户节点的基础。作为一个例子,假设,该感兴趣主题的第一集合是10个感兴趣主题,{S1,S2……S10}。
在一个实施例中,所述感兴趣主题的第二集合可以是在不同于所述第一特定时间段T1的第二特定时间段T2内找到的感兴趣主题的集合。这只是示例,而感兴趣主题的第二集合可以是在时间上与感兴趣主题的第一集合不同的集合(如上所述),也可以是在同一时段(T1和T2相同)内的在包含的主题上与感兴趣主题的第一集合不同的集合。例如,在通过在第一特定时间段T1中收集到的感兴趣主题的第一集合得到关键节点的组的情况下,可以通过在第一特定时间段T1之后的一段时间(例如,第二特定时间段T2)内监视该关键节点的组发布的内容,来找到在第一特定时间段T1之后的一段时间(例如,第二特定时间段T2)内的新的热点新闻事件的感兴趣主题的第二集合。或者例如,在通过在第一特定时间段T1中收集到的感兴趣主题的第一集合得到关键节点的组的情况下,可以仍然通过监视该关键节点的组在该第一特定时间段T1(T1和T2相同)内发布的内容,来找到在所包含的主题上与该感兴趣主题的第一集合不同的第二集合。总之,术语“感兴趣主题的第二集合”不限于在时间上与第一集合不同的第二集合(由于例如某些热点新闻事件持续受到广泛关注等,第一集合和第二集合在所包含的主题上可能相同),还可以包括在所包含的主题上与第一集合不同的第二集合(例如,第一集合和第二集合在时间上可能相同)。当然,在本公开的各个实施例中,以该“感兴趣主题的第二集合”是在时间上比第一集合更新的第二集合作为例子来进行描述,但本发明不限于此。
在一个实施例中,还可以基于如下中的一种或多种来进行该步骤S201:要选择的所述组中的关键节点的个数Nnode的限制L1;以及要选择的所述组中的关键节点所发布的内容的总数Npost的限制L2。也就是说,在选择关键节点的组的选择步骤中,可以限制这些关键节点的个数和其所发布的内容总数,从而减少监视这些关键节点和其发布的内容的工作量,降低成本,加快找到感兴趣主题的速度。当然这种限制也不是必要的,可以根据实际情况来决定是否进行限制、进行何种程度的限制等等。
注意,本公开中提到的节点“发布”内容可以包括用户节点发表新内容、转发其他用户节点发表的内容、评论其他用户节点发布的内容等等,但该“发布”不限于此,“发布”内容还可以包括例如参加某个热点活动讨论(例如,某个明星的专访)、发表帖子时添加例如涉及某个热点事件新闻的关键字标识(例如“#以色列游客拍到美人鱼#”等)、以及未来可能出现的其他与“产生”内容相关的方式等等。
这样,通过已知的各个热点新闻事件作为感兴趣主题的第一集合,可以基于已知的感兴趣主题来选择参与这些已知的感兴趣主题的少量关键用户节点,从而假定如此选择的这些少量关键用户节点可能是参与已知的热点新闻事件的活跃用户,那么也可以推测这样的活跃用户同样也可能会持续地关注新的热点新闻事件。在该情况下,监视活跃的少量关键用户节点发布的内容,可以更快速有效且低成本地找到新的热点新闻事件的感兴趣主题的第二集合。
在一个实施例中,该基于感兴趣主题的第一集合,选择参与所述第一集合中的一个或多个感兴趣主题的至少一个关键节点来组成关键节点的组的步骤S201可以包括:步骤S2011(未示出),获取参与所述第一集合中的一个或多个感兴趣主题的多个参与节点;以及步骤S2012(未示出),从所述多个参与节点中,选择由满足第一特定条件的至少一个参与节点组成的组作为所述关键节点的组。
如上所述,参与某一感兴趣主题的参与节点可以是在从首次发布该感兴趣主题开始的第三特定时间段T3内、发布与该感兴趣主题相关的内容的节点。例如,一个参与节点在首次发布感兴趣主题S1开始的例如较短时间段内发表、转发或评论等该感兴趣主题S1,这可以一定程度上说明该参与节点对于该感兴趣主题S1是活跃的。当然,对于该第三特定时间段T3的长短的设置可以调整该参与节点的活跃性程度,例如,T3越短,所获得的参与节点越活跃。当然,本发明不限于此,还可以通过其他方式来获取参与所述感兴趣主题的参与节点,例如检查节点发布的内容中是否涉及感兴趣主题的关键字、检查用户节点是否参加了例如社交网络上组织的该感兴趣主题的热点活动讨论、未来可能出现的其他参与方式等等。另外,参与所述感兴趣主题的参与节点还可以通过其他时间段来获取,例如参与节点还可以是在对该感兴趣主题讨论得较为活跃或最活跃的一段时间内发布与该感兴趣主题相关的内容的节点,等等。当然,该参与节点也可以与时间无关,只要该节点参与过感兴趣主题的讨论即可。本领域技术人员还可以构想很多其他的实施方式来限定和获取该参与节点。
该步骤S2012可以进一步减少所要监视的节点所发布的内容的数量。具体地,在该步骤S2012中,从参与感兴趣主题的第一集合的所有参与节点中,选择满足第一特定条件的参与节点的一个组(一般少于所有参与节点)作为关键节点的组,因此通过监视该少于所有参与节点的一个组,可以减少所要监视的内容的数量。
当然,该步骤S2012并非必要步骤,而该步骤S201也可以仅包括选择参与感兴趣主题的第一集合的所有参与节点的步骤S2011,因为这样选择的所有参与节点也比全部注册的用户节点的数量少,在一定程度上可以实现减少监视的内容的数量的效果。
在一个实施例中,该步骤S2012中的第一特定条件可以包括使得所述参与节点组成的组覆盖所述第一集合的覆盖效益满足如下中的一种:所述覆盖效益大于第一特定阈值;和所述覆盖效益最大。在这里,所述覆盖效益可以表示所述参与节点组成的组所发布的内容覆盖感兴趣主题的第一集合的程度。该覆盖效益越大,则可以表示所述参与节点组成的组所发布的内容覆盖感兴趣主题的第一集合的程度越广(即,监视该参与节点的组所发布的内容可以得到更全面的感兴趣主题)。
在一个实施例中,在步骤S2012中,所述参与节点的组覆盖所述第一集合的覆盖效益可以通过如下公式计算:G=αRcovered+βRuncovered,其中,G是覆盖效益,α、β分别是权重常数,Rcovered是与所述组所覆盖的感兴趣主题相关的发布内容的数量有关的效率系数,而Runcovered是与所述组未覆盖的感兴趣主题相关的发布内容的数量有关的广度系数。在此,上述公式所计算得到的所述参与节点的组覆盖所述第一集合的覆盖效益G可以反映所述参与节点组成的组所发布的内容覆盖感兴趣主题的第一集合的程度,该覆盖效益越大,则表示所述参与节点组成的组所发布的内容覆盖感兴趣主题的第一集合的程度越广(即,监视该参与节点的组可以得到更全面的感兴趣主题)。当然,上述公式G=αRcovered+βRuncovered仅是示例,本领域技术人员还可以构思其他方式来反映参与节点组成的组所发布的内容覆盖感兴趣主题的第一集合的程度,例如G可以等于与所述组所覆盖的感兴趣主题相关的发布内容的数量、与所述组未覆盖的感兴趣主题相关的发布内容的数量、或与感兴趣主题的第一集合中所有感测器主题相关的发布内容的数量等等。
在一个实施例中,在步骤S2012中,“所述组所覆盖的感兴趣主题”可以是在所述组中参与所述感兴趣主题的参与节点的数量大于第二特定阈值U2的感兴趣主题。例如,如上所述,假设存在10个已知的感兴趣主题,S1,S2,……S10。假设,在参与所有这些感兴趣主题S1,S2,……S10的所有参与节点中选择的某一组中,参与感兴趣主题S1的参与节点的数量为A1,参与感兴趣主题S2的参与节点的数量为A2,……参与感兴趣主题S10的参与节点的数量为A10。其中,A1>U2,A10>U2,因此,可以确定感兴趣主题S1和S10是该组所覆盖的感兴趣主题。相反,“所述组未覆盖的感兴趣主题”可以是在所述组中参与所述感兴趣主题的参与节点的数量小于或等于第二特定阈值U2的感兴趣主题,在该例中,是感兴趣主题S2……S9
在一个实施例中,可以通过下列公式来计算上述效率系数Rcovered和广度系数Runcovered
R covered = N post c N post t , R uncovered = N post u N post t * N u ,
其中,表示所述组所覆盖的感兴趣主题相关的发布内容的数量,表示所述组所发布的所有内容的数量,表示所述组未覆盖的感兴趣主题相关的发布内容的数量,Nu表示所述组未覆盖的感兴趣主题的数量。当然,这些公式仅是示例,还可以构思其他公式来体现所述组所覆盖的感兴趣主题相关的发布内容的数量和所述组未覆盖的感兴趣主题相关的发布内容的数量对覆盖效益的影响。
可见,Rcovered越大,则可以表示该组中的参与节点对于感兴趣主题的第一集合的关注效率越高,也就是说,该组中的参与节点能够较集中地关注感兴趣主题的第一集合中的所覆盖的感兴趣主题,而Runcovered越大,则可以表示该组中的参与节点对于感兴趣主题的第一集合的关注广度越大,也就是说,该组中的参与节点能够更广泛地关注在第一集合中除了覆盖的感兴趣主题以外的其他感兴趣主题。因此,可以根据关注效率和关注广度的不同侧重,来选择权重α、β的大小。
在一个实施例中,监视所述组中的一个或多个关键节点所发布的内容,以找到感兴趣主题的第二集合的步骤S202可以包括:步骤S2021(未示出),获取所述组中的一个或多个关键节点在第二特定时间段T2内所发布的内容;步骤S2022(未示出)比较所述所发布的一个或多个内容所包含的一个或多个主题的各自的内容数量;步骤S2023(未示出),从所述一个或多个主题中,添加如下的至少一个主题到所述感兴趣主题的第二集合中:内容数量大于第三特定阈值U3的主题;以及内容数量从大到小排列的排名靠前的特定数量的主题。
在此,术语“发布的内容所包含的一个或多个主题”可以指的是从一些发布的内容中提取的一个或多个主题(例如,一些内容都包含某一主题的关键字、或一些内容都包含某一主题的完整信息等等)。例如,从包含关键字“#以色列游客拍到美人鱼#”的内容、包含该以色列游客拍到美人鱼的主题的完整新闻全文的内容、包含该以色列游客拍到美人鱼的主题的视频的内容等等中提取主题“以色列游客拍到美人鱼”。也就是说,涉及某一主题的内容可以相互不完全逐字相同,而是只要这些内容在某种程度上涉及了该主题即可。从而,可以从众多发布的内容中提取所包含的一个或多个主题,例如“以色列游客拍到美人鱼”、“美国河流鲤鱼泛滥成灾”、“#中国新声代#10岁女孩唱麻全场”等等。
通过上述步骤S2021、S2022和S2023,可以找到被涉及的内容数量较多(大于某一阈值或从大到小排列的前几名)的某一或某些主题(作为感兴趣主题的第二集合),而这样的某一或某些主题可以被认为是较为热点的感兴趣主题,从而这样的热点的感兴趣主题的第二集合可以通过监视少量的关键节点和其所发布的内容来高效、低成本地来找到。
在一个实施例中,可选地,方法200还可以包括:步骤S203(未示出),基于所述感兴趣主题的第二集合,更新所述关键节点的组。具体地,随着时间的推移,在某个时间段(例如,在上述提到的第二特定时间段T2)内,通过监视关键节点的组找到感兴趣主题的第二集合,但例如在该时间段(例如,第二特定时间段T2)之后,有些曾经积极参与感兴趣主题的第一集合的关键节点可能不再是积极参与该感兴趣主题的第二集合的活跃用户了,因此,通过基于所述感兴趣主题的第二集合来更新所述关键节点的组,可以保持该关键节点的组的活跃性。注意,该更新步骤S203可以在上述第二特定时间段T2之后进行。当然,更新的基础也不限于该感兴趣主题的第二集合,更新的基础也可以是当前的从新闻门户网站、新闻媒体、社交网站、搜索网站等已知信息源获得的某个已知的感兴趣主题的集合,本发明不限于此。
在一个实施例中,该基于所述感兴趣主题的第二集合,更新所述关键节点的组的步骤S203可以包括以下中的一种或多种:删除满足第二特定条件的节点;以及增加参与所述第二集合中的一个或多个感兴趣主题的新的关键节点。在步骤S203中的该增加新的关键节点的具体实施方式可以与步骤S201的选择关键节点的具体实施方式相类似,例如通过计算覆盖效益等等。当然,更新关键节点的组的步骤S203也不限于此,本领域技术人员还可以构思更新关键节点的组的其他具体步骤,例如但不限于删除水军节点(以下还将讨论),删除僵尸节点(以下还将讨论)等。
在一个实施例中,在该步骤S203中的上述第二特定条件可以包括以下中的一种或多种:节点的节点质量小于第四特定阈值;以及节点的节点质量从小到大排列的排名靠前。所述节点的节点质量可以表示通过监视该节点发布的内容能找到一个或多个感兴趣主题的效率。节点质量越好,则该监视该节点能找到一个或多个期望的感兴趣主题的效率越高,即通过监视该节点发布的越少的内容可以找到越多的感兴趣主题。当然,该第二特定条件还可以是其他条件,例如,发帖很少的节点可以考虑被删除,例如,“水军节点”或“僵尸节点”(以下还将描述)可以考虑被删除,等等。本领域技术人员可以构想其他条件作为该第二特定条件来删除一些不必要的节点。
在一个实施例中,在该步骤S203中,所述节点质量可以通过例如如下公式来计算:
Q ( i ) = a * N post S ( i ) N post S ( all ) + b * N post S ( i ) N post All ( i ) ,
其中,Q(i)表示关键节点i的节点质量,a、b是常数权重,表示关键节点i发布的与所述第二集合中的一个或多个感兴趣主题S相关的内容的数量,表示所述关键节点的组中所有关键节点所发布的与所述第二集合中的一个或多个感兴趣主题S相关的内容的数量,表示该关键节点i所发布的所有内容的总数量。当然,节点质量的计算方法也不限于此,本领域技术人员可以构思其他计算节点质量的方法来反映监视该节点发布的内容能找到一个或多个感兴趣主题的效率。
上述提到的术语“水军节点”往往指的是为了某种商业目的而产生的节点,它们通常不或很少参与热点新闻事件的讨论,而是主要为了推广某个商业产品为目的来发布内容。水军节点可以通过以下中的一种或多种来判断:多个节点的账户名称之间是否具有超过特定数量的重叠的子名字;和节点是否在从首次发布商业推广主题开始的较短时间内密集地发布了与商业推广主题相关的内容,而发布的与感兴趣主题相关的内容的数量小于特定值。当然,水军节点的判断方法也不限于此,本领域技术人员可以构思其他判断水军节点的方法。
上述提到的术语“僵尸节点”往往指的是通常为了增加某个用户节点的关注数而产生的虚假用户节点。这样的僵尸节点通常可以通过其发表的内容的数量是否较少、发表的内容的时间间隔是否较长、是否大多数转发内容而不原创内容等等因素来判断。当然判断僵尸节点的方式也不限于此,还可以构思其他方式来判断僵尸节点。
如此,通过经常地更新关键节点的组,使得关键节点的组中的关键节点保持活跃性,从而能够基于更新的关键节点的组来更实时、更准确地找到新近关注的感兴趣主题。
图3示出了应用图2所示的监测感兴趣主题的方法200的框架示意例子。
具体地,如图3所示,在图2所示的方法200的步骤S201中,基于感兴趣主题的第一集合,从所有用户节点中,选择参与所述第一集合中的一个或多个感兴趣主题的至少一个关键用户节点来组成关键节点的组(图3中的选择流程);以及在步骤S202中,通过监视所述组中的一个或多个关键节点所发布的内容,以找到感兴趣主题的第二集合。
该关键节点的组的信息以及该找到的感兴趣主题的第二集合的信息可以被输入到一个数据库(可选地)中,以便用于可选的更新关键节点的组的更新流程。在该更新流程中,即,在图2所示的方法200的步骤S203(未示出)中,可以基于所述感兴趣主题的第二集合,更新所述关键节点的组,从而得到更新的关键节点的组,以继续通过监视更新的关键节点的组来找到更感兴趣主题的集合。
如此,通过图3所示的选择流程和可能的更新流程,能够高效、低成本和实时地找到诸如热点新闻或热点事件的感兴趣主题。
图4示出了应用图2所示的监测感兴趣主题的方法的时序示意例子。
如图4所示,在时序上,在例如星期六和星期日(作为上述第一特定时间段T1的例子),根据当前的已知感兴趣主题的第一集合(例如从诸如新浪、搜狐的已知的热点新闻排名信息等得到),从所有用户节点中进行选择关键节点的组1的选择流程(即,步骤S201的例子),从而得到该关键节点的组1。而在例如接下来的星期一到星期五(作为上述第二特定时间段T2的例子),监视该选择的关键节点的组1,从而找到接下来的星期一到星期五的感兴趣主题的第二集合(即,步骤S202的例子)。在接下来的星期六和星期日(作为上述第一特定时间段T1的另一例子),可以根据上述星期一到星期五找到的该感兴趣主题的第二集合(例如,作为当前感兴趣主题)或来自已知信息源的已知的当前感兴趣主题(例如新浪头条、微博头条等),来更新关键节点的组1以得到更新的关键节点的组2,从而在再接下来的星期一到星期五(作为上述第二特定时间段T2的另一例子),继续监视该更新的关键节点的组2,得到该再接下来的星期一到星期五的更新的感兴趣主题,以此类推。这样的一个选择、监视、更新的反复流程可以使得除了能够高效、低成本和实时地找到诸如热点新闻或热点事件的感兴趣主题,还能够实时的自我更新来保持关键节点的组的活跃性以更实时、更准确地找到新近关注的感兴趣主题。
图5示出了根据本发明的另一个实施例的监测感兴趣主题的系统500的方框图。
该系统500包括:选择装置501,基于感兴趣主题的第一集合,选择参与所述第一集合中的一个或多个感兴趣主题的至少一个关键节点来组成关键节点的组;以及监视装置502,监视所述组中的一个或多个关键节点所发布的内容,以找到感兴趣主题的第二集合。
根据本发明的该实施例,通过选择装置501基于感兴趣主题的第一集合,选择参与第一集合中的一个或多个感兴趣主题的至少一个关键节点来组成关键节点的组,作为监视装置502要监视的对象,从而相比于监视所有用户节点而减少了要监视的节点所发布的内容的数量,使得能够高效、低成本和实时地找到诸如热点新闻或热点事件的感兴趣主题。
在一个实施例中,所述选择装置501可以基于如下中的一个或多个来进行所述选择:要选择的所述组中的关键节点的个数限制;和要选择的所述组中的关键节点所发布的内容的总数限制。也就是说,在选择装置501选择关键节点的组的选择过程中,可以限制这些关键节点的个数和其所发布的内容总数,从而减少监视这些关键节点和其发布的内容的工作量,降低成本,加快找到感兴趣主题的速度。
在一个实施例中,所述感兴趣主题的第一集合可以是在第一特定时间段T1内的已知感兴趣主题的集合,且其可以通过多种已知方式从以下信息源获取:例如,在第一特定时间段T1中累积的来自诸如央视等新闻节目的已知的新闻、来自诸如新浪、搜狐等新闻门户网站的已知的热点新闻排名信息等、来自诸如百度、谷歌等搜索引擎网站的已知的搜索关键字排名信息等、来自新浪微博、腾讯微博、Twitter、开心网等社交网站的已知的热点关注新闻事件排名信息等等。所述感兴趣主题的第二集合可以是在不同于所述第一特定时间段T1的第二特定时间段T2内找到的感兴趣主题的集合。术语“感兴趣主题的第二集合”不限于在时间上与第一集合不同的第二集合,还可以包括在所包含的主题上与第一集合不同的第二集合。
在一个实施例中,所述选择装置501可以包括:获取参与所述第一集合中的一个或多个感兴趣主题的多个参与节点的装置;以及从所述多个参与节点中,选择满足第一特定条件的至少一个参与节点组成的组作为上述关键节点的组。在一个实施例中,所述参与所述感兴趣主题的参与节点可以包括在从首次发布所述感兴趣主题开始的第三特定时间段内、发布与所述感兴趣主题相关的内容的节点。
在一个实施例中,该第一特定条件可以包括使得所述参与节点组成的组覆盖所述第一集合的覆盖效益满足如下中的一种:所述覆盖效益大于第一特定阈值;和所述覆盖效益最大,其中,所述覆盖效益表示所述参与节点组成的组所发布的内容覆盖感兴趣主题的第一集合的程度。
在一个实施例中,所述组覆盖所述第一集合的覆盖效益可以通过如下公式计算:G=αRcovered+βRuncovered,其中,G是覆盖效益,α、β分别是权重常数,Rcovered是与所述组所覆盖的感兴趣主题相关的发布内容的数量有关的效率系数,Runcovered是与所述组未覆盖的感兴趣主题相关的发布内容的数量有关的广度系数,所述组所覆盖的感兴趣主题是在所述组中参与所述感兴趣主题的参与节点的数量大于第二特定阈值的感兴趣主题,所述组未覆盖的感兴趣主题是在所述组中参与所述感兴趣主题的参与节点的数量小于或等于第二特定阈值的感兴趣主题。
在一个实施例中,可能地, R covered = N post c N post t , R uncovered = N post u N post t * N u , 其中,表示所述组所覆盖的感兴趣主题相关的发布内容的数量,表示所述组所发布的所有内容的数量,表示所述组未覆盖的感兴趣主题相关的发布内容的数量,Nu表示所述组未覆盖的感兴趣主题的数量。
在一个实施例中,所述监视装置502可以包括:获取所述组中的一个或多个关键节点在第二特定时间段内所发布的一个或多个内容的装置;比较所述所发布的一个或多个内容所包含的一个或多个主题的各自的内容数量的装置;从所述一个或多个主题中,添加如下的至少一个主题到所述感兴趣主题的第二集合中的装置:内容数量大于第三特定阈值的主题;以及内容数量从大到小排列的排名靠前的特定数量的主题。
在一个实施例中,该系统500还可以包括:更新装置503(未示出),被配置为基于所述感兴趣主题的第二集合,更新所述关键节点的组。
在一个实施例中,所述更新装置503(未示出)可以包括以下中的一种或多种:删除满足第二特定条件的节点的装置;以及增加参与所述第二集合中的一个或多个感兴趣主题的新的关键节点的装置。
在一个实施例中,所述第二特定条件可以包括以下中的一种或多种:节点的节点质量小于第四特定阈值;以及节点的节点质量从小到大排列的排名靠前。所述节点的节点质量可以表示通过监视该节点发布的内容能找到一个或多个感兴趣主题的效率。
在一个实施例中,所述节点质量可以通过如下公式来计算:其中,Q(i)表示关键节点i的节点质量,a、b是常数权重,表示关键节点i发布的与所述第二集合中的一个或多个感兴趣主题S相关的内容的数量,表示所述关键节点的组中所有关键节点所发布的与所述第二集合中的一个或多个感兴趣主题S相关的内容的数量,表示该关键节点i所发布的所有内容的总数量。
如此,通过基于所述感兴趣主题的第二集合来更新所述关键节点的组,可以保持该关键节点的组的活跃性。当然,更新的基础也不限于该感兴趣主题的第二集合,更新的基础也可以是当前从新闻门户网站、新闻媒体、社交网站、搜索网站等已知信息源获得的某个已知的感兴趣主题的集合。如此,通过经常地更新关键节点的组,使得关键节点的组中的关键节点保持活跃性,从而能够基于更新的关键节点的组来更实时、更准确地找到新近关注的感兴趣主题。
当然,根据本发明的实施例的检测感兴趣主题的系统具有不限于以上描述的装置。由于以上结合图2-图4描述了监测感兴趣主题的方法,而本领域技术人员可以理解监测感兴趣主题的系统也可以具有执行上述方法中的各个步骤的其他装置,在此不赘述。另外,注意,本公开中提到的实施例、优点和效果仅是示例而非对本发明的限制。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (20)

1.一种监测感兴趣主题的方法,包括:
基于感兴趣主题的第一集合,选择参与所述第一集合中的一个或多个感兴趣主题的至少一个关键节点来组成关键节点的组;以及
监视所述组中的一个或多个关键节点所发布的内容,以找到感兴趣主题的第二集合。
2.根据权利要求1所述的方法,其中,所述选择还基于如下中的一种或多种来进行:要选择的所述组中的关键节点的个数限制;和要选择的所述组中的关键节点所发布的内容的总数限制。
3.根据权利要求1所述的方法,其中,所述感兴趣主题的第一集合是在第一特定时间段内的已知感兴趣主题的集合,且所述感兴趣主题的第二集合是在不同于所述第一特定时间段的第二特定时间段内找到的感兴趣主题的集合。
4.根据权利要求1所述的方法,其中,所述基于感兴趣主题的第一集合,选择参与所述第一集合中的一个或多个感兴趣主题的至少一个关键节点来组成关键节点的组的步骤包括:
获取参与所述第一集合中的一个或多个感兴趣主题的多个参与节点;以及
从所述多个参与节点中,选择由满足第一特定条件的至少一个参与节点组成的组作为所述关键节点的组。
5.根据权利要求4所述的方法,其中,所述参与所述感兴趣主题的参与节点包括在从首次发布所述感兴趣主题开始的第三特定时间段内、发布与所述感兴趣主题相关的内容的节点。
6.根据权利要求4所述的方法,其中,所述第一特定条件包括使得所述参与节点组成的组覆盖所述第一集合的覆盖效益满足如下中的一种:所述覆盖效益大于第一特定阈值;和所述覆盖效益最大,
其中,所述覆盖效益表示所述参与节点组成的组所发布的内容覆盖感兴趣主题的第一集合的程度。
7.根据权利要求6所述的方法,其中,所述组覆盖所述第一集合的覆盖效益是通过如下公式计算的:
G=αRcovered+βRuncovered
其中,G是覆盖效益,α、β分别是权重常数,
Rcovered是与所述组所覆盖的感兴趣主题相关的发布内容的数量有关的效率系数,
Runcovered是与所述组未覆盖的感兴趣主题相关的发布内容的数量有关的广度系数,
所述组所覆盖的感兴趣主题是在所述组中参与所述感兴趣主题的参与节点的数量大于第二特定阈值的感兴趣主题,
所述组未覆盖的感兴趣主题是在所述组中参与所述感兴趣主题的参与节点的数量小于或等于第二特定阈值的感兴趣主题。
8.根据权利要求7所述的方法,其中, R covered = N post c N post t , R uncovered = N post u N post t * N u , 其中,表示所述组所覆盖的感兴趣主题相关的发布内容的数量,表示所述组所发布的所有内容的数量,表示所述组未覆盖的感兴趣主题相关的发布内容的数量,Nu表示所述组未覆盖的感兴趣主题的数量。
9.根据权利要求1中的所述的方法,其中,所述监视所述组中的一个或多个关键节点所发布的内容,以找到感兴趣主题的第二集合的步骤包括:
获取所述组中的一个或多个关键节点在第二特定时间段内所发布的一个或多个内容;
比较所述所发布的一个或多个内容所包含的一个或多个主题的各自的内容数量;
从所述一个或多个主题中,添加如下的至少一个主题到所述感兴趣主题的第二集合中:
内容数量大于第三特定阈值的主题;以及
内容数量从大到小排列的排名靠前的特定数量的主题。
10.根据权利要求1中的所述的方法,还包括:
基于所述感兴趣主题的第二集合,更新所述关键节点的组。
11.根据权利要求10所述的方法,所述基于所述感兴趣主题的第二集合,更新所述关键节点的组的步骤包括以下中的一种或多种:
删除满足第二特定条件的节点;以及
增加参与所述第二集合中的一个或多个感兴趣主题的新的关键节点。
12.根据权利要求11所述的方法,其中,所述第二特定条件包括以下中的一种或多种:
节点的节点质量小于第四特定阈值;以及
节点的节点质量从小到大排列的排名靠前,
其中,所述节点的节点质量表示通过监视该节点发布的内容能找到一个或多个感兴趣主题的效率。
13.根据权利要求12所述的方法,其中,所述节点质量通过如下公式来计算:
Q ( i ) = a * N post S ( i ) N post S ( all ) + b * N post S ( i ) N post All ( i ) ,
其中,Q(i)表示关键节点i的节点质量,a、b是常数权重,
表示关键节点i发布的与所述第二集合中的一个或多个感兴趣主题S相关的内容的数量,
表示所述关键节点的组中所有关键节点所发布的与所述第二集合中的一个或多个感兴趣主题S相关的内容的数量,
表示该关键节点i所发布的所有内容的总数量。
14.一种监测感兴趣主题的系统,包括:
选择装置,被配置为基于感兴趣主题的第一集合,选择参与所述第一集合中的一个或多个感兴趣主题的至少一个关键节点来组成关键节点的组;以及
监视装置,被配置为监视所述组中的一个或多个关键节点所发布的内容,以找到感兴趣主题的第二集合。
15.根据权利要求14所述的系统,其中,所述选择装置还基于如下中的一种或多种来进行所述选择:要选择的所述组中的关键节点的个数限制;和要选择的所述组中的关键节点所发布的内容的总数限制。
16.根据权利要求14所述的系统,其中,所述感兴趣主题的第一集合是在第一特定时间段内的已知感兴趣主题的集合,且所述感兴趣主题的第二集合是在不同于所述第一特定时间段的第二特定时间段内找到的感兴趣主题的集合。
17.根据权利要求14所述的系统,其中,所述选择装置包括:
获取参与所述第一集合中的一个或多个感兴趣主题的多个参与节点的装置;以及
从所述多个参与节点中,选择由满足第一特定条件的至少一个参与节点组成的组作为所述关键节点的组。
18.根据权利要求17所述的系统,其中,所述第一特定条件包括使得所述参与节点组成的组覆盖所述第一集合的覆盖效益满足如下中的一种:所述覆盖效益大于第一特定阈值;和所述覆盖效益最大,
其中,所述覆盖效益表示所述参与节点组成的组所发布的内容覆盖感兴趣主题的第一集合的程度。
19.根据权利要求14中的所述的系统,其中,所述监视装置包括:
获取所述组中的一个或多个关键节点在第二特定时间段内所发布的一个或多个内容的装置;
比较所述所发布的一个或多个内容所包含的一个或多个主题的各自的内容数量的装置;
从所述一个或多个主题中,添加如下的至少一个主题到所述感兴趣主题的第二集合中的装置:
内容数量大于第三特定阈值的主题;以及
内容数量从大到小排列的排名靠前的特定数量的主题。
20.根据权利要求14中的所述的系统,还包括:
更新装置,被配置为基于所述感兴趣主题的第二集合,更新所述关键节点的组。
CN201310257892.9A 2013-06-26 2013-06-26 监测感兴趣主题的方法和系统 Active CN104252461B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310257892.9A CN104252461B (zh) 2013-06-26 2013-06-26 监测感兴趣主题的方法和系统
US14/297,770 US9584608B2 (en) 2013-06-26 2014-06-06 Monitoring interesting subjects
US15/277,088 US9912769B2 (en) 2013-06-26 2016-09-27 Monitoring interesting subjects

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310257892.9A CN104252461B (zh) 2013-06-26 2013-06-26 监测感兴趣主题的方法和系统

Publications (2)

Publication Number Publication Date
CN104252461A true CN104252461A (zh) 2014-12-31
CN104252461B CN104252461B (zh) 2017-12-05

Family

ID=52116719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310257892.9A Active CN104252461B (zh) 2013-06-26 2013-06-26 监测感兴趣主题的方法和系统

Country Status (2)

Country Link
US (2) US9584608B2 (zh)
CN (1) CN104252461B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112272213A (zh) * 2020-09-30 2021-01-26 上海连尚网络科技有限公司 一种活动报名方法与设备

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10351129B2 (en) * 2017-01-13 2019-07-16 Ford Global Technologies, Llc Collision mitigation and avoidance
CN107066537A (zh) * 2017-03-06 2017-08-18 广州神马移动信息科技有限公司 热点新闻生成方法、设备、电子设备
US10558541B1 (en) * 2017-09-22 2020-02-11 Equinix, Inc. Agent-based monitoring of network resources
US10756990B1 (en) 2017-09-22 2020-08-25 Equinix, Inc. Monitoring and performance improvement of enterprise applications using correlated data associated with a plurality of service layers
US11189267B2 (en) 2018-08-24 2021-11-30 Bright Marbles, Inc. Intelligence-driven virtual assistant for automated idea documentation
US11461863B2 (en) 2018-08-24 2022-10-04 Bright Marbles, Inc. Idea assessment and landscape mapping
US11081113B2 (en) 2018-08-24 2021-08-03 Bright Marbles, Inc. Idea scoring for creativity tool selection
US11164065B2 (en) 2018-08-24 2021-11-02 Bright Marbles, Inc. Ideation virtual assistant tools
CN110287338B (zh) * 2019-06-21 2022-04-29 北京百度网讯科技有限公司 行业热点确定方法、装置、设备和介质
CN114691021A (zh) * 2020-12-31 2022-07-01 伊姆西Ip控股有限责任公司 用于存储监测对象的指标值的方法、设备和计算机程序

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法
US20110179020A1 (en) * 2010-01-21 2011-07-21 Microsoft Corporation Scalable topical aggregation of data feeds
CN102194012A (zh) * 2011-06-17 2011-09-21 清华大学 微博话题检测方法及系统
US20120079020A1 (en) * 2010-09-27 2012-03-29 Korea Institute Of Science And Technology Highlight providing system and method based on hot topic event detection
CN102708176A (zh) * 2012-05-08 2012-10-03 山东大学 基于活跃用户的微博数据挖掘方法
CN103116605A (zh) * 2013-01-17 2013-05-22 上海交通大学 一种基于监测子网的微博热点事件实时检测方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120066303A1 (en) * 2010-03-03 2012-03-15 Waldeck Technology, Llc Synchronized group location updates
US20120245925A1 (en) 2011-03-25 2012-09-27 Aloke Guha Methods and devices for analyzing text
US8775431B2 (en) 2011-04-25 2014-07-08 Disney Enterprises, Inc. Systems and methods for hot topic identification and metadata
US8918468B1 (en) * 2011-07-19 2014-12-23 West Corporation Processing social networking-based user input information to identify potential topics of interest
US9015857B2 (en) * 2011-11-14 2015-04-21 Wave Systems Corp. Security systems and methods for encoding and decoding digital content

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法
US20110179020A1 (en) * 2010-01-21 2011-07-21 Microsoft Corporation Scalable topical aggregation of data feeds
US20120079020A1 (en) * 2010-09-27 2012-03-29 Korea Institute Of Science And Technology Highlight providing system and method based on hot topic event detection
CN102194012A (zh) * 2011-06-17 2011-09-21 清华大学 微博话题检测方法及系统
CN102708176A (zh) * 2012-05-08 2012-10-03 山东大学 基于活跃用户的微博数据挖掘方法
CN103116605A (zh) * 2013-01-17 2013-05-22 上海交通大学 一种基于监测子网的微博热点事件实时检测方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112272213A (zh) * 2020-09-30 2021-01-26 上海连尚网络科技有限公司 一种活动报名方法与设备
CN112272213B (zh) * 2020-09-30 2023-09-19 上海连尚网络科技有限公司 一种活动报名方法与设备

Also Published As

Publication number Publication date
US9584608B2 (en) 2017-02-28
US20150006634A1 (en) 2015-01-01
CN104252461B (zh) 2017-12-05
US9912769B2 (en) 2018-03-06
US20170019492A1 (en) 2017-01-19

Similar Documents

Publication Publication Date Title
CN104252461A (zh) 监测感兴趣主题的方法和系统
US10091324B2 (en) Content feed for facilitating topic discovery in social networking environments
KR101694373B1 (ko) 유기적 활동 스트림으로부터 후원된 스토리 유닛 생성
US9123079B2 (en) Sponsored stories unit creation from organic activity stream
US20100198757A1 (en) Performance of a social network
CN113169886A (zh) 通信网络优化
US20160132904A1 (en) Influence score of a brand
US20110313915A1 (en) Collecting and sharing revenue associated with personal data assets
WO2014056408A1 (zh) 推荐信息的方法、装置和服务器
US20160380875A1 (en) Identifying referral pages based on recorded url requests
Lee et al. CAST: A context-aware story-teller for streaming social content
US9189766B2 (en) Real time provisional evaluation of utility program performance
US20170323326A1 (en) Method and systems for determining programmatically expected performances
CN104838662A (zh) 过滤内容流
CN103593393A (zh) 基于微博互动关系挖掘社交圈的方法及装置
JP2018045713A (ja) ソフトウェア・アプリケーションのイベントの識別
CN103745383A (zh) 基于运营商数据实现重定向服务的方法和系统
US20140280216A1 (en) Automated ranking of contributors to a knowledge base
US20160055203A1 (en) Method for record selection to avoid negatively impacting latency
Dong et al. A hierarchical network with user memory matrix for long sequence recommendation
Hao et al. Towards a query-less news search framework on twitter
Drutsa et al. Prediction of video popularity in the absence of reliable data from video hosting services: utility of traces left by users on the web
KR102343285B1 (ko) 맞춤형 서비스 제공 방법 및 장치
Bayon et al. An optimization problem in deregulated electricity markets solved with the nonsmooth maximum principle
TW201601091A (zh) 擴展詞對的篩選方法及裝置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant