CN104750768B - 用于从社交媒体中识别、监控和排名事件的方法和系统 - Google Patents

用于从社交媒体中识别、监控和排名事件的方法和系统 Download PDF

Info

Publication number
CN104750768B
CN104750768B CN201410641037.2A CN201410641037A CN104750768B CN 104750768 B CN104750768 B CN 104750768B CN 201410641037 A CN201410641037 A CN 201410641037A CN 104750768 B CN104750768 B CN 104750768B
Authority
CN
China
Prior art keywords
event
ranking
events
social media
present score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410641037.2A
Other languages
English (en)
Other versions
CN104750768A (zh
Inventor
M·贝尔灵格里奥
董晓文
A·格考拉拉斯-迪瓦尼斯
D·马维罗伊迪斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN104750768A publication Critical patent/CN104750768A/zh
Application granted granted Critical
Publication of CN104750768B publication Critical patent/CN104750768B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/23Reliability checks, e.g. acknowledgments or fault reporting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种用于从社交媒体流中检测、监控并对事件排名的方法和系统包括:从社交媒体流中检测一个或多个事件,并持续地监控所述一个或多个事件,计算每一个所述事件的当前分数,确定表明每个所述事件的预期演变的预计分数,基于所述事件的当前分数而对所述事件进行排名,基于所述事件的预计分数而预测所述事件的排名,以及响应于从所述社交媒体流中检测到的关于所述事件的新输入,更新所预测的排名。在一个方面,所述当前分数根据所述事件的特性计算,所述特性包括社会影响评估、用户的动态位置、人类感知和社交网络特征中的一个或多个。在一个方面,所述当前分数基于事件的类型和演变是已知的类似事件中的一个、使用一个或多个扩散模型来计算。

Description

用于从社交媒体中识别、监控和排名事件的方法和系统
技术领域
本发明一般涉及社交媒体分析的领域。
背景技术
社交媒体提供了关于城市正在发生的事件的信息的良好和不断更新的来源,这些事件例如是骚乱、演唱会、交通等。这些事件或事故可包括涉及固定地理区域内成群的参与者的活动。另外,社交媒体提供了独特的视角以根据诸如未固定位置的移动传感器的元件、社交网络特征和人类感知来实现情境感知,例如社会影响的直接评估。
通常,情境感知是根据物理传感器计算的,而不是获取人们的感知。在事件的过程中,人们对于不同因素的感知,例如安全事故的危急程度(criticality)、演唱会的用户参与等,可产生变化。然而,缺乏对城市中的事件针对用户所选择的兴趣度量在现在的时间和不久的将来的实时监控和排名是成问题的。能够提供这种事件的监控和排名的系统,包括预计未来的事件的排名,可极大地帮助执行资源分配和例如城市管理者和/或警察的迅速行动。
发明内容
提供了一种用于从社交媒体中识别、监控和对事件排名的新的计算机实现的系统和方法。该方法可包括从社交媒体流中检测事件并持续地监控事件,计算每个事件的当前分数,确定表示每个事件的预期演变的预计分数,根据事件的当前分数而对事件进行排名,根据事件的预计分数而预测事件的排名,响应于从社交媒体流中检测到的关于事件的新输入,更新所预测的排名。
该系统可包括存储器设备、显示器设备和连接到存储器设备的硬件处理器,该处理器被配置为:从社交媒体流中检测事件并持续地监控事件,计算每个事件的当前分数,确定表示每个事件的预期演变的预计分数,根据事件的当前分数而对事件进行排名,根据事件的预计分数而预测事件的排名,响应于从社交媒体流中检测到的关于事件的新输入,更新所预测的排名。
在一个方面,当前分数根据事件的特性计算,该特性包括社会影响评估、用户的动态位置、人类感知和社交网络特征中的一个或多个。在一个方面,当前分数根据事件的类型和/或其演变是已知的类似事件并使用一个或多个扩散模型来计算。在一个方面,更新所预测的排名至少包括用户提供关于事件的实时反馈,其影响事件的当前状态的预测并通过所考虑的扩散模型影响事件的预期演变。在一个方面,更新所预测的排名基于一个或多个扩散模型并基于事件的预期演变自动地执行。在一个方面,所预测的排名被显示在显示器设备上。
附图说明
图1是一个实施例中的本公开的示例性系统结构;
图2是表示一个实施例中的创造性方法的流程的流程图;
图3是示例性的显示屏;
图4是一个实施例中的示例性扩散模型;
图5是一个实施例中的示例性示意性系统结构。
具体实施方式
提供了用于从社交媒体中检测、监控和排名事件的系统和方法的实施例。排名包括当前排名和预计排名,以使得创造性的系统和方法能够输出(例如显示)事件的排名列表以及事件的未来排名的预计。在一个实施例中,该系统和方法可以确定事件的当前排名重要性和/或危急程度,并可使用该信息以预测事件的未来危急程度,包括预测事件的危急程度何时会发生变化。
图1示出了在其中运行本方法的计算或移动设备计算系统体系100的示例性硬件配置。该硬件配置优选地具有至少一个处理器或中央处理单元(CPU)111。CPU 111通过系统总线112连接到随机存取存储器(RAM)114、只读存储器(ROM)116、输入/输出(I/O)适配器118(用于将诸如磁盘单元121和磁带驱动器140的外部设备连接到总线112)、用户接口适配器122(用于将键盘124、鼠标126、扬声器128、磁盘驱动设备132和/或其它用户接口设备连接到总线112)、用于将系统100连接到数据处理网络、因特网、内部网、局域网(LAN)等的通信适配器134、以及用于将总线112连接到显示器设备138和/或打印机139(例如数码打印机等)的显示适配器136。
在一个实施例中,计算系统100被编程以执行图2所示的方法处理步骤。例如,数据可被存储在RAM 114和/或磁盘单元121或磁带驱动器140中。CPU 111可执行诸如事件评分、事件排名等的方法处理步骤。
系统和方法的实施例可使用例如来自推特、博客、文本消息、网页等的社交媒体文本和数据及其独特的传感器来运行。一种类型的传感器包括物理传感器,诸如摄像机、天气传感器、交通传感器等。此外,可以从社交媒体中感知信息。该信息可例如使用文本内容的自然编程语言(NPL)分析、复杂网络分析、图像分析和情感分析来进行分析。复杂网络分析例如可包括时空网络分析。图像分析例如可包括附带有文本或与文本相关联的照片和其它图像的分析。社交媒体添加了新维度的信息;各种传感器可提供社会影响的直接评估,充当没有固定位置的移动传感器,和/或基于人类感知而提供社交网络特征。
此外,事件或事故的检测可使用推特内容的文本分析和推特的时空网络分析(诸如区域中报道事件的推特数量)实现。此外,可使用可能的图片附件的图像分析和/或推特文本的情感分析。可选地,事件可通过其它源来检测,诸如紧急服务的呼叫(E-911)或现场摄像机,在这种情况下,事件被人工地记录在系统中,事件的对应区域随后被系统主动地监控以从与该事件有关的社交媒体中获得进入的信息。
事件的危急程度的评估可以使用社交媒体用下面详细讨论的危急程度的扩散模型来执行。上述的社交媒体传感器的特殊特性可用于调节紧急情况的危急程度/扩散的参数,诸如森林火灾模型的扩散概率。NLP分析可用于确定环境。通过图像分析和/或情感分析获得的数据也可在评估中使用。事件的危急程度可以被计算为与被监控事件有关的各种输入的函数,诸如事件类型(某些事件可以被认为比其它事件更危险)、相关推特的数量及其内容、在系统中记录的类似历史事件(例如历史有关事件)的危急程度(这些事件如何发展、在事件的演变过程中有多严重等)、推特的情感分析、在时间窗口内报告事件的人数等。
图2示出了本发明的示例性方法。首先在步骤S1,例如通过对涉及同一事件的推特进行聚类来进行事件检测。这可以通过所接收的推特的文本分析来实现,也可以利用概念本体来实现。此外,连同事件检测一起,发生事件监控,以使得在步骤S1最初检测到的事件可在检测到后立即被监控,直到它们变得不重要。所检测和/或监控的事件可被成为“事件”。
在步骤S2,系统例如通过计算“当前分数”来执行对每个事件的评分,系统(可选地)计算每个事件的时间轮廓(profile)。在步骤S2计算的分数注重所监控的事件A的当前状态,因为关于事件A的信息只实时到来,并且该实时信息用于维持该事件如何发展。事件的分数可以考虑来自社交媒体传感器的数据来计算,该数据可包括诸如社会影响评估、用户的动态位置、人类感知、社交网络特征等的特性。例如,事件的社会影响可基于事件对公民的预期效果来测量。因此,武装抢劫将被认为比无伤亡的交通事故更重要。警察根据各种事件的重要性而对这些事件确定优先级,该优先级可被提供作为系统评估社会影响的输入。作为对事件的分数的另一个贡献因子,人们关于事件的感知可例如通过对所接收的推特执行情感分析、通过计算用户与所报道的事件的接近程度等来计算。对所接收的推特的情感分析可以例如基于用户所使用的文字、诸如出现在文本中的惊叹号的任何标点符号等。
上述的每一个因子可被分配一个权重,事件的总分数可以被计算为不同贡献因子的加权和。分数还可根据事件的类型计算,诸如骚乱、音乐会,火灾等。事件的时间轮廓可根据关于事件的通过社交媒体变得可用的信息实时地计算(作为可选的步骤)。当新的关于事件的信息可用时,事件的分数被重新计算,事件的分数的演变被记录,从而创建捕获事件的演变的时间轮廓。
在步骤S3,系统或者通过将事件的时间轮廓(在S2中计算的)与扩散模型或者与在知识库中存储的历史有关事件相匹配或者通过将事件的当前分数及时定位到扩散模型(或历史事件)来执行时间轮廓匹配。例如,事件的时间轮廓可用于确定在知识库中是否存在具有某些过去的轮廓和/或历史事件模型的匹配事件。在一个方面,假定被实时监控的事件A的当前分数和历史事件B,例如历史有关事件(其演变是已知的),A的当前状态可以被映射到B。例如,如图3所示(在315),事件5是历史事件B(或者可以是类似事件的扩散模型-是相同的)。那么,在事件5的时间线上,当前事件A可被定位(以捕获哪里是“现在”,如虚线所示)。当该匹配被准确地执行时,可以使用事件B的时间线估计事件A如何进行和/或演变。因此,事件A的当前分数可被及时定位到历史事件(或扩散模型)B的时间线。
在步骤S4,可计算事件的分数预计,例如“预计分数”。因此,在步骤S4,估计一段时间后(即,未来)的事件A的分数,如图3所示(在315)。在事件A被定位到历史事件B的时间(并因此导出“现在”点)后,该知识,例如“现在”点,可用于表示“在30分钟内预期事件A的危急程度会显著增长”,如图3所示(在317处)。该预期或预测是基于事件B的,其是具有已知进程和/或演变的历史有关事件。
基于当前分数(在步骤S2中计算的)的排名实时地反映每个事件(相对其它事件)的相对危急程度。所预测的排名(在步骤S4中计算的)反映未来(例如在某段时间后)每个事件的相对危急程度。图3示出一个例子,如下所述并在后面进一步描述。假定已经确定了5个事件,并对于这些事件的每一个,根据每个事件的各自的历史有关事件(或扩散模型),已经找到“现在”。事件的当前分数(“现在”)用于创建反映事件的当前情形/危急程度的排名。这就是图3中在301的排名。然而,已经识别了每个事件在各自的历史事件和/或扩散模型中的位置(“现在”),可以预测或预报每个事件的危急程度在一段时间后,诸如例如30分钟后,会如何发展。这可导致新的排名,其中某些事件已经变得更加危险和/或更加重要,而其它事件已经变得不太危险和/或不太重要。这就是在图3的321示出的排名,它被称为“所预测的排名”。
在步骤S5中,系统根据当前分数来执行事件的排名,并根据分数预计来执行所预测的排名。
在步骤S6,发生排名和预计排名的输出。例如,预计排名可以被显示在显示器设备138(图1)上。如果需要,可以产生和显示各种输出。另外,被监控的事件的实时排名可响应于所接收到的关于每个事件的新输入和/或由对应的扩散模型报告的事件的预期演变,根据它们当前所计算的分数动态地更新和显示。下面更详细地讨论扩散模型。在一个实施例中,系统和方法的用户可以实时地提供由对应的扩散模型提供的对预测准确性的反馈。这种反馈可用于改进所监控的事件和/或类似事件的随后的排名。例如,反馈可用于更新事件的当前状态相对扩散模型的定位和/或修改历史模型,以使得根据这些更新后的模型的排名会更加准确。
图3示出在本发明的一个实施例中的包含五个事件:事件1、事件2、事件3、事件4和事件5的被标记为“当前”301的第一列或列表、被标记为“用户反馈”311的消息对和包含按不同顺序的事件的被标记为“一小时后预计”321的第三列或列表的输出。在另一个实施例中,“一小时后预计”事件可以是与“当前”事件相同的顺序。应当注意,某些事件可能在此期间后已变得不重要,因此,它们不是被标记为“一小时预计”的列表的一部分,而其它事件(诸如事件6)可能在此期间已被发现,因此,在此期间被发现的这些事件并不是被标记为“当前”的列表的一部分。
在图3中,每个事件,例如事件1、事件2、事件3、事件4和事件5,已经从社交媒体数据中检测到。在每个事件内包括的指示符305表示时间,例如整数,在该时间内预计事件的危急程度发生变化。向上的箭头指示符表示事件的危急程度被预期增大,向下的箭头指示符表示时间的危急程度被预期降低。例如,事件2的指示符是包含“5”的向上箭头,其表示事件2的危急程度预期在5个时间单元(例如5分钟)内增加。同样,事件3的指示符是包含“20”的向下箭头,其表示事件3的危急程度预期在20个时间单元(例如20分钟)内降低。显示为矩形的一个指示器305例如表示预计没有变化。危急程度的变化引起事件的重新排序或重新排名,以使得事件2在“一小时后预计”321列中出现在事件1的上面。危急程度的变化在其信息被维持在系统的知识库和/或相关扩散模型中的历史有关事件的帮助下,根据对应的(有关)事件如何随时间发展来计算。例如,在图3的315,事件5被报告具有某个当前分数(显示在“现在”位置中)。使用其危急程度随时间发展是已知的历史事件(或扩散模型),可以预测出事件5预期在30分钟后达到其最高的危急程度级别(分数),因为这是历史事件在处于“现在”位置时达到其最大危急程度级别所花费的时间。通过对排名列表301中的每个事件执行相同的计算,可以得到未来事件的预计排名,如图3的321所示。
图3中的“用户反馈”311包括有关事件(例如事件5)的当前信息315和有关事件的预计信息317。“一小时后预计”321反映在“用户反馈”中示出的信息。具体地,当前事件信息315显示事件(例如事件5)的分数预计或分数被预计或预报在接下来的30分钟内增加。此外,预计事件信息317显示根据来自社交媒体,例如等的输入,事件(例如事件5)的分数被预报在当前30分钟后的15分钟内降低。下面更详细描述事件分数的确定和时间轮廓的计算(步骤S2)。事件的危急程度预期在何时出现的预报在当前事件所匹配的扩散模型和/或任何历史事件的帮助下执行。基于这些类似事件的演变和它们的危急程度发生变化所花费的时间,系统可以预测当前所监控的事件的危急程度预期在何时发生变化。因此,在已经实现了当前事件与历史有关事件(或扩散模型)的匹配后,预报是简单的,因为它基于历史事件的时间轮廓。例如,在图3的315示出的时间线描述了历史事件在不同时间处的分数。“现在”位置描述了事件的当前分数(即,它将时间定位在时间线上)。然后,可以识别和预报例如在30分钟内所监控的事件的分数和/或危急程度预期达到它的最大值。
预计排名可用于对针对紧急情况的反应确定优先级。例如,如果警察事先知道事件1现在是重要的,但在30分钟后将不太重要,而事件2现在不太重要,但在30分钟将变得更危险,平均警察紧急响应时间是30分钟,则事件2可变成最重要的事件以作出反应。
在一个实施例中,单独事件的分数和/或分数预计可通过使用时空扩散模型计算。通常,扩散模型试图捕获和模拟时间现象,诸如新产品采用目标人群中的口口相传,外部通信试图影响需求。在本发明中,扩散模型可用于计算事件的预期演变。也就是说,扩散模型捕获某些事件(诸如火灾、洪水、盗窃等)如何随着时间和空间发展,并可用于评估指定事件预期如何发展。在一个实施例中,历史事件可用于计算这些模型。在一个实施例中,扩散模型帮助基于事件的预期时空演变来对事件打分,并评估分数大约在何时将发生变化。
各种源可提供用于事件检测(步骤S1)和用于分数和时间轮廓计算步骤(步骤S2)的输入。某些示例性的源可包括社交媒体流,诸如 等。有关被监控的事件的进入信息(诸如新到的“推特”,例如从中传输来的数据)可帮助改进系统所监控的这些事件的排名。
在一个实施例中,作为打分函数的危急程度可以如下计算:
危急程度=f(事件类型,相关推特,扩散模型)
其中,事件类型、相关推特和扩散模型如下所述。事件类型可以例如通过使用在推特中提到的关键字、将关键字分配到事件类型中的概念本体以及对推特进行预处理以识别重要术语的NLP工具来计算。每个事件的相关推特可根据在推特中共享的重要关键字(包括同义词)并在概念本体的帮助下类似地识别。危急程度也可在考虑事件的进展已经是已知的类似历史事件的扩散模型的帮助下进行计算。例如,如果存在“凤凰公园的火灾”事件,则在已知皇后公园的火灾在Y小时内以速度X蔓延并且皇后公园“类似于”凤凰公园时,即两个公园大约有相同的大小、具有相同类型的树木、火灾区域等,皇后公园的火灾这一历史事件可用作参考事件(扩散模型)。
在另一个例子中,如果“类似”事件不是已知的,则可利用最坏的情形。在这种情况下,公园的最坏火灾可用于计算“凤凰公园的火灾”这一事件的危急程度级别,然后,该级别可根据随后接收到的推特的数量和内容进行调整。进一步地,如果可用,则诸如天气预报信息、城市信息等其它附加源可用于影响危急程度的计算。例如,在“凤凰公园的火灾”的情况下,预测将在下一个小时内在相应区域下雨的天气预报信息可导致降低该事件的危急程度。
在一个实施例中,可以使用诸如在图4中示出的扩散模型。图4的扩散模型使用估计骚乱事件的状态和演变的等式,并集中于来自区域i行进到位置j并参与骚乱的骚乱者。位置j的危急程度在该模型中被定义为抗议者在该位置中的数量。危急程度的演变涉及预测在特定位置处的抗议者的数量。计算危急程度的状态可使用推特的文本分析、情感分析和图像分析执行。基于该信息,可以估计在位置j的骚乱者的数量Dj。计算危急程度的演变可使用推特的文本分析、情感分析和图像分析以学习和获取知识库的知识来执行。在图4所示的等式中,Wij确定位置j对于来自位置i的骚乱者的“吸引力”,αr、βr、γr包括在“吸引力”等式中,η是“感染率”,τ是逮捕率。
图4所包括的公式概括了用于伦敦骚乱的数学模型,其由T.P.Davies、H.M.Fry、A.G.Wilson和S.R.Bishop在2013年的Scientific Reports中的“A Mathematical Modelof the London Riots and their Policing”中提出。该表示法考虑了城市最初被分成一组位置/区域,即,位置1、2、3、……等。图4中示出的公式的详情如下:
●Wij 401—吸引力函数—量化位置j对居住在位置i的骚乱者的吸引力,其中,
●Qj是在位置j的警察的数量,
●Dj是在位置j的骚乱者的数量。
●Wij e(t)403由Davis等描述为“并非将吸引力函数Wij直接并入空间交互等式中,我们使用它在先前时间步长上的移动平均值。因此,用于确定在指定时间的分配的值(称为“有效吸引力”并标记)是在我们的离散时间机制中的Wij在Lr个最新时间步长上的平均值(其具有间隔δt,当t<(Lr-1)δt时,我们用t=0值“填补”)。”
●Ni(t)405量化在时间t来自位置i的个人选择参与骚乱的比率。
●Dj(t)407是在时间t在位置j的骚乱者的数量。
●Ci(t)409量化源自位置i的个人在时间t被逮捕的比率。
●进一步地,
●dij是位置i和j之间的距离
●Zj量化骚乱位置的“值”
●αr、βr、γr是使用真实数据调整的参数
●η表示感染率
●Ii(t)量化在时间t来自位置i的非活动个人
●ρi是在位置i的剥夺的度量,μ是使用真实数据校正的指数
●Ri(t)是居住地在位置i的骚乱者的数量
●Sij(t)量化在时间t参与在位置j的骚乱的来自位置i的抗议者的数量
●τ表示将要使用真实数据调整的逮捕率参数。
在图5中示出了示意性系统体系结构。在该示意性体系结构中,提供社交媒体数据501(例如推特等)作为计算机的输入,并使用NPL、聚类、分类、时间序列和/或城市环境分析技术505进行处理。城市环境是描述关于推特从中产生的位置的可用的附加信息(即,人口密度、犯罪统计等)的术语。该附加信息可以数据挖掘和/或统计算法中的额外特征的形式使用,以用于增强事件检测过程。作为该处理的结果,发现一组事件。随后,基于每个所发现的事件的类型,识别与对应事件匹配的一个或多个时空(ST)扩散模型509。这些扩散模型被存储为由系统维护的知识库或KB511的一部分,并在模型匹配算法515的帮助下与实时事件匹配。接着,对于每个所发现的事件,在社交媒体的帮助下,预测其当前状态,并且该事件被匹配到由所分配的扩散模型表示的时间线上的对应状态。这导致所发现的事件的当前排名以及在所匹配的扩散模型帮助下计算的预计排名的计算。
用户反馈可以从社交媒体中提供以改进事件的当前状态的预测,并随后提供事件的危急程度的更好评估。例如,用户可发布有关事件的当前状态的推特,诸如聚集在特定区域的人群的数量或者当前感知的该事件的重要性(例如,“火灾似乎得到控制”),这可显著影响事件的危急程度的计算。基于危急程度的事件排名器519用于根据所发现的事件的当前危急程度和所预计的危急程度对所发现的事件进行排名。基于危急程度的事件排名器参考基于事件的当前危急程度分数或者所预计的危急程度分数对事件实施的排名方法。通常,基于危急程度的事件排名器是用于产生在图3的301和321示出的排名的机制。输入是每个事件的危急程度的值,或者是当前分数或者是预计分数,输出是诸如301或321的排名。
确定结束的事件521,它们的相关信息(在危急程度的演变方面)成为系统的知识库的一部分,以用于对未来的相关事件进行评估和排名。结束的事件是不再重要的事件,或者因为它们不复存在或者因为它们的危急程度分数已经变得太低并且不会被预测在未来增大,因此,这些事件不再被监控。这种结束的事件的时间轮廓应当被维持在系统的知识库中,以使得这些结束的事件可用作历史事件以预测新监控的事件的危急程度的演变。在图5所示的例子中,发现三个事件并对其排名:凤凰公园的火灾525,Bluebell的洪水527,Maynooth的抗议529。
在一个实施例中,系统的输出(图2的步骤S6)可在公共安全和紧急响应中使用。这种输出例如可以提供正在发生的公共安全事件的不确定性排名,以帮助警察优化他们的资源分配。若干事件不通过向警察的紧急呼叫来报告,例如E-911呼叫。例如,已经向警察报告的事件的演变很少通过E-911呼叫来报告。在另一个实施例中,创造性系统的输出(步骤S6)可用在一般城市管理中。这种输出例如可用于发现在城市中正在发生的事件并根据城市管理者感兴趣的不同分数来提供这些事件不确定性排名。在城市中发生的若干事件,诸如交通堵塞、音乐会等,可被自动地识别并同时进行监控。在一个实施例中,城市管理者可对正在发生的事件作出反应,并影响它们的演变。
本发明的新的方法的一个实施例的说明如下。在该实施例中,使用在此描述的方法的新的系统通过应用推特的文本和时空聚类来从社交媒体中发现事件。系统例如检测骚乱。系统使用扩散模型计算事件(例如骚乱)的分数,该分数可包括:骚乱者的数量、骚乱的地理延伸等等。然后,系统将该危急程度分数与知识库中的相关模型进行匹配,也就是说,系统将事件(例如骚乱)的时间轮廓与知识库中的模型进行比较,并确定是否存在匹配。
在一个实施例中,对每个进入的推特执行分数和时间轮廓计算,并更新骚乱的当前的时间匹配轮廓,例如“曲线”。骚乱的该当前“曲线”与知识库中的曲线(例如模型)进行比较以确定是否存在近似匹配。
然后,系统能够预测事件的危急程度随时间的演变。该演变与当前所监控的所有其它事件进行比较,提供事件在其被预测的危急程度的演变方面的排名列表。因此,可以生成列表,如果需要,可以显示列表。该显示不仅表示当前排名重要性,而且提供事件的未来危急程度的预测,使得能够预测事件的危急程度何时将发生变化。
所属技术领域的技术人员知道,本发明的各个方面可以实现为系统、方法或计算机程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明的各个方面还可以实现为在一个或多个计算机可读有形介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读介质的任意组合。计算机可读有形介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被执行指令的系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由执行指令的系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。计算机可读介质不包括传播信号。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其它可编程数据处理装置、或其他设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article of manufacture)。
也可以将计算机程序指令加载到计算机、其它可编程数据处理装置或其它设备上,以使得一系列操作步骤在计算机、其它可编程数据处理装置或其它设备上执行以产生计算机实现的过程,以使得在计算机或其它可编程装置上运行的指令提供用于实现在流程图和/或框图或模块中指定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
上述的实施例是示意性的例子,不应当被认为本发明限于这些特定实施例。因此,在不脱离由后附权利要求所限定的本发明的精神或范围的情况下,本领域技术人员可以进行各种变化和修改。

Claims (12)

1.一种从社交媒体流中检测、监控并对事件排名的方法,所述方法包括:
从社交媒体流中检测一个或多个事件,并持续地监控所述一个或多个事件;
计算所述一个或多个事件中的每一个的当前分数;
确定表示所述一个或多个事件中的每一个的预期演变的预计分数;
基于所述事件的所述当前分数,对所述事件进行排名;
基于所述事件的所述预计分数,预测所述事件的排名;以及
响应于从所述社交媒体流中检测到的关于所述事件的新输入,更新所预测的排名;
其中,硬件处理器设备被配置为执行所述检测一个或多个事件、计算当前分数、确定预计分数、对所述事件进行排名、预测所述事件的排名、以及更新所预测的排名。
2.如权利要求1所述的方法,其中,所述当前分数根据所述事件的特性计算,所述特性包括社会影响评估、用户的动态位置、人类感知和社交网络特征中的一个或多个。
3.如权利要求1所述的方法,其中,所述当前分数基于所述事件的类型和具有已知演变的类似事件中的一个、使用一个或多个扩散模型来计算。
4.如权利要求3所述的方法,其中,更新所预测的排名至少包括用户提供关于所述事件的实时反馈,所述反馈影响所述事件的当前状态的预测,所述反馈与所述一个或多个扩散模型一起用于计算所述当前分数,以更新所述事件的所述预期演变。
5.如权利要求3所述的方法,其中,更新所预测的排名基于所述一个或多个扩散模型并基于所述事件的所述预期演变自动地执行。
6.如权利要求1所述的方法,还包括:在显示器设备上显示所预测的排名。
7.一种用于从社交媒体流中检测、监控并对事件排名的系统,包括:
存储器设备;
显示器设备;
与所述存储器设备连接的硬件处理器,所述硬件处理器被配置为:
从社交媒体流中检测一个或多个事件,并持续地监控所述一个或多个事件;
计算所述一个或多个事件中的每一个的当前分数;
确定表示所述一个或多个事件中的每一个的预期演变的预计分数;
基于所述事件的所述当前分数,对所述事件进行排名;
基于所述事件的所述预计分数,预测所述事件的排名;以及
响应于从所述社交媒体流中检测到的关于所述事件的新输入,更新所预测的排名。
8.如权利要求7所述的系统,其中,所述当前分数根据所述事件的特性计算,所述特性包括社会影响评估、用户的动态位置、人类感知和社交网络特征中的一个或多个。
9.如权利要求7所述的系统,其中,所述当前分数基于所述事件的类型和具有已知演变的类似事件中的一个、使用一个或多个扩散模型来计算。
10.如权利要求9所述的系统,其中,更新所预测的排名至少包括用户提供关于所述事件的实时反馈,所述反馈影响所述事件的当前状态的预测,所述反馈与所述一个或多个扩散模型一起用于计算所述当前分数,以更新所述事件的所述预期演变。
11.如权利要求9所述的系统,其中,更新所预测的排名基于所述一个或多个扩散模型并基于所述事件的所述预期演变自动地执行。
12.如权利要求7所述的系统,还包括:显示器设备,其被配置为显示所预测的排名。
CN201410641037.2A 2013-12-30 2014-11-13 用于从社交媒体中识别、监控和排名事件的方法和系统 Expired - Fee Related CN104750768B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/143,949 US9397904B2 (en) 2013-12-30 2013-12-30 System for identifying, monitoring and ranking incidents from social media
US14/143,949 2013-12-30
US14/143949 2013-12-30

Publications (2)

Publication Number Publication Date
CN104750768A CN104750768A (zh) 2015-07-01
CN104750768B true CN104750768B (zh) 2018-01-12

Family

ID=53481968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410641037.2A Expired - Fee Related CN104750768B (zh) 2013-12-30 2014-11-13 用于从社交媒体中识别、监控和排名事件的方法和系统

Country Status (2)

Country Link
US (1) US9397904B2 (zh)
CN (1) CN104750768B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10279488B2 (en) 2014-01-17 2019-05-07 Knightscope, Inc. Autonomous data machines and systems
US9792434B1 (en) * 2014-01-17 2017-10-17 Knightscope, Inc. Systems and methods for security data analysis and display
US10514837B1 (en) * 2014-01-17 2019-12-24 Knightscope, Inc. Systems and methods for security data analysis and display
US9329597B2 (en) 2014-01-17 2016-05-03 Knightscope, Inc. Autonomous data machines and systems
US20150242431A1 (en) * 2014-02-25 2015-08-27 Ca, Inc. Computer system log file analysis based on field type identification
JP6369108B2 (ja) * 2014-04-18 2018-08-08 富士通株式会社 イベント発生場所推定方法、イベント発生場所推定プログラムおよびイベント発生場所推定装置
US10298535B2 (en) * 2015-05-19 2019-05-21 Facebook, Inc. Civic issues platforms on online social networks
WO2017102629A1 (en) * 2015-12-15 2017-06-22 Philips Lighting Holding B.V. Incident prediction system
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
CN107273496B (zh) * 2017-06-15 2020-07-28 淮海工学院 一种微博网络地域突发事件的检测方法
US11010677B2 (en) * 2017-09-30 2021-05-18 Oracle International Corporation Event management system
CN107944610B (zh) * 2017-11-17 2022-08-02 平安科技(深圳)有限公司 预测事件流行度方法、服务器及计算机可读存储介质
US10629053B2 (en) 2017-11-27 2020-04-21 International Business Machines Corporation Automatic detection and alert of an emergency from social media communication
CN107886442A (zh) * 2017-11-28 2018-04-06 合肥工业大学 基于微博文本的公众情感分布建模方法及装置
JP6865153B2 (ja) * 2017-12-15 2021-04-28 ヤフー株式会社 推定装置、推定方法、及び推定プログラム
US12019697B2 (en) 2018-02-16 2024-06-25 Walmart Apollo, Llc Systems and methods for identifying incidents using social media
CN109213928A (zh) * 2018-07-23 2019-01-15 武汉网信安全技术股份有限公司 一种基于大数据的智慧城管系统和方法
CN110048881A (zh) * 2019-03-20 2019-07-23 国家电网有限公司 信息监控系统、信息监控方法及装置
CN112447054B (zh) * 2019-08-30 2022-01-07 比亚迪股份有限公司 控制车辆行驶的方法和设备
US20230315601A1 (en) * 2022-04-04 2023-10-05 Palantir Technologies Inc. Approaches of incident monitoring and resolution

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102117321A (zh) * 2010-01-06 2011-07-06 微软公司 主题区讨论的自动发现聚集和组织
CN102193972A (zh) * 2010-03-19 2011-09-21 阿瓦雅公司 用于预测会见主题、后勤和资源的系统和方法
CN103198078A (zh) * 2012-01-09 2013-07-10 北大方正集团有限公司 一种互联网新闻事件报道趋势分析方法及系统

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10698886B2 (en) 2007-08-14 2020-06-30 John Nicholas And Kristin Gross Trust U/A/D Temporal based online search and advertising
US8234310B2 (en) * 2007-12-20 2012-07-31 Pottenger William M Social networking on a website with topic-based data sharing
US20130238356A1 (en) 2010-11-05 2013-09-12 Georgetown University System and method for detecting, collecting, analyzing, and communicating emerging event- related information
US20130100268A1 (en) 2008-05-27 2013-04-25 University Health Network Emergency detection and response system and method
US20100076806A1 (en) * 2008-09-25 2010-03-25 Solar Turbines Incorporated Inventory management tool using a criticality measure
WO2011025460A1 (en) 2009-08-24 2011-03-03 Agency For Science, Technology And Research Method and system for event detection
US8943053B2 (en) * 2010-02-26 2015-01-27 Telefonaktiebolaget L M Ericsson (Publ) Social data ranking and processing
US11367295B1 (en) 2010-03-23 2022-06-21 Aurea Software, Inc. Graphical user interface for presentation of events
US8756224B2 (en) 2010-06-16 2014-06-17 Rallyverse, Inc. Methods, systems, and media for content ranking using real-time data
US9311620B2 (en) * 2010-10-21 2016-04-12 Trustees Of Davidson College System and process for ranking content on social networks such as twitter
US8166164B1 (en) * 2010-11-01 2012-04-24 Seven Networks, Inc. Application and network-based long poll request detection and cacheability assessment therefor
US8732240B1 (en) * 2010-12-18 2014-05-20 Google Inc. Scoring stream items with models based on user interests
US8688691B2 (en) * 2011-01-13 2014-04-01 International Business Machines Corporation Relevancy ranking of search results in a network based upon a user's computer-related activities
US8760290B2 (en) 2011-04-08 2014-06-24 Rave Wireless, Inc. Public safety analysis system
US8812483B2 (en) * 2011-06-21 2014-08-19 Julien Bieren System and method for optimizing web searching and scheduling of service providers
US8622841B2 (en) * 2011-08-02 2014-01-07 Zynga Inc. Automated apparent responses in massively multiplayer online games
WO2013059290A1 (en) * 2011-10-17 2013-04-25 Metavana, Inc. Sentiment and influence analysis of twitter tweets
US20130124653A1 (en) * 2011-11-16 2013-05-16 Loopa Llc Searching, retrieving, and scoring social media
US8914371B2 (en) 2011-12-13 2014-12-16 International Business Machines Corporation Event mining in social networks
US9177065B1 (en) * 2012-02-09 2015-11-03 Google Inc. Quality score for posts in social networking services
US9424319B2 (en) * 2013-03-15 2016-08-23 Excalibur Ip, Llc Social media based content selection system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102117321A (zh) * 2010-01-06 2011-07-06 微软公司 主题区讨论的自动发现聚集和组织
CN102193972A (zh) * 2010-03-19 2011-09-21 阿瓦雅公司 用于预测会见主题、后勤和资源的系统和方法
CN103198078A (zh) * 2012-01-09 2013-07-10 北大方正集团有限公司 一种互联网新闻事件报道趋势分析方法及系统

Also Published As

Publication number Publication date
US20150186378A1 (en) 2015-07-02
CN104750768A (zh) 2015-07-01
US9397904B2 (en) 2016-07-19

Similar Documents

Publication Publication Date Title
CN104750768B (zh) 用于从社交媒体中识别、监控和排名事件的方法和系统
US11436510B1 (en) Event forecasting system
US11295405B2 (en) Cognitive recommendations for first responders
CN108228705B (zh) 直播视频反馈中的自动对象和活动跟踪设备、方法及介质
US9836694B2 (en) Crime risk forecasting
US20220058747A1 (en) Risk quantification for insurance process management employing an advanced insurance management and decision platform
JP6355683B2 (ja) リスク早期警報方法、装置、記憶媒体およびコンピュータプログラム
CN110703619A (zh) 智能楼宇管理方法、装置、介质及电子设备
US20230325403A1 (en) Systems and Methods for Enabling Situational Awareness for Events Via Data Visualization
CN104899577B (zh) 建筑物内的人员数量确定方法和人群疏散方法
CN112712903A (zh) 一种基于人机物三元空间协同感知的传染病监测方法
Cheng et al. Graph-based network generation and CCTV processing techniques for fire evacuation
Galea et al. Investigating the impact of culture on evacuation behavior-A Turkish data-set
CN107704387A (zh) 用于系统预警的方法、装置、电子设备及计算机可读介质
US10762089B2 (en) Open ended question identification for investigations
US20220414689A1 (en) Method and apparatus for training path representation model
Jiang et al. COVINet: A deep learning-based and interpretable prediction model for the county-wise trajectories of COVID-19 in the United States
CN112395351A (zh) 可视化的识别群诉风险方法、装置、计算机设备及介质
CN117726162A (zh) 一种基于多模态数据融合的社区风险等级评估方法及系统
KR102242317B1 (ko) 정성적 가짜 뉴스 판단 시스템, 판단 방법 및 이를 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
CN115796287A (zh) 基于深度学习的场所流量控制方法、系统及可读介质
CN117035388A (zh) 目标场所的风险评估方法及系统、终端设备、存储介质
KR20230089255A (ko) 디지털 트윈 모델에 대한 시각화 정보를 생성하는 장치, 방법 및 컴퓨터 프로그램
Li et al. Computer-aided resilience: Advanced techniques for disaster management in smart urban environments
CN109620194A (zh) 心率检测处理方法、装置、介质及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180112