CN104933129A - 基于微博的事件脉络获取方法和系统 - Google Patents

基于微博的事件脉络获取方法和系统 Download PDF

Info

Publication number
CN104933129A
CN104933129A CN201510324990.9A CN201510324990A CN104933129A CN 104933129 A CN104933129 A CN 104933129A CN 201510324990 A CN201510324990 A CN 201510324990A CN 104933129 A CN104933129 A CN 104933129A
Authority
CN
China
Prior art keywords
event
microblogging
timing
temperature
timing node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510324990.9A
Other languages
English (en)
Other versions
CN104933129B (zh
Inventor
沈剑平
莫洋
李炫�
车丽美
郑楚煜
齐沁芳
宋元峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510324990.9A priority Critical patent/CN104933129B/zh
Publication of CN104933129A publication Critical patent/CN104933129A/zh
Priority to US14/954,720 priority patent/US10324989B2/en
Application granted granted Critical
Publication of CN104933129B publication Critical patent/CN104933129B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/216Handling conversation history, e.g. grouping of messages in sessions or threads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Signal Processing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Primary Health Care (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供一种基于微博的事件脉络获取方法和系统,所述方法包括:获取统计时间段内针对预定的专题所包含的事件的原创微博及其转发微博的信息;计算事件的原创微博及其转发微博的信息在统计时间段内对应的关于专题的事件热度时间分布;根据统计时间段内专题的事件热度时间分布,从统计时间段内选取多个事件脉络时间节点,及其对应的节点事件构成专题的事件脉络。本发明的技术方案实现利用微博快速、准确的获取预定专题所包含事件的事件脉络。

Description

基于微博的事件脉络获取方法和系统
技术领域
本发明涉及信息处理技术,尤其涉及一种基于微博的事件脉络获取方法和系统。
背景技术
微博已经成为目前网民最为常见的一种休闲互动方式,同时微博也是一种用户了解新闻事件、传播新闻事件的有效工具,具有明显的媒体属性。相同话题所包含的事件构成的集合在新闻门户网站中一般称之为专题,一个专题通常由若干事件进展组成。譬如:“钓鱼岛争端”专题中包括“日本购岛”,“香港保钓”等若干事件。任何专题事件都包括产生、发展、高潮、结束这样一个过程,且整个过程中关键时间节点上发生的事件串联起来便形成了关于该专题进展的事件脉络。事件脉络是了解一个新闻专题事件发展的重要途径。那么,如何基于微博获取某个专题事件的事件脉络便给技术人员提出了新的挑战。
发明内容
本发明的实施例提供一种基于微博的事件脉络获取方法和系统,以利用微博快速、准确的获取预定专题所包含事件的事件脉络。
为达到上述目的,本发明的实施例提供了一种基于微博的事件脉络获取方法,包括:获取统计时间段内针对预定的专题所包含的事件的原创微博及其转发微博的信息;计算所述事件的原创微博及其转发微博的信息在所述统计时间段内对应的关于所述专题的事件热度时间分布,所述事件热度为与事件相关的原创微博及其转发微博在用户群中的关注程度;根据所述统计时间段内所述专题的事件热度时间分布,从所述统计时间段内选取多个事件脉络时间节点,及其对应的节点事件构成所述专题的事件脉络。
进一步地,所述原创微博及其转发微博的信息包括:所述原创微博及其转发微博的评论数、转发数和点赞数。
优选地,所述计算所述事件的原创微博及其转发微博的信息在所述统计时间段内对应的关于所述专题的事件热度时间分布的处理包括:根据所述专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于所述专题的第一事件热度时间分布;所述第一事件热度为所有目标事件对应的所述事件热度的和值。
进一步地,所述根据所述专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于所述专题的第一事件热度时间分布的处理包括:对所述专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数分别设置权重系数;将所述统计时间段内各时间节点对应的所述事件的所有新产生的原创微博及转发微博的所述评论数、转发数和点赞数分别与对应的权重系数相乘后,再相加的和值作为相应时间节点上所述第一事件热度;根据所述统计时间段内各时间节点对应的所述第一事件热度,形成所述第一事件热度时间分布。
进一步地,所述根据所述统计时间段内所述专题的事件热度时间分布,从所述统计时间段内选取多个事件脉络时间节点的处理包括:根据所述统计时间段内所述专题的第一事件热度时间分布,从所述统计时间段内选取多个位于所述第一事件热度时间分布中表征第一事件热度陡增的时间节点;将所述第一事件热度时间分布中表征第一事件热度陡增的时间节点中最早的时间节点确定为起始事件的脉络时间节点。
进一步地,所述根据所述统计时间段内所述专题的第一事件热度时间分布,从所述统计时间段内选取多个位于所述第一事件热度时间分布中表征第一事件热度陡增的时间节点的处理包括:针对所述统计时间段内所述专题对应的所述第一事件热度时间分布,利用一个包含多个时间节点的计算窗口以一个时间节点作为滑动窗口计算所述统计时间段内各时间节点对应的第一事件热度陡增参量,并形成第一事件热度陡增参量序列;将所述第一事件热度陡增参量序列中大于第一阈值的第一事件热度对应的时间节点确定为所述表征第一事件热度陡增的时间节点。
可选地,所述第一阈值为通过如下处理获得:计算所述第一事件热度陡增参量序列的平均值和标准差,并配置相应的权重系数;将所述第一事件热度陡增参量序列的平均值和标准差分别乘以相应的权重系数后,其和值确定为所述第一阈值。
进一步地,所述计算所述事件的原创微博及其转发微博的信息在所述统计时间段内对应的关于所述专题的事件热度时间分布的处理包括:根据所述统计时间段内,所述专题所包含的事件在所述起始事件的脉络时间节点以后的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于所述专题的第二事件热度时间分布;所述第二事件热度为对所有目标事件对应的原创微博及其转发微博分别设置权重系数后的所述事件热度的权重和值。
优选地,所述根据所述统计时间段内,所述专题所包含的事件在所述起始事件的脉络时间节点以后的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于所述专题的第二事件热度时间分布的处理包括:对所述统计时间段内,所述起始事件的脉络时间节点以后的所述专题所包含的事件的所有新产生的原创微博及其转发微博的所述评论数、转发数和点赞数分别设置权重系数;将所述统计时间段内,所述起始事件的脉络时间节点以后的所述专题所包含的事件的所有新产生的原创微博及其转发微博中,在所述起始事件的脉络时间节点以后的各时间节点上新产生的所述评论数、转发数和点赞数分别与对应的权重系数相乘,再将所有原创微博对应的乘积值相加,得到相应时间节点对应的原创微博的事件热度;和再将所有转发微博对应的乘积值相加,得到相应时间节点对应的转发微博的事件热度;对所述原创微博的事件热度和所述转发微博的事件热度分别设置相应的权重系数;将所述起始事件的脉络时间节点以后的各时间节点上对应的所述原创微博的事件热度和转发微博的事件热度分别与相应的权重系数相乘后,再相加的和值作为相应时间节点上所述第二事件热度;根据所述统计时间段内,所述起始事件的脉络时间节点以后的各时间节点对应的所述第二事件热度,形成所述第二事件热度时间分布。
进一步地,所述根据所述统计时间段内所述专题的事件热度时间分布,从所述统计时间段内选取多个事件脉络时间节点的处理包括:根据所述统计时间段内所述专题的第二事件热度时间分布,从所述统计时间段内选取多个位于所述第二事件热度时间分布中表征有新事件产生的时间节点;将所述第二事件热度时间分布中表征有新事件产生的时间节点确定为发展事件的脉络时间节点。
进一步地,所述根据所述统计时间段内所述专题的第二事件热度时间分布,从所述统计时间段内选取多个位于所述第二事件热度时间分布中表征有新事件产生的时间节点的处理包括:统计所述统计时间段内,所述起始事件的脉络时间节点以后的非所述专题对应的其他专题所包含事件对应的所述第二事件热度时间分布;针对包含所述专题以及非所述专题对应的所述第二事件热度时间分布,利用两个相邻且包含相同时间节点的计算窗口以一个时间节点作为滑动窗口计算所述第二事件热度时间分布上每相邻两个时间节点对应的所述专题与非所述专题之间所述第二热度比值的卡方统计量,并将所述卡方统计量作为后一计算窗口中第一个所述时间节点对应的卡法统计量;将所述卡方统计量中大于第二阈值的卡方统计量对应的时间节点确定为一个所述表征有新事件产生的时间节点。
进一步地,所述根据所述统计时间段内所述专题的事件热度时间分布,从所述统计时间段内选取多个事件脉络时间节点对应的所述事件的处理包括:对获取的所述专题对应的所述起始事件的脉络时间节点以及多个所述发展事件的所述脉络时间节点对应的所述专题包含的新增事件的原创微博的事件热度以及微博质量进行综合分数评估,并选取所述综合分数最高的原创微博对应的事件作为相应所述脉络时间节点对应的所述节点事件。
本发明的实施例还提供了一种基于微博的事件脉络获取系统,包括:信息获取模块,用于获取统计时间段内针对预定的专题所包含的事件的原创微博及其转发微博的信息;事件热度计算模块,用于计算所述事件的原创微博及其转发微博的信息在所述统计时间段内对应的关于所述专题的事件热度时间分布,所述事件热度为与事件相关的原创微博及其转发微博在用户群中的关注程度;事件脉络生成模块,用于根据所述统计时间段内所述专题的事件热度时间分布,从所述统计时间段内选取多个事件脉络时间节点,及其对应的节点事件构成所述专题的事件脉络。
进一步地,所述原创微博及其转发微博的信息包括:所述原创微博及其转发微博的评论数、转发数和点赞数。
优选地,所述事件热度计算模块,用于根据所述专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于所述专题的第一事件热度时间分布;所述第一事件热度为所有目标事件对应的所述事件热度的和值。
进一步地,所述事件热度计算模块包括:第一权重系数设置单元,用于对所述专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数分别设置权重系数;第一事件热度生成单元,用于将所述统计时间段内各时间节点对应的所述事件的所有新产生的原创微博及转发微博的所述评论数、转发数和点赞数分别与对应的权重系数相乘后,再相加的和值作为相应时间节点上所述第一事件热度;第一事件热度分布单元,用于根据所述统计时间段内各时间节点对应的所述第一事件热度,形成所述第一事件热度时间分布。
进一步地,所述事件脉络生成模块包括:热度陡增选取单元,用于根据所述统计时间段内所述专题的第一事件热度时间分布,从所述统计时间段内选取多个位于所述第一事件热度时间分布中表征第一事件热度陡增的时间节点;起始事件节点单元,用于将所述第一事件热度时间分布中表征第一事件热度陡增的时间节点中最早的时间节点确定为起始事件的脉络时间节点。
进一步地,所述热度陡增选取单元用于:针对所述统计时间段内所述专题对应的所述第一事件热度时间分布,利用一个包含多个时间节点的计算窗口以一个时间节点作为滑动窗口计算所述统计时间段内各时间节点对应的第一事件热度陡增参量,并形成第一事件热度陡增参量序列;将所述第一事件热度陡增参量序列中大于第一阈值的第一事件热度对应的时间节点确定为所述表征第一事件热度陡增的时间节点。
可选地,所述系统还包括第一阈值获取模块,用于:计算所述第一事件热度陡增参量序列的平均值和标准差,并配置相应的权重系数;将所述第一事件热度陡增参量序列的平均值和标准差分别乘以相应的权重系数后,其和值确定为所述第一阈值。
进一步地,所述事件热度计算模块还用于:根据所述统计时间段内,所述专题所包含的事件在所述起始事件的脉络时间节点以后的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于所述专题的第二事件热度时间分布;所述第二事件热度为对所有目标事件对应的原创微博及其转发微博分别设置权重系数后的所述事件热度的权重和值。
优选地,所述事件热度计算模块还包括:第二权重系数设置单元,用于对所述统计时间段内,所述起始事件的脉络时间节点以后的所述专题所包含的事件的所有新产生的原创微博及其转发微博的所述评论数、转发数和点赞数分别设置权重系数;原创微博热度生成单元,用于将所述统计时间段内,所述起始事件的脉络时间节点以后的所述专题所包含的事件的所有新产生的原创微博中,在所述起始事件的脉络时间节点以后的各时间节点上新产生的所述评论数、转发数和点赞数分别与对应的权重系数相乘,再将所有原创微博对应的乘积值相加,得到相应时间节点对应的原创微博的事件热度;转发微博热度生成单元,用于将所述统计时间段内,所述起始事件的脉络时间节点以后的所述专题所包含的事件的所有新产生的原创微博的转发微博中,在所述起始事件的脉络时间节点以后的各时间节点上新产生的所述评论数、转发数和点赞数分别与对应的权重系数相乘,再将所有转发微博对应的乘积值相加,得到相应时间节点对应的转发微博的事件热度;第三权重系数设置单元,用于对所述原创微博的事件热度和所述转发微博的事件热度分别设置相应的权重系数;
第二事件热度生成单元,用于将所述起始事件的脉络时间节点以后的各时间节点上对应的所述原创微博的事件热度和转发微博的事件热度分别与相应的权重系数相乘后,再相加的和值作为相应时间节点上所述第二事件热度;第二事件热度分布单元,用于根据所述统计时间段内,所述起始事件的脉络时间节点以后的各时间节点对应的所述第二事件热度,形成所述第二事件热度时间分布。
进一步地,所述事件脉络生成模块还包括:新事件选取单元,用于根据所述统计时间段内所述专题的第二事件热度时间分布,从所述统计时间段内选取多个位于所述第二事件热度时间分布中表征有新事件产生的时间节点;发展事件节点单元,用于将所述第二事件热度时间分布中表征有新事件产生的时间节点确定为发展事件的脉络时间节点。
进一步地,所述新事件选取单元用于:统计所述统计时间段内,所述起始事件的脉络时间节点以后的非所述专题对应的其他专题所包含事件对应的所述第二事件热度时间分布;针对包含所述专题以及非所述专题对应的所述第二事件热度时间分布,利用两个相邻且包含相同时间节点的计算窗口以一个时间节点作为滑动窗口计算所述第二事件热度时间分布上每相邻两个时间节点对应的所述专题与非所述专题之间所述第二热度比值的卡方统计量,并将所述卡方统计量作为后一计算窗口中第一个所述时间节点对应的卡法统计量;将所述卡方统计量中大于第二阈值的卡方统计量对应的时间节点确定为一个所述表征有新事件产生的时间节点。
进一步地,所述事件脉络生成模块还用于:对获取的所述专题对应的所述起始事件的脉络时间节点以及多个所述发展事件的所述脉络时间节点对应的所述专题包含的新增事件的原创微博的事件热度以及微博质量进行综合分数评估,并选取所述综合分数最高的原创微博对应的事件作为相应所述脉络时间节点对应的所述节点事件。
本发明实施例提供的基于微博的事件脉络获取方法和系统,通过在统计时间段内,分析获取预定的专题所包含的事件的原创微博及其转发微博在用户群众的关注程度,以形成关于所述专题的事件热度时间分布,然后利用该事件热度时间分布的分布特点从中选取多个事件脉络时间节点,及其对应的节点事件构成关于所述专题的事件脉络。
附图说明
图1为本发明提供的基于微博的事件脉络获取方法一个实施例的方法流程图;
图2为本发明提供的基于微博的事件脉络获取方法另一个实施例的方法流程图;
图3为本发明提供的“钓鱼岛争端”专题的第一事件热度时间分布示意图;
图4为本发明提供的计算时间节点的卡方统计量是采用的计算窗口样例图;
图5为本发明提供的针对专题为“平安”所包含事件的事件脉络样例图;
图6为本发明提供的基于微博的事件脉络获取系统一个实施例的结构示意图;
图7为本发明提供的基于微博的事件脉络获取系统另一个实施例的结构示意图。
具体实施方式
本发明的基本发明构思是,利用微博在用户群中表现出的广泛的关注程度。对预定的专题所包含的事件的原创微博及其转发微博的信息进行统计,并形成针对所述专题的事件热度时间分布来反应用户对该专题所包含事件的关注程度;然后通过分析事件热度时间分布,获取能表征所述专题的发展脉络的事件脉络时间节点和该时间节点上对应的事件,从而形成针对所述专题的完整的事件脉络。
实施例一
图1为本发明提供的基于微博的事件脉络获取方法一个实施例的方法流程图。
参照图1,在步骤S110,获取统计时间段内针对预定的专题所包含的事件的原创微博及其转发微博的信息。
为研究固定时间段内,某预定的专题所包含事件的发展脉络,本实施例中,以该固定时间段作为统计时间段,获取产生于该统计时间段内关于所述专题的所有事件的原创微博及其转发微博的信息。
具体地,在获取事件原创微博及其转发微博的信息时,可将关于目标事件的原始微博作为原创微博,而直接或间接转发该原创微博的微博称为转发微博(通常转发微博的标题中含有“转发”字样)。通常,针对同一事件可以对应多条原创微博(由多个原创博主发布的微博),每条原创微博又可被多次转发而形成转发微博。在本实施例中,可将关于各目标事件的原创微博和转发微博进行归纳统计,从中抽取出事件的原创微博的信息,每条原创微博都可携带一个转发微博列表,该转发微博列表里对应包含了相对于原创微博的各转发微博的信息。这些信息包括微博发布的时间、内容、以及其他用户对该条微博的操作如包括:发表评论、转发、点赞等操作的信息。
在步骤S120,计算事件的原创微博及其转发微博的信息在统计时间段内对应的关于所述专题的事件热度时间分布,所述事件热度为与事件相关的原创微博及其转发微博在用户群中的关注程度。
对获取的上述预定的专题所包含的事件的原创微博及其转发微博的信息进行分析,得到用户对这些事件相关的微博的包括发布原创微博,转发原创微博以及对原创微博以及转发微博进行点击评论、转发、点赞等操作所表征的用户对相应事件的关注程度。然后将用户在统计时间段内对所述专题的相应事件的关注程度进行时间分布统计,得到所述专题的事件热度时间分布。在该事件热度时间分布中,每个时间节点上的事件热度值都反映了用户在该时间节点所表现出的针对所述专题所包含的相关事件的关注程度。
在步骤S130,根据统计时间段内专题的事件热度时间分布,从统计时间段内选取多个事件脉络时间节点,及其对应的节点事件构成专题的事件脉络。
通常,在专题所包含的事件中有新生事件或出现事件进展时,用户会对相关事件的原创微博及其转发微博进行相对集中的关注。而这些集中的关注反映在上述事件热度时间分布中,就对应为事件热度在随时间变化时出现热度陡增现象。利用这一特点,可对上述事件热度时间分布中出现热度陡增的时间节点进行分析,选取其中最可能表征出现事件进展的时间节点作为上述统计时间段内,针对所述专题的事件脉络时间节点。然后从各相关事件中选取与事件脉络时间节点相对应的最可能作为事件进展的节点事件作为相应的节点事件,与相应的事件脉络时间节点结合共同构成所述专题的事件脉络。
当然,本领域技术人员还可利用当所述专题所包含的事件中有新生事件或出现事件进展时,反映在上述事件热度时间分布中的其他关于事件热度变化的特点,从事件热度时间分布中选取所述统计时间段内的事件脉络时间节点,及其对应的节点事件构成所述专题的事件脉络。这些方法均未脱离本实施例中,通过用户对相关事件的微博的关注程度的变化来提取所述专题的事件脉络时间节点以及相应事件的发明构思,因此也不再具有创新性。
这里说明,本实施例以及后续实施例中所述的时间节点可视为在上述统计时间段内对应的最小时长统计单位,即单位统计时长,如1天。
本发明实施例提供的基于微博的事件脉络获取方法,通过在统计时间段内,分析获取预定的专题所包含的事件的原创微博及其转发微博在用户群众的关注程度,以形成关于所述专题的事件热度时间分布,然后利用该事件热度时间分布的分布特点从中选取多个事件脉络时间节点,及其对应的节点事件构成关于所述专题的事件脉络。本实施例所述方法可快速和准确的获取预定专题在统计时间段内的事件脉络。
实施例二
图2为本发明提供的基于微博的事件脉络获取方法另一个实施例的方法流程图,该方法可视为图1所示实施例的一种具体实现形式。在图1所示实施例的基础上,本实施例还示出了从所述统计时间段内选取一个起始事件和多个发展事件的脉络时间节点,以及根据这些事件脉络时间节点选取相应事件为事件脉络的方法。
参照图2,在步骤S210,获取统计时间段内针对预定的专题所包含的事件的原创微博及其转发微博的信息。步骤S210的处理过程与前述步骤S110的处理过程相似。
具体地,本实施例在众多的原创微博及其转发微博的信息中,重点针对原创微博及其转发微博的评论数、转发数和点赞数进行应用统计,以在后续计算事件的原创微博及其转发微博的信息在统计时间段内对应的关于专题的事件热度时间分布时进行应用。
在此基础上,作为步骤S120~S130的细化,本实施例通过统计生成的统计时间段内关于所述专题的第一事件热度时间分布来确定起始事件的脉络时间节点(对应步骤包括S220~S240);通过统计生成的统计时间段内,起始事件的脉络时间节点以后的关于所述专题的第二事件热度时间分布来确定发展事件的脉络时间节点(对应步骤包括S250~S310);通过确定的起始事件和发展事件的脉络时间节点确定相应脉络时间(对应步骤包括S320)。其中,第一事件热度时间分布和第二事件热度时间分布可视为步骤S120中关于事件热度时间分布的两种具体形式。以下将对这些步骤进行具体说明。
在步骤S220,根据专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算统计时间段内关于专题的第一事件热度时间分布;所述第一事件热度为所有目标事件对应的事件热度的和值。
为了确定专题所包含的事件中作为上述统计时间段内的起始事件的脉络时间节点,本实施例将所有关于专题的目标事件的原创微博及其转发微博对应的事件热度的和值作为统计对象,形成第一事件热度。可选地,在形成第一事件热度的过程中,可视原创微博及其转发微博对应的事件热度的权重相同。
具体地,本实施例示出了形成第一事件热度时间分布的一种具体实现方式,包括如下步骤(a1~a3)。
a1,对专题所包含的事件的所有原创微博及其转发微博的评论数、转发数和点赞数分别设置权重系数。
a2,将统计时间段内各时间节点对应的事件的所有新产生的原创微博及转发微博的评论数、转发数和点赞数分别与对应的权重系数相乘后,再相加的和值作为相应时间节点上的第一事件热度。
具体地,通过统计原创微博及转发微博在各时间节点上新产生的评论数、转发数和点赞数可获知用户在该时间节点上对所述专题的相关事件的关注程度。然后,将这些评论数、转发数和点赞数进行加权求和可获知每个时间节点上所述专题被关注的一个事件热度和值。
a3,根据统计时间段内各时间节点对应的第一事件热度,形成第一事件热度时间分布。
如公式(1)和图3所示,本实施例分别示出了计算统计时间段内各时间节点对应的第一事件热度的具体方法以及利用该方法得到的关于“钓鱼岛争端”专题的第一事件热度时间分布示意图。
hot_factor=a*log(comment_num)+b*log(transimit_num)+c*log(praise_num)
                  …………………………………(1)
其中,comment_num、transimit_num、praise_num分别为原创微博或转发微博的评论数、转发数和点赞数;log()为对括号内的参量求取对数;a、b、c分别为评论数、转发数和点赞数对应的权重系数;hot_factor为第一事件热度。
相对应地,基于上述获取的第一事件热度时间分布,本实施例中,针对上述步骤S130,根据统计时间段内专题的事件热度时间分布,从统计时间段内选取多个事件脉络时间节点的处理包括:根据第一事件热度时间分布确定起始事件的脉络时间节点(对应步骤为S230~S240)。
S230,根据统计时间段内专题的第一事件热度时间分布,从统计时间段内选取多个位于第一事件热度时间分布中表征第一事件热度陡增的时间节点。
通常,在专题所包含的事件中有新生事件或出现事件进展时,用户会对相关事件的原创微博及其转发微博进行相对集中的关注。而这些集中的关注反映在上述第一事件热度时间分布中,就对应为第一事件热度在随时间变化时出现热度陡增现象。利用这一特点,可对上述第一事件热度时间分布中出现热度陡增的时间节点进行分析,从中确定出起始事件的脉络时间节点。
具体地,在确定表征第一事件热度陡增的时间节点时,本实施例给出了如下实现方法(对应步骤包括b1~b2):
b1,针对统计时间段内专题对应的第一事件热度时间分布,利用一个包含多个时间节点的计算窗口以一个时间节点作为滑动窗口计算统计时间段内各时间节点对应的第一事件热度陡增参量,并形成第一事件热度陡增参量序列。
例如,可将一个时间节点设置为1天。相对应的,可以3天为一个计算窗口,1天为一个滑动窗口计算统计时间段内各时间节点对应的第一事件热度陡增参量。
举例说明,当计算窗口为[t1,t2,t3],则第t2天对应的第一事件热度陡增参量可通过如下公式获得:
ratio 2 = hot _ factor t 2 - hot _ factor t 1 hot _ factor t 3 - hot _ factor t 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . ( 2 )
其中,ratio2为第2天对应的第一事件热度陡增参量;hot_factort1、hot_factort2、hot_factort3分别为第t1、t2、t3天对应的第一事件热度。
b2,将第一事件热度陡增参量序列中大于第一阈值的第一事件热度对应的时间节点确定为表征第一事件热度陡增的时间节点。
所述的第一阈值为衡量第一事件热度陡增参量是否能够表征其对应的时间节点为第一事件热度陡增的时间节点的参量。
具体地,所述第一阈值可通过对第一事件热度陡增参量序列进行如下处理获得:
通过公式(3)~(4)计算第一事件热度陡增参量序列的平均值和标准差,并配置相应的权重系数;将第一事件热度陡增参量序列的平均值和标准差分别乘以相应的权重系数后,通过公式(5)将二者和值确定为第一阈值。
avg _ ratio = Σ i = 1 n ratio i n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ( 3 )
std _ ratio = Σ i = 1 n ( ratio i - avg - ratio ) 2 n . . . . . . . . . . . . . . . . . . . . . . . . ( 4 )
thresold=avg_ratio+α*std_ratio……………………(5)
其中,ratioi为第i天对应的第一事件热度陡增参量;avg_ratio、std_ratio分别为第一事件热度陡增参量序列的平均值和标准差;n为第一事件热度陡增参量序列的长度;α为标准差对应的权重系数。
例如公式(5)中,可将第一事件热度陡增参量序列的平均值的权重系数设为1、标准差设为小于1的正数。
S240,将第一事件热度时间分布中表征第一事件热度陡增的时间节点中最早的时间节点确定为起始事件的脉络时间节点。
在此基础上,为了确定专题所包含的事件中作为上述统计时间段内的发展事件的脉络时间节点,本实施例将所有在起始事件的脉络时间节点以后新产生的关于专题的目标事件的原创微博及其转发微博对应的事件热度的加权和值作为统计对象,形成第二事件热度。可选地,在形成第二事件热度的过程中,可视原创微博及其转发微博对应的事件热度的权重不相同。
相对应地,本实施例中,基于上述确定的起始事件的脉络时间节点,上述步骤S120,计算事件的原创微博及其转发微博的信息在统计时间段内对应的关于专题的事件热度时间分布的处理还包括:
根据统计时间段内,专题所包含的事件在起始事件的脉络时间节点以后新产生的所有原创微博及其转发微博的评论数、转发数和点赞数计算统计时间段内关于专题的第二事件热度时间分布;所述第二事件热度为对所有目标事件对应的原创微博及其转发微博分别设置权重系数后的事件热度的权重和值。(对应步骤为S250~S290)。
S250,对统计时间段内,起始事件的脉络时间节点以后的专题所包含的事件的所有新产生的原创微博及其转发微博的评论数、转发数和点赞数分别设置权重系数。
S260,将统计时间段内,起始事件的脉络时间节点以后的专题所包含的事件的所有新产生的原创微博及其转发微博中,在起始事件的脉络时间节点以后的各时间节点上新产生的评论数、转发数和点赞数分别与对应的权重系数相乘,再将所有原创微博对应的乘积值相加,得到相应时间节点对应的原创微博的事件热度;和再将所有转发微博对应的乘积值相加,得到相应时间节点对应的转发微博的事件热度。
具体地,通过统计上述目标原创微博及转发微博在各时间节点上新产生的评论数、转发数和点赞数可获知用户在该时间节点上对所述专题发生在起始事件的脉络时间节点以后的相关事件的关注程度。然后,将这些评论数、转发数和点赞数依据所属原创微博或转发微博的属性,分别对原创微博和转发微博进行分类的加权求和,从而可获知每个时间节点上所述专题被关注的两个事件热度和值。
S270,对原创微博的事件热度和转发微博的事件热度分别设置相应的权重系数。
通常,当用户想要对感兴趣的专题做进一步了解时,都会更倾向于关注专题所包含事件的原创微博的信息,以获知相关事件的最初发布情况。基于这个因素,本实施例中对上述原创微博的事件热度和转发微博的事件热度分别设置相应的权重系数,以区别两类微博在用户群中的关注权重。
S280,将起始事件的脉络时间节点以后的各时间节点上对应的原创微博的事件热度和转发微博的事件热度分别与相应的权重系数相乘后,再相加的和值作为相应时间节点上第二事件热度。
如公式(6)~(9)依次给出了各原创微博及其转发微博的事件热度、各原创微博及其转发微博的加权和的事件热度、以及所有原创微博及其转发微博的加权和的事件热度的和值(第二事件热度)的计算表达式。ori_hot_factor=a*log(comment_num)+b*log(transimit_num)+c*log(praise_num)
                                 …………………(6)
transimit_hot_factor=a*log(comment_num)+b*log(transimit_num)+c*log(praise_num)
                                …………………(7)
hot_factor(weiboi)=di*ori_hot_factori+Σtransimit_hot_factorij*ei………………(8)
hot_factor(weibo)=Σhot_factor(weiboi)………………………………………(9)
其中,ori_hot_factor、transimit_hot_factor分别为原创微博及转发微博的事件热度;ori_hot_factori、transimit_hot_factorij、hot_factor(weiboi)分别为第i条原创微博及其所有转发微博中第j条转发微博的事件热度以及二者热度和值(第i条微博的热度);di和ei依次为第i条原创微博及其所有转发微博对应的权重系数;hot_factor(weibo)为所有原创微博及其转发微博的加权和的事件热度的和值(第二事件热度);i、j为大于0的整数。
S290,根据统计时间段内,起始事件的脉络时间节点以后的各时间节点对应的第二事件热度,形成第二事件热度时间分布。
相对应地,基于上述获取的第二事件热度时间分布,本实施例中,针对上述步骤S130,根据统计时间段内专题的事件热度时间分布,从统计时间段内选取多个事件脉络时间节点的处理包括:根据第二事件热度时间分布确定发展事件的脉络时间节点(对应步骤为S300~S310)。
S300,根据统计时间段内专题的第二事件热度时间分布,从统计时间段内选取多个位于第二事件热度时间分布中表征有新事件产生的时间节点。
通常,在专题所包含的事件中有新生事件或出现事件进展时,用户会对相关事件的原创微博及其转发微博进行相对集中的关注。而这些集中的关注反映在上述第二事件热度时间分布中,就对应为第二事件热度在随时间变化时出现热度陡增现象。利用这一特点,可对上述第二事件热度时间分布中出现热度陡增的时间节点进行分析,从中确定出多个发展事件的脉络时间节点。
具体地,本实施例示出了根据第二事件热度时间分布,选取多个表征有新事件产生的时间节点的具体实现方式(对应步骤包括c1~c3)。
c1,统计时间段内,起始事件的脉络时间节点以后的非专题对应的其他专题所包含事件对应的第二事件热度时间分布。
为了表征预定专题中有新事件产生而引起的微博的事件热度的变化,本实施例引入了非预定专题的其他专题所包含的事件的原创微博及其转发微博对应的第二事件热度时间分布作为对比信息,以筛选出预定专题对应的第二事件热度时间分布中表征有新事件产生的时间节点。
其中,关于相同统计时间段内,非预定专题的其他专题对应的第二事件热度时间分布的计算与前述方法相同,在此不做赘述。而针对非预定专题的其他专题的数量在此不做限定,优选的引入尽可能多的数量。
c2,针对包含专题以及非专题对应的第二事件热度时间分布,利用两个相邻且包含相同时间节点的计算窗口以一个时间节点作为滑动窗口计算第二事件热度时间分布上每相邻两个时间节点对应的专题与非专题之间第二热度比值的卡方统计量,并将卡方统计量作为后一计算窗口中第一个所述时间节点对应的卡法统计量。
这里,我们引入了卡方假设检验的方法,通过比较两个相邻窗口的样本参量来为每个事件节点计算出能够表征是否针对预定专题有新生事件或进展事件产生的卡方统计量。
举例说明,本实施例中,将每个时间节点上对应的卡方统计量作为判断该时间节点上,关于预定专题是否有新进展事件发生的一个衡量值。首先选取两个相邻且包含相同时间节点的计算窗口,如图4所示的计算窗口中,每个计算窗口的长度可为4天(对应包含4个时间节点,每个时间节点对应为1天),并以1天为滑动窗口的长度;不断计算时间轴上,每两个计算窗口所对应的卡方统计量,并将该卡方统计量幅值给后一计算窗口中第一个时间节点。由此,利用卡方统计量对每一个时间节点是否为事件进展点进行评估。
具体地,如图4中所示,计算每两个相邻计算窗口对应的卡方统计量的方法如下:
假设两个计算窗口分别为T0和T1,对应的预定专题与非预定专题的第二事件热度如表1所示。分别提取两个计算窗口内预设专题与非预设专题的第二事件热度,得到二者的比值;通过卡方统计的假设检验方法判断这个比值在这两个计算窗口对应的时间段上是否具有显著变化。这个变化的显著性则作为预设专题在该计算窗口内有新事件发生的卡方统计量。
表1预定专题与非预定专题的第二热度分布表
第二事件热度 T0时间段 T1时间段
预定专题 h1 h2
非预定专题 h3 h4
在表1所示内容的基础上,可通过公式(10)得到图4中对应时间段内的卡方统计量的值Score(Q)。
Score ( Q ) = N * ( h 1 h 4 - h 2 h 3 ) 2 ( h 1 + h 3 ) × ( h 2 + h 4 ) × ( h 1 + h 2 ) × ( h 3 + h 4 ) . . . . . . . . . ( 10 )
其中N=h1+h2+h3+h4
最后,将得到的Score(Q)作为后一计算窗口T1中第一个时间节点对应的卡法统计量。
c3,将卡方统计量中大于第二阈值的卡方统计量对应的时间节点确定为一个表征有新事件产生的时间节点。所述的第二阈值为衡量卡方统计量是否能够表征其对应的时间节点为有新事件产生的时间节点的参量。
S310,将第二事件热度时间分布中表征有新事件产生的时间节点确定为发展事件的脉络时间节点。
基于上述步骤获取的起始事件和发展事件的脉络时间节点,作为步骤S130的细化,从相关事件中选取对应的事件从而构成关于所述专题的事件脉络包括(步骤S320):
S320,对获取的专题对应的起始事件的脉络时间节点以及多个发展事件的脉络时间节点对应的专题包含的新增事件的原创微博的事件热度以及微博质量进行综合分数评估,并选取综合分数最高的原创微博对应的事件作为相应脉络时间节点对应的节点事件构成专题的事件脉络。
例如,可通过公式(11)对选定的脉络时间节点对应的预定专题包含的新增事件的原创微博的事件热度以及微博质量进行综合分数评估。
Score(p)=f*ori_hot_factor(weiboi)+g*quality………..(11)
其中,Score(p)为综合分数;ori_hot_factor(weiboi)为目标事件的原创微博的事件热度;quality为原创微博对应的微博质量;f、g分别为原创微博的事件热度机微博质量对应的权重系数。
最后,将综合分数最高的原创微博对应的事件作为相应脉络时间节点对应的节点事件,从而将所有脉络时间节点上的事件依次串连构成专题的事件脉络。
图5所示,为本实施提供的根据上述实施例所示方法得到的针对专题为“平安”所包含事件的事件脉络样例图。
本发明实施例提供的基于微博的事件脉络获取方法,在图1所示实施例的基础上,进一步示出了通过形成的第一事件热度时间分布,确定预定专题的起始事件的脉络时间节点;通过形成的第二事件热度时间分布,确定预定专题的发展事件的脉络时间节点;通过确定的起始事件和发展事件的脉络时间节点,确定相应时间节点上对应的节点事件,从而得到关于预定专题的事件脉络。这些步骤的增加,更提高了最终确定的专题事件的事件脉络的准确性。
实施例三
图6为本发明提供的基于微博的事件脉络获取系统一个实施例的结构示意图,图6所示系统可用于执行如图1所示实施例的方法步骤。
参照图6,该基于微博的事件脉络获取系统具体包括信息获取模块610、事件热度计算模块620和事件脉络生成模块630。
信息获取模块610,用于获取统计时间段内针对预定的专题所包含的事件的原创微博及其转发微博的信息;事件热度计算模块620,用于计算事件的原创微博及其转发微博的信息在统计时间段内对应的关于专题的事件热度时间分布,所述事件热度为与事件相关的原创微博及其转发微博在用户群中的关注程度;事件脉络生成模块630,用于根据统计时间段内专题的事件热度时间分布,从统计时间段内选取多个事件脉络时间节点,及其对应的节点事件构成专题的事件脉络。
本发明实施例提供的基于微博的事件脉络获取系统,通过在统计时间段内,分析获取预定的专题所包含的事件的原创微博及其转发微博在用户群众的关注程度,以形成关于所述专题的事件热度时间分布,然后利用该事件热度时间分布的分布特点从中选取多个事件脉络时间节点,及其对应的节点事件构成关于所述专题的事件脉络。本实施例所述系统可快速和准确的获取预定专题在统计时间段内的事件脉络。
实施例四
图7为本发明提供的基于微博的事件脉络获取系统另一个实施例的结构示意图,可视为图6所示实施例的一种具体实现结构,用于执行如图2所示实施例的方法步骤。
参照图7,该基于微博的事件脉络获取系统包括信息获取模块610、事件热度计算模块620和事件脉络生成模块630,且分别与图6中的相应模块基本相同。
进一步地,所述原创微博及其转发微博的信息包括:原创微博及其转发微博的评论数、转发数和点赞数。
在此基础上,图7所示的系统中,所述事件热度计算模块620还用于根据专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于专题的第一事件热度时间分布;所述第一事件热度为所有目标事件对应的事件热度的和值。
进一步地,上述事件热度计算模块620包括:第一权重系数设置单元621,用于对专题所包含的事件的所有原创微博及其转发微博的评论数、转发数和点赞数分别设置权重系数;第一事件热度生成单元622,用于将统计时间段内各时间节点对应的事件的所有新产生的原创微博及转发微博的所述评论数、转发数和点赞数分别与对应的权重系数相乘后,再相加的和值作为相应时间节点上第一事件热度;第一事件热度分布单元623,用于根据统计时间段内各时间节点对应的第一事件热度,形成第一事件热度时间分布。
在此基础上,相对应的,上述事件脉络生成模块630可包括:热度陡增选取单元631,用于根据统计时间段内专题的第一事件热度时间分布,从统计时间段内选取多个位于第一事件热度时间分布中表征第一事件热度陡增的时间节点;起始事件节点单元632,用于将第一事件热度时间分布中表征第一事件热度陡增的时间节点中最早的时间节点确定为起始事件的脉络时间节点。
进一步地,上述热度陡增选取单元631可用于:针对统计时间段内专题对应的第一事件热度时间分布,利用一个包含多个时间节点的计算窗口以一个时间节点作为滑动窗口计算统计时间段内各时间节点对应的第一事件热度陡增参量,并形成第一事件热度陡增参量序列;将第一事件热度陡增参量序列中大于第一阈值的第一事件热度对应的时间节点确定为表征第一事件热度陡增的时间节点。
进一步地,图7所示的系统中还可包括第一阈值获取模块640,用于:计算所述第一事件热度陡增参量序列的平均值和标准差,并配置相应的权重系数;将第一事件热度陡增参量序列的平均值和标准差分别乘以相应的权重系数后,其和值确定为第一阈值。
在此基础上,上述事件热度计算模块620还可用于:根据统计时间段内,专题所包含的事件在起始事件的脉络时间节点以后的所有原创微博及其转发微博的评论数、转发数和点赞数计算统计时间段内关于专题的第二事件热度时间分布;所述第二事件热度为对所有目标事件对应的原创微博及其转发微博分别设置权重系数后的事件热度的权重和值。
进一步地,上述事件热度计算模块620还可包括:第二权重系数设置单元624,用于对统计时间段内,起始事件的脉络时间节点以后的专题所包含的事件的所有新产生的原创微博及其转发微博的评论数、转发数和点赞数分别设置权重系数;原创微博热度生成单元625,用于将统计时间段内,起始事件的脉络时间节点以后的专题所包含的事件的所有新产生的原创微博中,在起始事件的脉络时间节点以后的各时间节点上新产生的评论数、转发数和点赞数分别与对应的权重系数相乘,再将所有原创微博对应的乘积值相加,得到相应时间节点对应的原创微博的事件热度;转发微博热度生成单元626,用于将统计时间段内,起始事件的脉络时间节点以后的专题所包含的事件的所有新产生的原创微博的转发微博中,在起始事件的脉络时间节点以后的各时间节点上新产生的评论数、转发数和点赞数分别与对应的权重系数相乘,再将所有转发微博对应的乘积值相加,得到相应时间节点对应的转发微博的事件热度;第三权重系数设置单元627,用于对原创微博的事件热度和转发微博的事件热度分别设置相应的权重系数;第二事件热度生成单元628,用于将起始事件的脉络时间节点以后的各时间节点上对应的原创微博的事件热度和转发微博的事件热度分别与相应的权重系数相乘后,再相加的和值作为相应时间节点上第二事件热度;第二事件热度分布单元629,用于根据统计时间段内,起始事件的脉络时间节点以后的各时间节点对应的第二事件热度,形成第二事件热度时间分布。
在此基础上,上述事件脉络生成模块还可包括:新事件选取单元633,用于根据统计时间段内专题的第二事件热度时间分布,从统计时间段内选取多个位于第二事件热度时间分布中表征有新事件产生的时间节点;发展事件节点单元634,用于将第二事件热度时间分布中表征有新事件产生的时间节点确定为发展事件的脉络时间节点。
进一步地,上述新事件选取单元633还可用于:统计上述时间段内,起始事件的脉络时间节点以后的非专题对应的其他专题所包含事件对应的第二事件热度时间分布;针对包含专题以及非专题对应的第二事件热度时间分布,利用两个相邻且包含相同时间节点的计算窗口以一个时间节点作为滑动窗口计算第二事件热度时间分布上每相邻两个时间节点对应的专题与非专题之间第二热度比值的卡方统计量,并将卡方统计量作为后一计算窗口中第一个时间节点对应的卡法统计量;将卡方统计量中大于第二阈值的卡方统计量对应的时间节点确定为一个表征有新事件产生的时间节点。
进一步地,上述事件脉络生成模块630还可用于:对获取的专题对应的起始事件的脉络时间节点以及多个发展事件的所述脉络时间节点对应的专题包含的新增事件的原创微博的事件热度以及微博质量进行综合分数评估,并选取综合分数最高的原创微博对应的事件作为相应脉络时间节点对应的事件。
本发明实施例提供的基于微博的事件脉络获取系统,在图6所示系统实施例的基础上,进一步示出了通过形成的第一事件热度时间分布,确定预定专题的起始事件的脉络时间节点;通过形成的第二事件热度时间分布,确定预定专题的发展事件的脉络时间节点;通过确定的起始事件和发展事件的脉络时间节点,确定相应时间节点上对应的节点事件,从而得到关于预定专题的事件脉络。这些步骤的增加,更提高了最终确定的专题事件的事件脉络的准确性。
上述根据本发明的方法和装置可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (24)

1.一种基于微博的事件脉络获取方法,其特征在于,包括:
获取统计时间段内针对预定的专题所包含的事件的原创微博及其转发微博的信息;
计算所述事件的原创微博及其转发微博的信息在所述统计时间段内对应的关于所述专题的事件热度时间分布,所述事件热度为与事件相关的原创微博及其转发微博在用户群中的关注程度;
根据所述统计时间段内所述专题的事件热度时间分布,从所述统计时间段内选取多个事件脉络时间节点,及其对应的节点事件构成所述专题的事件脉络。
2.根据权利要求1所述的方法,其特征在于,所述原创微博及其转发微博的信息包括:所述原创微博及其转发微博的评论数、转发数和点赞数。
3.根据权利要求2所述的方法,其特征在于,所述计算所述事件的原创微博及其转发微博的信息在所述统计时间段内对应的关于所述专题的事件热度时间分布的处理包括:
根据所述专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于所述专题的第一事件热度时间分布;所述第一事件热度为所有目标事件对应的所述事件热度的和值。
4.根据权利要求3所述的方法,其特征在于,所述根据所述专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于所述专题的第一事件热度时间分布的处理包括:
对所述专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数分别设置权重系数;
将所述统计时间段内各时间节点对应的所述事件的所有新产生的原创微博及转发微博的所述评论数、转发数和点赞数分别与对应的权重系数相乘后,再相加的和值作为相应时间节点上所述第一事件热度;
根据所述统计时间段内各时间节点对应的所述第一事件热度,形成所述第一事件热度时间分布。
5.根据权利要求4所述的方法,其特征在于,所述根据所述统计时间段内所述专题的事件热度时间分布,从所述统计时间段内选取多个事件脉络时间节点的处理包括:
根据所述统计时间段内所述专题的第一事件热度时间分布,从所述统计时间段内选取多个位于所述第一事件热度时间分布中表征第一事件热度陡增的时间节点;
将所述第一事件热度时间分布中表征第一事件热度陡增的时间节点中最早的时间节点确定为起始事件的脉络时间节点。
6.根据权利要求5所述的方法,其特征在于,所述根据所述统计时间段内所述专题的第一事件热度时间分布,从所述统计时间段内选取多个位于所述第一事件热度时间分布中表征第一事件热度陡增的时间节点的处理包括:
针对所述统计时间段内所述专题对应的所述第一事件热度时间分布,利用一个包含多个时间节点的计算窗口以一个时间节点作为滑动窗口计算所述统计时间段内各时间节点对应的第一事件热度陡增参量,并形成第一事件热度陡增参量序列;
将所述第一事件热度陡增参量序列中大于第一阈值的第一事件热度对应的时间节点确定为所述表征第一事件热度陡增的时间节点。
7.根据权利要求6所述的方法,其特征在于,所述第一阈值为通过如下处理获得:
计算所述第一事件热度陡增参量序列的平均值和标准差,并配置相应的权重系数;
将所述第一事件热度陡增参量序列的平均值和标准差分别乘以相应的权重系数后,其和值确定为所述第一阈值。
8.根据权利要求5-7中任一项所述的方法,其特征在于,所述计算所述事件的原创微博及其转发微博的信息在所述统计时间段内对应的关于所述专题的事件热度时间分布的处理包括:
根据所述统计时间段内,所述专题所包含的事件在所述起始事件的脉络时间节点以后的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于所述专题的第二事件热度时间分布;所述第二事件热度为对所有目标事件对应的原创微博及其转发微博分别设置权重系数后的所述事件热度的权重和值。
9.根据权利要求8所述的方法,其特征在于,所述根据所述统计时间段内,所述专题所包含的事件在所述起始事件的脉络时间节点以后的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于所述专题的第二事件热度时间分布的处理包括:
对所述统计时间段内,所述起始事件的脉络时间节点以后的所述专题所包含的事件的所有新产生的原创微博及其转发微博的所述评论数、转发数和点赞数分别设置权重系数;
将所述统计时间段内,所述起始事件的脉络时间节点以后的所述专题所包含的事件的所有新产生的原创微博及其转发微博中,在所述起始事件的脉络时间节点以后的各时间节点上新产生的所述评论数、转发数和点赞数分别与对应的权重系数相乘,再将所有原创微博对应的乘积值相加,得到相应时间节点对应的原创微博的事件热度;和再将所有转发微博对应的乘积值相加,得到相应时间节点对应的转发微博的事件热度;
对所述原创微博的事件热度和所述转发微博的事件热度分别设置相应的权重系数;
将所述起始事件的脉络时间节点以后的各时间节点上对应的所述原创微博的事件热度和转发微博的事件热度分别与相应的权重系数相乘后,再相加的和值作为相应时间节点上所述第二事件热度;
根据所述统计时间段内,所述起始事件的脉络时间节点以后的各时间节点对应的所述第二事件热度,形成所述第二事件热度时间分布。
10.根据权利要求9所述的方法,其特征在于,所述根据所述统计时间段内所述专题的事件热度时间分布,从所述统计时间段内选取多个事件脉络时间节点的处理包括:
根据所述统计时间段内所述专题的第二事件热度时间分布,从所述统计时间段内选取多个位于所述第二事件热度时间分布中表征有新事件产生的时间节点;
将所述第二事件热度时间分布中表征有新事件产生的时间节点确定为发展事件的脉络时间节点。
11.根据权利要求10所述的方法,其特征在于,所述根据所述统计时间段内所述专题的第二事件热度时间分布,从所述统计时间段内选取多个位于所述第二事件热度时间分布中表征有新事件产生的时间节点的处理包括:
统计所述统计时间段内,所述起始事件的脉络时间节点以后的非所述专题对应的其他专题所包含事件对应的所述第二事件热度时间分布;
针对包含所述专题以及非所述专题对应的所述第二事件热度时间分布,利用两个相邻且包含相同时间节点的计算窗口以一个时间节点作为滑动窗口计算所述第二事件热度时间分布上每相邻两个时间节点对应的所述专题与非所述专题之间所述第二热度比值的卡方统计量,并将所述卡方统计量作为后一计算窗口中第一个所述时间节点对应的卡法统计量;
将所述卡方统计量中大于第二阈值的卡方统计量对应的时间节点确定为一个所述表征有新事件产生的时间节点。
12.根据权利要求10或11所述的方法,其特征在于,所述根据所述统计时间段内所述专题的事件热度时间分布,从所述统计时间段内选取多个事件脉络时间节点对应的所述事件的处理包括:
对获取的所述专题对应的所述起始事件的脉络时间节点以及多个所述发展事件的所述脉络时间节点对应的所述专题包含的新增事件的原创微博的事件热度以及微博质量进行综合分数评估,并选取所述综合分数最高的原创微博对应的事件作为相应所述脉络时间节点对应的所述节点事件。
13.一种基于微博的事件脉络获取系统,其特征在于,包括:
信息获取模块,用于获取统计时间段内针对预定的专题所包含的事件的原创微博及其转发微博的信息;
事件热度计算模块,用于计算所述事件的原创微博及其转发微博的信息在所述统计时间段内对应的关于所述专题的事件热度时间分布,所述事件热度为与事件相关的原创微博及其转发微博在用户群中的关注程度;
事件脉络生成模块,用于根据所述统计时间段内所述专题的事件热度时间分布,从所述统计时间段内选取多个事件脉络时间节点,及其对应的节点事件构成所述专题的事件脉络。
14.根据权利要求13所述的系统,其特征在于,所述原创微博及其转发微博的信息包括:所述原创微博及其转发微博的评论数、转发数和点赞数。
15.根据权利要求14所述的系统,其特征在于,所述事件热度计算模块,用于根据所述专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于所述专题的第一事件热度时间分布;所述第一事件热度为所有目标事件对应的所述事件热度的和值。
16.根据权利要求15所述的系统,其特征在于,所述事件热度计算模块包括:
第一权重系数设置单元,用于对所述专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数分别设置权重系数;
第一事件热度生成单元,用于将所述统计时间段内各时间节点对应的所述事件的所有新产生的原创微博及转发微博的所述评论数、转发数和点赞数分别与对应的权重系数相乘后,再相加的和值作为相应时间节点上所述第一事件热度;
第一事件热度分布单元,用于根据所述统计时间段内各时间节点对应的所述第一事件热度,形成所述第一事件热度时间分布。
17.根据权利要求16所述的系统,其特征在于,所述事件脉络生成模块包括:
热度陡增选取单元,用于根据所述统计时间段内所述专题的第一事件热度时间分布,从所述统计时间段内选取多个位于所述第一事件热度时间分布中表征第一事件热度陡增的时间节点;
起始事件节点单元,用于将所述第一事件热度时间分布中表征第一事件热度陡增的时间节点中最早的时间节点确定为起始事件的脉络时间节点。
18.根据权利要求17所述的系统,其特征在于,所述热度陡增选取单元用于:
针对所述统计时间段内所述专题对应的所述第一事件热度时间分布,利用一个包含多个时间节点的计算窗口以一个时间节点作为滑动窗口计算所述统计时间段内各时间节点对应的第一事件热度陡增参量,并形成第一事件热度陡增参量序列;
将所述第一事件热度陡增参量序列中大于第一阈值的第一事件热度对应的时间节点确定为所述表征第一事件热度陡增的时间节点。
19.根据权利要求18所述的系统,其特征在于,所述系统还包括第一阈值获取模块,用于:
计算所述第一事件热度陡增参量序列的平均值和标准差,并配置相应的权重系数;
将所述第一事件热度陡增参量序列的平均值和标准差分别乘以相应的权重系数后,其和值确定为所述第一阈值。
20.根据权利要求17-19中任一项所述的系统,其特征在于,所述事件热度计算模块还用于:
根据所述统计时间段内,所述专题所包含的事件在所述起始事件的脉络时间节点以后的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于所述专题的第二事件热度时间分布;所述第二事件热度为对所有目标事件对应的原创微博及其转发微博分别设置权重系数后的所述事件热度的权重和值。
21.根据权利要求20所述的系统,其特征在于,所述事件热度计算模块还包括:
第二权重系数设置单元,用于对所述统计时间段内,所述起始事件的脉络时间节点以后的所述专题所包含的事件的所有新产生的原创微博及其转发微博的所述评论数、转发数和点赞数分别设置权重系数;
原创微博热度生成单元,用于将所述统计时间段内,所述起始事件的脉络时间节点以后的所述专题所包含的事件的所有新产生的原创微博中,在所述起始事件的脉络时间节点以后的各时间节点上新产生的所述评论数、转发数和点赞数分别与对应的权重系数相乘,再将所有原创微博对应的乘积值相加,得到相应时间节点对应的原创微博的事件热度;
转发微博热度生成单元,用于将所述统计时间段内,所述起始事件的脉络时间节点以后的所述专题所包含的事件的所有新产生的原创微博的转发微博中,在所述起始事件的脉络时间节点以后的各时间节点上新产生的所述评论数、转发数和点赞数分别与对应的权重系数相乘,再将所有转发微博对应的乘积值相加,得到相应时间节点对应的转发微博的事件热度;
第三权重系数设置单元,用于对所述原创微博的事件热度和所述转发微博的事件热度分别设置相应的权重系数;
第二事件热度生成单元,用于将所述起始事件的脉络时间节点以后的各时间节点上对应的所述原创微博的事件热度和转发微博的事件热度分别与相应的权重系数相乘后,再相加的和值作为相应时间节点上所述第二事件热度;
第二事件热度分布单元,用于根据所述统计时间段内,所述起始事件的脉络时间节点以后的各时间节点对应的所述第二事件热度,形成所述第二事件热度时间分布。
22.根据权利要求21所述的系统,其特征在于,所述事件脉络生成模块还包括:
新事件选取单元,用于根据所述统计时间段内所述专题的第二事件热度时间分布,从所述统计时间段内选取多个位于所述第二事件热度时间分布中表征有新事件产生的时间节点;
发展事件节点单元,用于将所述第二事件热度时间分布中表征有新事件产生的时间节点确定为发展事件的脉络时间节点。
23.根据权利要求22所述的系统,其特征在于,所述新事件选取单元用于:
统计所述统计时间段内,所述起始事件的脉络时间节点以后的非所述专题对应的其他专题所包含事件对应的所述第二事件热度时间分布;
针对包含所述专题以及非所述专题对应的所述第二事件热度时间分布,利用两个相邻且包含相同时间节点的计算窗口以一个时间节点作为滑动窗口计算所述第二事件热度时间分布上每相邻两个时间节点对应的所述专题与非所述专题之间所述第二热度比值的卡方统计量,并将所述卡方统计量作为后一计算窗口中第一个所述时间节点对应的卡法统计量;
将所述卡方统计量中大于第二阈值的卡方统计量对应的时间节点确定为一个所述表征有新事件产生的时间节点。
24.根据权利要求22或23所述的系统,其特征在于,所述事件脉络生成模块还用于:
对获取的所述专题对应的所述起始事件的脉络时间节点以及多个所述发展事件的所述脉络时间节点对应的所述专题包含的新增事件的原创微博的事件热度以及微博质量进行综合分数评估,并选取所述综合分数最高的原创微博对应的事件作为相应所述脉络时间节点对应的所述节点事件。
CN201510324990.9A 2015-06-12 2015-06-12 基于微博的事件脉络获取方法和系统 Active CN104933129B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510324990.9A CN104933129B (zh) 2015-06-12 2015-06-12 基于微博的事件脉络获取方法和系统
US14/954,720 US10324989B2 (en) 2015-06-12 2015-11-30 Microblog-based event context acquiring method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510324990.9A CN104933129B (zh) 2015-06-12 2015-06-12 基于微博的事件脉络获取方法和系统

Publications (2)

Publication Number Publication Date
CN104933129A true CN104933129A (zh) 2015-09-23
CN104933129B CN104933129B (zh) 2019-04-30

Family

ID=54120296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510324990.9A Active CN104933129B (zh) 2015-06-12 2015-06-12 基于微博的事件脉络获取方法和系统

Country Status (2)

Country Link
US (1) US10324989B2 (zh)
CN (1) CN104933129B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701226A (zh) * 2016-01-18 2016-06-22 合网络技术(北京)有限公司 多媒体资源评估方法和装置
CN106776841A (zh) * 2016-11-28 2017-05-31 福建亿榕信息技术有限公司 一种互联网舆情事件传播指数的获取方法和系统
CN106844466A (zh) * 2016-12-21 2017-06-13 百度在线网络技术(北京)有限公司 事件脉络生成方法和装置
CN107229645A (zh) * 2016-03-24 2017-10-03 腾讯科技(深圳)有限公司 信息处理方法、服务平台及客户端
CN107995092A (zh) * 2016-10-27 2018-05-04 北京国双科技有限公司 处理网络社交平台发布的信息的方法及装置
CN108733763A (zh) * 2018-04-16 2018-11-02 国家计算机网络与信息安全管理中心 基于微博热门事件计算关键节点的方法及装置
CN109344316A (zh) * 2018-08-14 2019-02-15 优视科技(中国)有限公司 新闻热度计算方法及装置
CN110232077A (zh) * 2019-06-19 2019-09-13 北京百度网讯科技有限公司 事件脉络生成方法及装置
CN113010779A (zh) * 2021-03-10 2021-06-22 腾讯科技(深圳)有限公司 媒体信息的热度计算方法、装置、电子设备及存储介质
CN113282837A (zh) * 2021-06-22 2021-08-20 中国平安人寿保险股份有限公司 事件分析方法、装置、计算机设备及存储介质
CN115878761A (zh) * 2023-03-02 2023-03-31 湖南蚁坊软件股份有限公司 事件脉络生成方法、设备及介质

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193797B (zh) * 2017-04-26 2020-08-18 天津大学 中文微博的热点话题检测及趋势预测方法
US11070640B1 (en) * 2018-12-28 2021-07-20 8X8, Inc. Contextual timeline of events for data communications between client-specific servers and data-center communications providers
US11044338B1 (en) 2018-12-28 2021-06-22 8X8, Inc. Server-presented inquiries using specific context from previous communications
US11196866B1 (en) 2019-03-18 2021-12-07 8X8, Inc. Apparatuses and methods involving a contact center virtual agent
US11445063B1 (en) 2019-03-18 2022-09-13 8X8, Inc. Apparatuses and methods involving an integrated contact center
US11539541B1 (en) 2019-03-18 2022-12-27 8X8, Inc. Apparatuses and methods involving data-communications room predictions
US11622043B1 (en) 2019-03-18 2023-04-04 8X8, Inc. Apparatuses and methods involving data-communications virtual assistance
CN111026958B (zh) * 2019-11-29 2023-07-25 微梦创科网络科技(中国)有限公司 一种热门微博排序方法及装置
CN111382365B (zh) * 2020-03-19 2023-07-28 北京百度网讯科技有限公司 用于输出信息的方法和装置
CN112328747B (zh) * 2020-11-06 2024-05-24 平安科技(深圳)有限公司 事件脉络生成方法、装置、终端设备及存储介质
CN112418359B (zh) * 2021-01-21 2021-04-09 国汽智控(北京)科技有限公司 一种基于道路场景的任务处理方法及系统
US11979273B1 (en) 2021-05-27 2024-05-07 8X8, Inc. Configuring a virtual assistant based on conversation data in a data-communications server system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102012917A (zh) * 2010-11-26 2011-04-13 百度在线网络技术(北京)有限公司 信息处理装置以及处理方法
CN103324718A (zh) * 2013-06-25 2013-09-25 百度在线网络技术(北京)有限公司 基于海量搜索日志挖掘话题脉络的方法和系统
CN103631862A (zh) * 2012-11-02 2014-03-12 中国人民解放军国防科学技术大学 基于微博的事件特征演化挖掘方法及系统
CN104536956A (zh) * 2014-07-23 2015-04-22 中国科学院计算技术研究所 一种基于微博平台的事件可视化方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013084028A1 (en) * 2011-12-08 2013-06-13 Nokia Corporation Supporting a presentation of information to a user
US10348547B2 (en) * 2013-01-25 2019-07-09 International Business Machines Corporation System and method for managing content
US10242107B2 (en) * 2015-01-11 2019-03-26 Microsoft Technology Licensing, Llc Extraction of quantitative data from online content

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102012917A (zh) * 2010-11-26 2011-04-13 百度在线网络技术(北京)有限公司 信息处理装置以及处理方法
CN103631862A (zh) * 2012-11-02 2014-03-12 中国人民解放军国防科学技术大学 基于微博的事件特征演化挖掘方法及系统
CN103324718A (zh) * 2013-06-25 2013-09-25 百度在线网络技术(北京)有限公司 基于海量搜索日志挖掘话题脉络的方法和系统
CN104536956A (zh) * 2014-07-23 2015-04-22 中国科学院计算技术研究所 一种基于微博平台的事件可视化方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
冯雪坪: ""微博话题检测与跟踪方法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
徐会杰 等: ""面向论坛的突发性热点话题快速发现与跟踪"", 《中南大学学报(自然科学版)》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701226A (zh) * 2016-01-18 2016-06-22 合网络技术(北京)有限公司 多媒体资源评估方法和装置
CN107229645A (zh) * 2016-03-24 2017-10-03 腾讯科技(深圳)有限公司 信息处理方法、服务平台及客户端
CN107995092A (zh) * 2016-10-27 2018-05-04 北京国双科技有限公司 处理网络社交平台发布的信息的方法及装置
CN106776841A (zh) * 2016-11-28 2017-05-31 福建亿榕信息技术有限公司 一种互联网舆情事件传播指数的获取方法和系统
CN106844466A (zh) * 2016-12-21 2017-06-13 百度在线网络技术(北京)有限公司 事件脉络生成方法和装置
CN108733763B (zh) * 2018-04-16 2022-05-17 国家计算机网络与信息安全管理中心 基于微博热门事件计算关键节点的方法及装置
CN108733763A (zh) * 2018-04-16 2018-11-02 国家计算机网络与信息安全管理中心 基于微博热门事件计算关键节点的方法及装置
CN109344316A (zh) * 2018-08-14 2019-02-15 优视科技(中国)有限公司 新闻热度计算方法及装置
CN109344316B (zh) * 2018-08-14 2022-04-29 阿里巴巴(中国)有限公司 新闻热度计算方法及装置
CN110232077A (zh) * 2019-06-19 2019-09-13 北京百度网讯科技有限公司 事件脉络生成方法及装置
CN113010779A (zh) * 2021-03-10 2021-06-22 腾讯科技(深圳)有限公司 媒体信息的热度计算方法、装置、电子设备及存储介质
CN113010779B (zh) * 2021-03-10 2023-07-25 腾讯科技(深圳)有限公司 媒体信息的热度计算方法、装置、电子设备及存储介质
CN113282837A (zh) * 2021-06-22 2021-08-20 中国平安人寿保险股份有限公司 事件分析方法、装置、计算机设备及存储介质
CN113282837B (zh) * 2021-06-22 2023-07-21 中国平安人寿保险股份有限公司 事件分析方法、装置、计算机设备及存储介质
CN115878761A (zh) * 2023-03-02 2023-03-31 湖南蚁坊软件股份有限公司 事件脉络生成方法、设备及介质

Also Published As

Publication number Publication date
CN104933129B (zh) 2019-04-30
US20160364488A1 (en) 2016-12-15
US10324989B2 (en) 2019-06-18

Similar Documents

Publication Publication Date Title
CN104933129A (zh) 基于微博的事件脉络获取方法和系统
CN109558295B (zh) 一种性能指标异常检测方法及装置
WO2017148314A1 (zh) 一种机器学习系统的训练方法和训练系统
CN109508416B (zh) 基于评论数量的微博舆情事件热度与发展趋势预测方法
CN101166159B (zh) 一种确定垃圾信息的方法及系统
CN107506941A (zh) 一种基于大数据技术的建筑施工企业信用评价方法和系统
CN106897833B (zh) 一种新能源配电网可靠性的评估方法及装置
CN104504583A (zh) 分类器的评价方法
CN103593718A (zh) 一种负荷组合预测方法及装置
CN101268465B (zh) 分类一组电子文档的方法
CN104102804A (zh) 一种预测设备器件寿命的方法及装置
CN114021338A (zh) 一种基于多源数据融合的可靠性评估方法
Whalen et al. An evaluation of the self-determined probability-weighted moment method for estimating extreme wind speeds
CN108491451B (zh) 一种英文阅读文章推荐方法、装置、电子设备及存储介质
CN114546841B (zh) 基于云计算的软件质量评估方法
CN116151460A (zh) 车辆智能化产品的优化方法、装置、服务器及存储介质
CN114201941A (zh) 一种芯片性能验证方法及装置、电子设备、存储介质
CN112148764B (zh) 特征的筛选方法、装置、设备和存储介质
CN104572791A (zh) 搜索提示系统的评估方法及装置
CN103793390A (zh) 查询条件相似度确定方法、对象查询方法及相关装置
CN103793339B (zh) 基于内存访问堆栈距离的数据Cache性能探索方法
Asghar et al. Analysis of seasonal level shift (SLS) detection in SARIMA models
CN109189346B (zh) 一种数据处理方法及装置
CN105389406A (zh) 基于故障的单位加权累计数的整车设计可靠性评估方法
CN105786900A (zh) 一种基于排放大数据的汽车环保分析方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant