CN108376175A - 一种展示新闻事件的可视化方法 - Google Patents

一种展示新闻事件的可视化方法 Download PDF

Info

Publication number
CN108376175A
CN108376175A CN201810175268.7A CN201810175268A CN108376175A CN 108376175 A CN108376175 A CN 108376175A CN 201810175268 A CN201810175268 A CN 201810175268A CN 108376175 A CN108376175 A CN 108376175A
Authority
CN
China
Prior art keywords
news
media event
headline
event
topicid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810175268.7A
Other languages
English (en)
Other versions
CN108376175B (zh
Inventor
范艳艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Shufeng Technology Co ltd
Chengdu Ruima Technology Co ltd
Original Assignee
Hangzhou Shufeng Technology Co ltd
Chengdu Ruima Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Shufeng Technology Co ltd, Chengdu Ruima Technology Co ltd filed Critical Hangzhou Shufeng Technology Co ltd
Priority to CN201810175268.7A priority Critical patent/CN108376175B/zh
Publication of CN108376175A publication Critical patent/CN108376175A/zh
Application granted granted Critical
Publication of CN108376175B publication Critical patent/CN108376175B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种展示新闻事件的可视化方法,包括:从后台数据库获取新闻,所述新闻包括新闻ID、新闻标题、新闻内容、新闻声量和新闻所属TopicID,抽取新闻所属TopicID相同的新闻簇即新闻事件,其中,新闻总数为M,新闻事件总数为N,M≤N;将所述新闻事件数值化;将数值化后的新闻标题、新闻内容和新闻事件降维;计算新闻事件的热力值,在二维平面绘制新闻事件的坐标,新闻事件对应的像素点的热力值即为新闻事件的声量总和;采用绘图工具包将每个像素点转化为不同的颜色,最终形成新闻事件热力图。本发明在新闻事件聚类的基础上,将新闻事件向量化并降维处理后映射到二维平面上,形成新闻事件的热力图,可以直观的看到新闻事件的热度及相关性。

Description

一种展示新闻事件的可视化方法
技术领域
本发明涉及新闻信息技术领域,具体的说,是一种展示新闻事件的可视化方法。
背景技术
新闻,它是对新近发生的有社会意义并引起公众兴趣的事实的简短报道。除了传统媒介之外,网络也是新闻传播的一个重要媒介。目前,网络作为媒介传播新闻时,一般都是由各个新闻媒体将新闻发布在自己网站或频道上。大众通过关键词搜索可以看到与关键词相关的新闻,由于这些新闻的来源不同,即使新闻关键词相关,却并不能确定这些新闻都是针对同一事件新闻,因此,在这些铺天盖地的信息,大众很难从中挑选针对某一事件的新闻,极大地影响了用户阅读新闻的效率及获取新闻信息的准确性,也无法直观的看到新闻事件的热度和相关性。
发明内容
本发明的目的在于提供一种展示新闻事件的可视化方法,用于解决现有技术中用户无法直观看到新闻事件的热度和相关性的问题。
为了达到上述目的,本发明通过下述技术方案实现:
一种展示新闻事件的可视化方法,包括:
步骤S100:从后台数据库获取新闻,所述新闻包括新闻ID、新闻标题、新闻内容、新闻声量和新闻所属TopicID,抽取新闻所属TopicID相同的新闻簇即新闻事件,其中,新闻总数为M,新闻事件总数为N,M≤N;
步骤S200:将所述新闻事件数值化;
步骤S300:将数值化后的新闻标题、新闻内容和新闻事件降维;
步骤S400:计算新闻事件的热力值,在二维平面绘制新闻事件的坐标,新闻事件对应的像素点的热力值即为新闻事件的声量总和;
步骤S500:采用绘图工具包matplotlib,将每个像素点转化为不同的颜色,最终形成新闻事件热力图。
工作原理:
后台数据库通过动态网页抓取新闻数据,包括新闻ID、新闻标题、新闻内容、新闻声量和新闻所属TopicID,然后从新闻数据中抽取新闻事件;将新闻事件进行数值化处理,将新闻事件、新闻标题和新闻内容的文本分别训练成数值向量,数值向量的长度为可调整的参数,在这里取300维。然后将数值化后的新闻事件、新闻标题和新闻内容作降维处理,将300维降为二维或者三维,这里采用降为二维。然后在二维平面上计算各个新闻事件的坐标点,相关度稿的新闻事件在二维平面的距离越近,热力值即新闻事件的声量总和,新闻事件的声量即评论人数,因此,从新闻事件的声量总和,可以反映出新闻事件的受关注程度,因此新闻事件越受关注,热力值越大,则该新闻事件的像素点越大,则反映出辐射能力越强,则该新闻事件的亮度越高。不同新闻事件的热力值不同,则对应的该坐标点的像素点不同,即辐射能力不同。采用绘图工具包matplotlib,将每个像素点转化为不同的颜色,最终形成新闻事件热力图,从像素点的颜色可以区分新闻事件的受关注程度,从新闻事件的距离,可以看出新闻事件的相关度,更加直观的展示新闻事件的热度和相关度。
进一步地,所述步骤S100具体包括:
步骤S110:获取新闻,其中包括新闻ID,新闻标题和新闻内容;
步骤S120:从新闻内容中抽取新闻摘要,并分别将新闻标题和新闻内容进行数值化转换;
步骤S130:设置一个新闻箱,该新闻箱中包含新闻ID,新闻标题,新闻内容和新闻所属TopicID,并将第一条新闻的新闻ID,新闻标题,新闻内容和新闻所属TopicID放入新闻箱中;
步骤S140:依次遍历余下新闻,计算余下新闻与新闻箱中已有新闻的相似度,如果最大相似度大于阈值P,则该新闻的新闻所属TopicID与已有新闻的新闻所属TopicID相似度大,属于相同的新闻所属TopicID,反之,则用该新闻的新闻摘要表示其新闻所属TopicID,并将该新闻的新闻ID,新闻标题,新闻内容和新闻所属事件放入新闻箱中;
步骤S150:遍历结束后,新闻箱中包含全部新闻ID,新闻标题,新闻内容和新闻所属事件;
步骤S160:抽取新闻所属TopicID相同的新闻簇,即新闻事件。
工作原理:
从数据库中获取新闻的新闻ID,新闻内容、新闻标题和新闻所属TopicID,新闻所属TopicID相同的新闻簇代表一个新闻事件。在将新闻放入新闻箱中时,比较新放入的新闻与已在新闻箱中新闻的新闻所属TopicID是否相同,如果相同则为同一新闻事件,如果不同,则新放入新闻的新闻摘要作为其新闻所属TopicID,遍历结束后,抽取新闻事件,进行数值化。
进一步地,所述步骤S120中数值化转换具体包括:
步骤S121:将所述新闻标题和新闻内容进行分字处理;
步骤S122:采用训练模型将分字处理后的新闻标题和新闻内容分别转化为300维的数值向量。
工作原理:
分字处理是将新闻标题、新闻内容中的句子中的每个字都用空格分隔,然后将分隔后的新闻标题和新闻内容进行训练,将文本内容转换为数值向量,数值向量的长度可以设定。
进一步地,所述步骤S200具体为:对每一个新闻事件下的新闻,分别将数值化后的新闻标题和新闻内容的对应维度相加后取平均值,获取每个新闻事件的向量化表示,其中新闻标题和新闻内容均为300维,同时,将每个新闻事件下的新闻声量相加,获取新闻事件总声量。
工作原理:
将新闻事件下的每一个新闻数值化后的新闻标题、新闻内容的对应维度进行相加取平均,得到新闻事件的向量化表示,同时将同一新闻事件下的新闻声量相加,得到新闻事件总声量即新闻事件的热力值。
进一步地,所述步骤S300具体包括:
步骤S310:使用高维数据降维方法MDS,将新闻事件从300维的向量降成2维向量;
步骤S320:将2维向量做标准化处理,处理方法如下:
其中,Xmin表示降维后,第一维向量的最小值,Xmax表示第一维向量的最大值,Ymin表示第二维向量的最小值,Ymax表示第二维向量的最大值,且Xi∈[0,1000],Yi∈[0,1000]。
工作原理:
首先采用高维数据降维方法MDS,将300维向量降为而维,然后通过标准化处理,将降维后的向量坐标设置在1000*1000的二维平面内。Xi和Yi分别代表新闻事件在二维平面的坐标点。
进一步地,所述步骤S400具体包括:
步骤S410:计算热力值,方法如下:
其中,s表示二维平面中的任意点;i为新闻事件代表的像素点的集合,共M个新闻事件;Wi表示新闻事件代表的像素点的热度;dsi表示s到i的距离;α表示热力值衰减因子,当dsi≤5时,α=0.001,当d_si>5时,α=0.01;
步骤S420:绘制1000*1000,共1000000个像素点的二维平面,并在该二维平面上绘制新闻事件的坐标。
工作原理:
分别计算M个新闻事件的热力值,并计算出这M个新闻事件对二维平面上的其他像素点的辐射能力,新闻事件对其他像素点的热力值随着距离的增大而衰减,即辐射能力减弱。新闻事件的距离越近,表示新闻事件之间的相关性越大,反之,表示新闻事件之间的相关性越小。新闻事件的像素点的热力值越大,该新闻事件的亮度越大。因此可以直观的看出新闻事件的热度以及新闻事件之间的相关程度。
进一步地,所述步骤S122中的训练模型采用Doc2vec模型。
采用Doc2vec模型,采用doc_vec=[1,1,1,……1],doc_vec长度为300输入长度为300维的向量,在采用doc_vec_new=MDFS(doc_vec),doc_vec_new长度为2,转换为2维的向量。
本发明与现有技术相比,具有以下优点及有益效果:
本发明在新闻事件聚类的基础上,首先将新闻事件向量化,并做降维处理,最后将映射到二维平面上,形成新闻事件的热力图,根据热力图,可以直观的看到新闻事件的热度及相关性。
具体实施方式
下面结合实施例对本发明作进一步地详细说明,但本发明的实施方式不限于此。
实施例1:
结合附图1所示,一种展示新闻事件的可视化方法,包括:
步骤S100:从后台数据库获取新闻,所述新闻包括新闻ID、新闻标题、新闻内容、新闻声量和新闻所属TopicID,抽取新闻所属TopicID相同的新闻簇即新闻事件,其中,新闻总数为M,新闻事件总数为N,M≤N;
步骤S200:将所述新闻事件数值化;
步骤S300:将数值化后的新闻标题、新闻内容和新闻事件降维;
步骤S400:计算新闻事件的热力值,在二维平面绘制新闻事件的坐标,新闻事件对应的像素点的热力值即为新闻事件的声量总和;
步骤S500:采用绘图工具包matplotlib,将每个像素点转化为不同的颜色,最终形成新闻事件热力图。
工作原理:
后台数据库通过动态网页抓取新闻数据,包括新闻ID、新闻标题、新闻内容、新闻声量和新闻所属TopicID,然后从新闻数据中抽取新闻事件;将新闻事件进行数值化处理,将新闻事件、新闻标题和新闻内容的文本分别训练成数值向量,数值向量的长度为可调整的参数,在这里取300维。然后将数值化后的新闻事件、新闻标题和新闻内容作降维处理,将300维降为二维或者三维,这里采用降为二维。然后在二维平面上计算各个新闻事件的坐标点,相关度稿的新闻事件在二维平面的距离越近,热力值即新闻事件的声量总和,新闻事件的声量即评论人数,因此,从新闻事件的声量总和,可以反映出新闻事件的受关注程度,因此新闻事件越受关注,热力值越大,则该新闻事件的像素点越大,则反映出辐射能力越强,则该新闻事件的亮度越高。不同新闻事件的热力值不同,则对应的该坐标点的像素点不同,即辐射能力不同。采用绘图工具包matplotlib,将每个像素点转化为不同的颜色,最终形成新闻事件热力图,从像素点的颜色可以区分新闻事件的受关注程度,从新闻事件的距离,可以看出新闻事件的相关度,更加直观的展示新闻事件的热度和相关度。
进一步地,所述步骤S100具体包括:
步骤S110:获取新闻,其中包括新闻ID,新闻标题和新闻内容;
步骤S120:从新闻内容中抽取新闻摘要,并分别将新闻标题和新闻内容进行数值化转换;
步骤S130:设置一个新闻箱,该新闻箱中包含新闻ID,新闻标题,新闻内容和新闻所属TopicID,并将第一条新闻的新闻ID,新闻标题,新闻内容和新闻所属TopicID放入新闻箱中;
步骤S140:依次遍历余下新闻,计算余下新闻与新闻箱中已有新闻的相似度,如果最大相似度大于阈值P,则该新闻的新闻所属TopicID与已有新闻的新闻所属TopicID相似度大,属于相同的新闻所属TopicID,反之,则用该新闻的新闻摘要表示其新闻所属TopicID,并将该新闻的新闻ID,新闻标题,新闻内容和新闻所属事件放入新闻箱中;
步骤S150:遍历结束后,新闻箱中包含全部新闻ID,新闻标题,新闻内容和新闻所属事件;
步骤S160:抽取新闻所属TopicID相同的新闻簇,即新闻事件。
工作原理:
从数据库中获取新闻的新闻ID,新闻内容、新闻标题和新闻所属TopicID,新闻所属TopicID相同的新闻簇代表一个新闻事件。在将新闻放入新闻箱中时,比较新放入的新闻与已在新闻箱中新闻的新闻所属TopicID是否相同,如果相同则为同一新闻事件,如果不同,则新放入新闻的新闻摘要作为其新闻所属TopicID,遍历结束后,抽取新闻事件,进行数值化。
进一步地,所述步骤S120中数值化转换具体包括:
步骤S121:将所述新闻标题和新闻内容进行分字处理;
步骤S122:采用训练模型将分字处理后的新闻标题和新闻内容分别转化为300维的数值向量。
工作原理:
分字处理是将新闻标题、新闻内容中的句子中的每个字都用空格分隔,然后将分隔后的新闻标题和新闻内容进行训练,将文本内容转换为数值向量,数值向量的长度可以设定。
进一步地,所述步骤S200具体为:对每一个新闻事件下的新闻,分别将数值化后的新闻标题和新闻内容的对应维度相加后取平均值,获取每个新闻事件的向量化表示,其中新闻标题和新闻内容均为300维,同时,将每个新闻事件下的新闻声量相加,获取新闻事件总声量。
工作原理:
将新闻事件下的每一个新闻数值化后的新闻标题、新闻内容的对应维度进行相加取平均,得到新闻事件的向量化表示,同时将同一新闻事件下的新闻声量相加,得到新闻事件总声量即新闻事件的热力值。
进一步地,所述步骤S300具体包括:
步骤S310:使用高维数据降维方法MDS,将新闻事件从300维的向量降成2维向量;
步骤S320:将2维向量做标准化处理,处理方法如下:
其中,Xmin表示降维后,第一维向量的最小值,Xmax表示第一维向量的最大值,Ymin表示第二维向量的最小值,Ymax表示第二维向量的最大值,且Xi∈[0,1000],Yi∈[0,1000]。
工作原理:
首先采用高维数据降维方法MDS,将300维向量降为而维,然后通过标准化处理,将降维后的向量坐标设置在1000*1000的二维平面内。Xi和Yi分别代表新闻事件在二维平面的坐标点。
进一步地,所述步骤S400具体包括:
步骤S410:计算热力值,方法如下:
其中,s表示二维平面中的任意点;i为新闻事件代表的像素点的集合,共M个新闻事件;Wi表示新闻事件代表的像素点的热度;dsi表示s到i的距离;α表示热力值衰减因子,当dsi≤5时,α=0.001,当d_si>5时,α=0.01;
步骤S420:绘制1000*1000,共1000000个像素点的二维平面,并在该二维平面上绘制新闻事件的坐标。
工作原理:
分别计算M个新闻事件的热力值,并计算出这M个新闻事件对二维平面上的其他像素点的辐射能力,新闻事件对其他像素点的热力值随着距离的增大而衰减,即辐射能力减弱。新闻事件的距离越近,表示新闻事件之间的相关性越大,反之,表示新闻事件之间的相关性越小。新闻事件的像素点的热力值越大,该新闻事件的亮度越大。因此可以直观的看出新闻事件的热度以及新闻事件之间的相关程度。
进一步地,所述步骤S122中的训练模型采用Doc2vec模型。
采用Doc2vec模型,结合mdfs降维方法,输入长度为300维的向量,即可转化为2维向量,使用方法如下:
doc_vec=[1,1,1,……1],doc_vec长度为300;
doc_vec_new=MDFS(doc_vec),doc_vec_new长度为2。
以上所述,仅是本发明的较佳实施例,并非对本发明做任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化,均落入本发明的保护范围之内。

Claims (7)

1.一种展示新闻事件的可视化方法,其特征在于,包括:
步骤S100:从后台数据库获取新闻,所述新闻包括新闻ID、新闻标题、新闻内容、新闻声量和新闻所属TopicID,抽取新闻所属TopicID相同的新闻簇即新闻事件,其中,新闻总数为M,新闻事件总数为N,M≤N;
步骤S200:将所述新闻事件数值化;
步骤S300:将数值化后的新闻标题、新闻内容和新闻事件降维;
步骤S400:计算新闻事件的热力值,在二维平面绘制新闻事件的坐标,新闻事件对应的像素点的热力值即为新闻事件的声量总和;
步骤S500:采用绘图工具包matplotlib,将每个像素点转化为不同的颜色,最终形成新闻事件热力图。
2.根据权利要求1所述的一种展示新闻事件的可视化方法,其特征在于,所述步骤S100具体包括:
步骤S110:获取新闻,其中包括新闻ID,新闻标题和新闻内容;
步骤S120:从新闻内容中抽取新闻摘要,并分别将新闻标题和新闻内容进行数值化转换;
步骤S130:设置一个新闻箱,该新闻箱中包含新闻ID,新闻标题,新闻内容和新闻所属TopicID,并将第一条新闻的新闻ID,新闻标题,新闻内容和新闻所属TopicID放入新闻箱中;
步骤S140:依次遍历余下新闻,计算余下新闻与新闻箱中已有新闻的相似度,如果最大相似度大于阈值P,则该新闻的新闻所属TopicID与已有新闻的新闻所属TopicID相似度大,属于相同的新闻所属TopicID,反之,则用该新闻的新闻摘要表示其新闻所属TopicID,并将该新闻的新闻ID,新闻标题,新闻内容和新闻所属事件放入新闻箱中;
步骤S150:遍历结束后,新闻箱中包含全部新闻ID,新闻标题,新闻内容和新闻所属事件;
步骤S160:抽取新闻所属TopicID相同的新闻簇,即新闻事件。
3.根据权利要求2所述的一种展示新闻事件的可视化方法,其特征在于,所述步骤S120中数值化转换具体包括:
步骤S121:将所述新闻标题和新闻内容进行分字处理;
步骤S122:采用训练模型将分字处理后的新闻标题和新闻内容分别转化为300维的数值向量。
4.根据权利要求3所述的一种展示新闻事件的可视化方法,其特征在于,所述步骤S200具体为:对每一个新闻事件下的新闻,分别将数值化后的新闻标题和新闻内容的对应维度相加后取平均值,获取每个新闻事件的向量化表示,其中新闻标题和新闻内容均为300维,同时,将每个新闻事件下的新闻声量相加,获取新闻事件总声量。
5.根据权利要求4所述的一种展示新闻事件的可视化方法,其特征在于,所述步骤S300具体包括:
步骤S310:使用高维数据降维方法MDS,将新闻事件从300维的向量降成2维向量;
步骤S320:将2维向量做标准化处理,处理方法如下:
其中,Xmin表示降维后,第一维向量的最小值,Xmax表示第一维向量的最大值,Ymin表示第二维向量的最小值,Ymax表示第二维向量的最大值,且Xi∈[0,1000],Yi∈[0,1000]。
6.根据权利要求5所述的一种展示新闻事件的可视化方法,其特征在于,所述步骤S400具体包括:
步骤S410:计算热力值,方法如下:
其中,s表示二维平面中的任意点;i为新闻事件代表的像素点的集合,共M个新闻事件;Wi表示新闻事件代表的像素点的热度;dsi表示s到i的距离;α表示热力值衰减因子,当dsi≤5时,α=0.001,当d_si>5时,α=0.01;
步骤S420:绘制1000*1000,共1000000个像素点的二维平面,并在该二维平面上绘制新闻事件的坐标。
7.根据权利要求3所述的一种展示新闻事件的可视化方法,其特征在于,所述步骤S122中的训练模型采用Doc2vec模型。
CN201810175268.7A 2018-03-02 2018-03-02 一种展示新闻事件的可视化方法 Active CN108376175B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810175268.7A CN108376175B (zh) 2018-03-02 2018-03-02 一种展示新闻事件的可视化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810175268.7A CN108376175B (zh) 2018-03-02 2018-03-02 一种展示新闻事件的可视化方法

Publications (2)

Publication Number Publication Date
CN108376175A true CN108376175A (zh) 2018-08-07
CN108376175B CN108376175B (zh) 2022-05-13

Family

ID=63018142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810175268.7A Active CN108376175B (zh) 2018-03-02 2018-03-02 一种展示新闻事件的可视化方法

Country Status (1)

Country Link
CN (1) CN108376175B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315691A (zh) * 2007-05-31 2008-12-03 中国科学院自动化研究所 基于选择题型调查问卷的结果可视化实现方法
CN103077190A (zh) * 2012-12-20 2013-05-01 人民搜索网络股份公司 基于排序学习技术的热门事件排名方法
US20130191388A1 (en) * 2012-01-23 2013-07-25 Microsoft Corporation Population and/or animation of spatial visualization(s)
CN104035960A (zh) * 2014-05-08 2014-09-10 东莞市巨细信息科技有限公司 互联网资讯信息热点预测方法
US20140344718A1 (en) * 2011-05-12 2014-11-20 Jeffrey Alan Rapaport Contextually-based Automatic Service Offerings to Users of Machine System
CN104536956A (zh) * 2014-07-23 2015-04-22 中国科学院计算技术研究所 一种基于微博平台的事件可视化方法及系统
CN104598539A (zh) * 2014-12-30 2015-05-06 中国联合网络通信有限公司广东省分公司 一种互联网事件热度计算方法及终端
CN104899908A (zh) * 2015-06-12 2015-09-09 百度在线网络技术(北京)有限公司 生成事件组演化图的方法和装置
CN106326496A (zh) * 2016-09-30 2017-01-11 广州特道信息科技有限公司 一种基于云平台的新闻阅读系统
CN106354837A (zh) * 2016-08-31 2017-01-25 上海交通大学 一种新闻可视化的方法
CN106777395A (zh) * 2017-03-01 2017-05-31 北京航空航天大学 一种基于社区文本数据的话题发现系统
CN107066537A (zh) * 2017-03-06 2017-08-18 广州神马移动信息科技有限公司 热点新闻生成方法、设备、电子设备
CN107357860A (zh) * 2017-06-30 2017-11-17 中山大学 一种基于新闻数据的个股情绪汇聚方法
CN107644089A (zh) * 2017-09-26 2018-01-30 武大吉奥信息技术有限公司 一种基于网络媒体的热门事件提取方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315691A (zh) * 2007-05-31 2008-12-03 中国科学院自动化研究所 基于选择题型调查问卷的结果可视化实现方法
US20140344718A1 (en) * 2011-05-12 2014-11-20 Jeffrey Alan Rapaport Contextually-based Automatic Service Offerings to Users of Machine System
US20130191388A1 (en) * 2012-01-23 2013-07-25 Microsoft Corporation Population and/or animation of spatial visualization(s)
CN103077190A (zh) * 2012-12-20 2013-05-01 人民搜索网络股份公司 基于排序学习技术的热门事件排名方法
CN104035960A (zh) * 2014-05-08 2014-09-10 东莞市巨细信息科技有限公司 互联网资讯信息热点预测方法
CN104536956A (zh) * 2014-07-23 2015-04-22 中国科学院计算技术研究所 一种基于微博平台的事件可视化方法及系统
CN104598539A (zh) * 2014-12-30 2015-05-06 中国联合网络通信有限公司广东省分公司 一种互联网事件热度计算方法及终端
CN104899908A (zh) * 2015-06-12 2015-09-09 百度在线网络技术(北京)有限公司 生成事件组演化图的方法和装置
CN106354837A (zh) * 2016-08-31 2017-01-25 上海交通大学 一种新闻可视化的方法
CN106326496A (zh) * 2016-09-30 2017-01-11 广州特道信息科技有限公司 一种基于云平台的新闻阅读系统
CN106777395A (zh) * 2017-03-01 2017-05-31 北京航空航天大学 一种基于社区文本数据的话题发现系统
CN107066537A (zh) * 2017-03-06 2017-08-18 广州神马移动信息科技有限公司 热点新闻生成方法、设备、电子设备
CN107357860A (zh) * 2017-06-30 2017-11-17 中山大学 一种基于新闻数据的个股情绪汇聚方法
CN107644089A (zh) * 2017-09-26 2018-01-30 武大吉奥信息技术有限公司 一种基于网络媒体的热门事件提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FENGCAI QIAO 等: "Correlation and Visualization Analysis of Large Scale Dataset GDELT", 《2016 INTERNATIONAL CONFERENCE ON IDENTIFICATION,INFERMATION AND KNOWLEDGE IN THE INTERNET OF THINGS(IIKI)》 *
董浩灵: "基于概率主题建模的新闻热点关联挖掘与可视化", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Also Published As

Publication number Publication date
CN108376175B (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
CN100414548C (zh) 综合利用图像及文字信息的搜索系统及搜索方法
CN102332034B (zh) 一种人像图片检索方法和装置
CN104661037B (zh) 压缩图像量化表篡改的检测方法和系统
CN104008174A (zh) 一种海量图像检索的隐私保护索引生成方法
CN109978016B (zh) 一种网络用户身份识别方法
CN103902988A (zh) 一种基于Modular积图与最大团的草图形状匹配方法
JPWO2011045920A1 (ja) 色彩解析装置、色彩解析方法、及び色彩解析プログラム
CN105096353A (zh) 一种图像处理方法及装置
Khosla et al. Evaluation of Euclidean and Manhanttan metrics in content based image retrieval system
CN104317946A (zh) 一种基于多张关键图的图像内容检索方法
CN105678244B (zh) 一种基于改进编辑距离的近似视频检索方法
CN102722528A (zh) 基于移动设备的实时海量图像检索方法
WO2015070806A1 (zh) 一种音频文件的管理方法、装置和存储介质
JP2008123526A (ja) 情報検索方法及び装置
CN104615639A (zh) 一种用于提供图片的呈现信息的方法和设备
CN102024029A (zh) 基于局部视觉关注的彩色图像检索方法
CN103514284A (zh) 数据显示系统和数据显示方法
CN104142978A (zh) 一种基于多特征和稀疏表示的图像检索系统及方法
CN108376175A (zh) 一种展示新闻事件的可视化方法
CN107423294A (zh) 一种社群图像检索方法及系统
CN108369559B (zh) 应用了图像处理的文档结构分析装置
US20130332824A1 (en) Embedded font processing method and device
CN103530656B (zh) 基于隐结构学习的图像摘要生成方法
CN107870923B (zh) 图像检索方法和装置
CN111090743A (zh) 一种基于词嵌入和多值形式概念分析的论文推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant