CN106502986A - 新闻传播力预测方法 - Google Patents

新闻传播力预测方法 Download PDF

Info

Publication number
CN106502986A
CN106502986A CN201610920085.4A CN201610920085A CN106502986A CN 106502986 A CN106502986 A CN 106502986A CN 201610920085 A CN201610920085 A CN 201610920085A CN 106502986 A CN106502986 A CN 106502986A
Authority
CN
China
Prior art keywords
news
word
idf
dissemination
target information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610920085.4A
Other languages
English (en)
Inventor
张勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Mass Information Technology Ltd By Share Ltd
Original Assignee
Tianjin Mass Information Technology Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Mass Information Technology Ltd By Share Ltd filed Critical Tianjin Mass Information Technology Ltd By Share Ltd
Priority to CN201610920085.4A priority Critical patent/CN106502986A/zh
Publication of CN106502986A publication Critical patent/CN106502986A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种新闻传播力预测方法,包括如下步骤:步骤一、准备多份语料;步骤二、将语料进行nlp分词;步骤三、在分词的同时计算每个词的IDF逆向文件频率值;步骤四、分词后形成计算模型;步骤五、在计算模型内,模型文件为代表N份新闻的每个词的TF‑IDF值;步骤六、输入目标资讯;步骤七、将目标资讯进行nlp分词;步骤八、计算目标资讯内的实体词词频TD;步骤九、并计算TD‑IDF,且按权重重新排序和筛选;步骤十、由此得到该资讯的一个多维向量;步骤十一、将此多维向量输入给计算模型,得出传播力分值。本发明中提出了一种新闻传播力预测方法,对语料库建设规模和稀疏数据问题具有较高的鲁棒性和稳定性。

Description

新闻传播力预测方法
技术领域
本发明涉及数据检索领域,具体涉及一种新闻传播力预测方法。
背景技术
随着互联网新闻爆炸式传播,坚持正确方向和创新方法手段提高新闻舆论传播力引导力尤为重要。如何预测新闻舆论传播力?首先我们要知道什么是传播力。传播力指的是互联网特征新闻所具有的分值总和。通过在短时间内资讯传播力达到一个阈值,就可以预测此新闻事件将会是一个热点事件。
发明内容
本发明的目的是针对现有的技术存在的不足,提出了一种工作效率高的新闻传播力预测方法。
本发明所解决的技术问题采用以下技术方案来实现一种新闻传播力预测方法,包括如下步骤:步骤一、准备多份语料;步骤二、将语料进行nlp分词;步骤三、在分词的同时计算每个词的IDF逆向文件频率值;步骤四、分词后形成计算模型;步骤五、在计算模型内,模型文件为代表N份新闻的每个词的TF-IDF值;步骤六、输入目标资讯;步骤七、将目标资讯进行nlp分词;步骤八、计算目标资讯内的实体词词频TD;步骤九、并计算TD-IDF,且按权重重新排序和筛选;步骤十、由此得到该资讯的一个多维向量;步骤十一、将此多维向量输入给计算模型,得出传播力分值。
本发明的有益效果为:提出了一种新闻传播力预测方法,对语料库建设规模和稀疏数据问题具有较高的鲁棒性和稳定性;通过神经网络计算,得出传播力分值,满足阈值,即可预测该新闻为热点事件。
附图说明
图1是本发明的新闻传播力预测方法的流程图。
具体实施方式
参照附图,一种新闻传播力预测方法,包括如下步骤:步骤一、准备多份语料;步骤二、将语料进行nlp分词;步骤三、在分词的同时计算每个词的IDF逆向文件频率值;步骤四、分词后形成计算模型;步骤五、在计算模型内,模型文件为代表N份新闻的每个词的TF-IDF值;步骤六、输入目标资讯;步骤七、将目标资讯进行nlp分词;步骤八、计算目标资讯内的实体词词频TD;步骤九、并计算TD-IDF,且按权重重新排序和筛选;步骤十、由此得到该资讯的一个多维向量;步骤十一、将此多维向量输入给计算模型,得出传播力分值。
本发明提出了一种新闻传播力预测方法,对语料库建设规模和稀疏数据问题具有较高的鲁棒性和稳定性;通过神经网络计算,得出传播力分值,满足阈值,即可预测该新闻为热点事件。
所属领域的普通技术人员应当理解:以上,所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种新闻传播力预测方法,其特征在于:包括如下步骤:
步骤一、准备多份语料;
步骤二、将语料进行nlp分词;
步骤三、在分词的同时计算每个词的IDF逆向文件频率值;
步骤四、分词后形成计算模型;
步骤五、在计算模型内,模型文件为代表N份新闻的每个词的TF-IDF值;
步骤六、输入目标资讯;
步骤七、将目标资讯进行nlp分词;
步骤八、计算目标资讯内的实体词词频TD;
步骤九、并计算TD-IDF,且按权重重新排序和筛选;
步骤十、由此得到该资讯的一个多维向量;
步骤十一、将此多维向量输入给计算模型,得出传播力分值。
CN201610920085.4A 2016-10-21 2016-10-21 新闻传播力预测方法 Pending CN106502986A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610920085.4A CN106502986A (zh) 2016-10-21 2016-10-21 新闻传播力预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610920085.4A CN106502986A (zh) 2016-10-21 2016-10-21 新闻传播力预测方法

Publications (1)

Publication Number Publication Date
CN106502986A true CN106502986A (zh) 2017-03-15

Family

ID=58318382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610920085.4A Pending CN106502986A (zh) 2016-10-21 2016-10-21 新闻传播力预测方法

Country Status (1)

Country Link
CN (1) CN106502986A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679680A (zh) * 2017-11-21 2018-02-09 北京锐安科技有限公司 一种金融走势预测方法、装置、设备及存储介质
CN110222909A (zh) * 2019-06-20 2019-09-10 郑州工程技术学院 一种新闻传播力预测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488599A (zh) * 2015-12-29 2016-04-13 杭州数梦工场科技有限公司 预测文章热度的方法和装置
CN105488196A (zh) * 2015-12-07 2016-04-13 中国人民大学 一种基于互联语料的热门话题自动挖掘系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488196A (zh) * 2015-12-07 2016-04-13 中国人民大学 一种基于互联语料的热门话题自动挖掘系统
CN105488599A (zh) * 2015-12-29 2016-04-13 杭州数梦工场科技有限公司 预测文章热度的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679680A (zh) * 2017-11-21 2018-02-09 北京锐安科技有限公司 一种金融走势预测方法、装置、设备及存储介质
CN110222909A (zh) * 2019-06-20 2019-09-10 郑州工程技术学院 一种新闻传播力预测方法

Similar Documents

Publication Publication Date Title
Tang et al. Learning semantic representations of users and products for document level sentiment classification
Kristiyanti et al. Comparison of SVM & naïve Bayes algorithm for sentiment analysis toward west java governor candidate period 2018-2023 based on public opinion on twitter
JP6661790B2 (ja) テキストタイプを識別する方法、装置及びデバイス
CN107153658A (zh) 一种基于关键字加权算法的舆情热词发现方法
JP2019519019A5 (zh)
CN103631859A (zh) 一种面向科技项目的评审专家智能推荐方法
CN105183717A (zh) 一种基于随机森林和用户关系的osn用户情感分析方法
CN104537096A (zh) 一种基于微博消息传播树的微博消息影响力度量方法
Wu et al. Slangsd: Building and using a sentiment dictionary of slang words for short-text sentiment classification
Wankhede et al. Design approach for accuracy in movies reviews using sentiment analysis
CN107870957A (zh) 一种基于信息增益和bp神经网络的热门微博预测方法
CN106874258A (zh) 一种基于汉字属性向量表示的文本相似性计算方法及系统
CN104408033A (zh) 一种文本信息提取的方法及系统
Ingle et al. Sentiment analysis of twitter data using hadoop
CN106502986A (zh) 新闻传播力预测方法
Sabariah et al. Sentiment analysis on Twitter using the combination of lexicon-based and support vector machine for assessing the performance of a television program
Khan et al. Sentiment analysis at sentence level for heterogeneous datasets
Kuamri et al. Real time analysis of social media data to understand people emotions towards national parties
Ozawa et al. A sentiment polarity prediction model using transfer learning and its application to SNS flaming event detection
CN105787101B (zh) 一种信息处理方法和电子设备
Kumar et al. Opinion mining: a survey
Balaji et al. Social opinion mining and concise rendition
Fakhri et al. Analyzing sentiment and topic modelling of iPhone Xs post launch event through Twitter data
Orkphol et al. Hybrid approach framework for sentiment classification on microblogging
Thakare et al. Low Power 64-Bit Multiplier Design By Vedic Mathematics

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170315

WD01 Invention patent application deemed withdrawn after publication