CN106502986A - 新闻传播力预测方法 - Google Patents
新闻传播力预测方法 Download PDFInfo
- Publication number
- CN106502986A CN106502986A CN201610920085.4A CN201610920085A CN106502986A CN 106502986 A CN106502986 A CN 106502986A CN 201610920085 A CN201610920085 A CN 201610920085A CN 106502986 A CN106502986 A CN 106502986A
- Authority
- CN
- China
- Prior art keywords
- news
- word
- idf
- dissemination
- target information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种新闻传播力预测方法,包括如下步骤:步骤一、准备多份语料;步骤二、将语料进行nlp分词;步骤三、在分词的同时计算每个词的IDF逆向文件频率值;步骤四、分词后形成计算模型;步骤五、在计算模型内,模型文件为代表N份新闻的每个词的TF‑IDF值;步骤六、输入目标资讯;步骤七、将目标资讯进行nlp分词;步骤八、计算目标资讯内的实体词词频TD;步骤九、并计算TD‑IDF,且按权重重新排序和筛选;步骤十、由此得到该资讯的一个多维向量;步骤十一、将此多维向量输入给计算模型,得出传播力分值。本发明中提出了一种新闻传播力预测方法,对语料库建设规模和稀疏数据问题具有较高的鲁棒性和稳定性。
Description
技术领域
本发明涉及数据检索领域,具体涉及一种新闻传播力预测方法。
背景技术
随着互联网新闻爆炸式传播,坚持正确方向和创新方法手段提高新闻舆论传播力引导力尤为重要。如何预测新闻舆论传播力?首先我们要知道什么是传播力。传播力指的是互联网特征新闻所具有的分值总和。通过在短时间内资讯传播力达到一个阈值,就可以预测此新闻事件将会是一个热点事件。
发明内容
本发明的目的是针对现有的技术存在的不足,提出了一种工作效率高的新闻传播力预测方法。
本发明所解决的技术问题采用以下技术方案来实现一种新闻传播力预测方法,包括如下步骤:步骤一、准备多份语料;步骤二、将语料进行nlp分词;步骤三、在分词的同时计算每个词的IDF逆向文件频率值;步骤四、分词后形成计算模型;步骤五、在计算模型内,模型文件为代表N份新闻的每个词的TF-IDF值;步骤六、输入目标资讯;步骤七、将目标资讯进行nlp分词;步骤八、计算目标资讯内的实体词词频TD;步骤九、并计算TD-IDF,且按权重重新排序和筛选;步骤十、由此得到该资讯的一个多维向量;步骤十一、将此多维向量输入给计算模型,得出传播力分值。
本发明的有益效果为:提出了一种新闻传播力预测方法,对语料库建设规模和稀疏数据问题具有较高的鲁棒性和稳定性;通过神经网络计算,得出传播力分值,满足阈值,即可预测该新闻为热点事件。
附图说明
图1是本发明的新闻传播力预测方法的流程图。
具体实施方式
参照附图,一种新闻传播力预测方法,包括如下步骤:步骤一、准备多份语料;步骤二、将语料进行nlp分词;步骤三、在分词的同时计算每个词的IDF逆向文件频率值;步骤四、分词后形成计算模型;步骤五、在计算模型内,模型文件为代表N份新闻的每个词的TF-IDF值;步骤六、输入目标资讯;步骤七、将目标资讯进行nlp分词;步骤八、计算目标资讯内的实体词词频TD;步骤九、并计算TD-IDF,且按权重重新排序和筛选;步骤十、由此得到该资讯的一个多维向量;步骤十一、将此多维向量输入给计算模型,得出传播力分值。
本发明提出了一种新闻传播力预测方法,对语料库建设规模和稀疏数据问题具有较高的鲁棒性和稳定性;通过神经网络计算,得出传播力分值,满足阈值,即可预测该新闻为热点事件。
所属领域的普通技术人员应当理解:以上,所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.一种新闻传播力预测方法,其特征在于:包括如下步骤:
步骤一、准备多份语料;
步骤二、将语料进行nlp分词;
步骤三、在分词的同时计算每个词的IDF逆向文件频率值;
步骤四、分词后形成计算模型;
步骤五、在计算模型内,模型文件为代表N份新闻的每个词的TF-IDF值;
步骤六、输入目标资讯;
步骤七、将目标资讯进行nlp分词;
步骤八、计算目标资讯内的实体词词频TD;
步骤九、并计算TD-IDF,且按权重重新排序和筛选;
步骤十、由此得到该资讯的一个多维向量;
步骤十一、将此多维向量输入给计算模型,得出传播力分值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610920085.4A CN106502986A (zh) | 2016-10-21 | 2016-10-21 | 新闻传播力预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610920085.4A CN106502986A (zh) | 2016-10-21 | 2016-10-21 | 新闻传播力预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106502986A true CN106502986A (zh) | 2017-03-15 |
Family
ID=58318382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610920085.4A Pending CN106502986A (zh) | 2016-10-21 | 2016-10-21 | 新闻传播力预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106502986A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679680A (zh) * | 2017-11-21 | 2018-02-09 | 北京锐安科技有限公司 | 一种金融走势预测方法、装置、设备及存储介质 |
CN110222909A (zh) * | 2019-06-20 | 2019-09-10 | 郑州工程技术学院 | 一种新闻传播力预测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488599A (zh) * | 2015-12-29 | 2016-04-13 | 杭州数梦工场科技有限公司 | 预测文章热度的方法和装置 |
CN105488196A (zh) * | 2015-12-07 | 2016-04-13 | 中国人民大学 | 一种基于互联语料的热门话题自动挖掘系统 |
-
2016
- 2016-10-21 CN CN201610920085.4A patent/CN106502986A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488196A (zh) * | 2015-12-07 | 2016-04-13 | 中国人民大学 | 一种基于互联语料的热门话题自动挖掘系统 |
CN105488599A (zh) * | 2015-12-29 | 2016-04-13 | 杭州数梦工场科技有限公司 | 预测文章热度的方法和装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679680A (zh) * | 2017-11-21 | 2018-02-09 | 北京锐安科技有限公司 | 一种金融走势预测方法、装置、设备及存储介质 |
CN110222909A (zh) * | 2019-06-20 | 2019-09-10 | 郑州工程技术学院 | 一种新闻传播力预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tang et al. | Learning semantic representations of users and products for document level sentiment classification | |
Kristiyanti et al. | Comparison of SVM & naïve Bayes algorithm for sentiment analysis toward west java governor candidate period 2018-2023 based on public opinion on twitter | |
JP6661790B2 (ja) | テキストタイプを識別する方法、装置及びデバイス | |
CN107153658A (zh) | 一种基于关键字加权算法的舆情热词发现方法 | |
JP2019519019A5 (zh) | ||
CN103631859A (zh) | 一种面向科技项目的评审专家智能推荐方法 | |
CN105183717A (zh) | 一种基于随机森林和用户关系的osn用户情感分析方法 | |
CN104537096A (zh) | 一种基于微博消息传播树的微博消息影响力度量方法 | |
Wu et al. | Slangsd: Building and using a sentiment dictionary of slang words for short-text sentiment classification | |
Wankhede et al. | Design approach for accuracy in movies reviews using sentiment analysis | |
CN107870957A (zh) | 一种基于信息增益和bp神经网络的热门微博预测方法 | |
CN106874258A (zh) | 一种基于汉字属性向量表示的文本相似性计算方法及系统 | |
CN104408033A (zh) | 一种文本信息提取的方法及系统 | |
Ingle et al. | Sentiment analysis of twitter data using hadoop | |
CN106502986A (zh) | 新闻传播力预测方法 | |
Sabariah et al. | Sentiment analysis on Twitter using the combination of lexicon-based and support vector machine for assessing the performance of a television program | |
Khan et al. | Sentiment analysis at sentence level for heterogeneous datasets | |
Kuamri et al. | Real time analysis of social media data to understand people emotions towards national parties | |
Ozawa et al. | A sentiment polarity prediction model using transfer learning and its application to SNS flaming event detection | |
CN105787101B (zh) | 一种信息处理方法和电子设备 | |
Kumar et al. | Opinion mining: a survey | |
Balaji et al. | Social opinion mining and concise rendition | |
Fakhri et al. | Analyzing sentiment and topic modelling of iPhone Xs post launch event through Twitter data | |
Orkphol et al. | Hybrid approach framework for sentiment classification on microblogging | |
Thakare et al. | Low Power 64-Bit Multiplier Design By Vedic Mathematics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170315 |
|
WD01 | Invention patent application deemed withdrawn after publication |