CN110990674A - 一种文章阅读量的预测方法及系统 - Google Patents
一种文章阅读量的预测方法及系统 Download PDFInfo
- Publication number
- CN110990674A CN110990674A CN201911162587.5A CN201911162587A CN110990674A CN 110990674 A CN110990674 A CN 110990674A CN 201911162587 A CN201911162587 A CN 201911162587A CN 110990674 A CN110990674 A CN 110990674A
- Authority
- CN
- China
- Prior art keywords
- article
- reading
- time point
- predicting
- future
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种文章阅读量的预测方法及系统,涉及计算机技术领域,具体包括:于网络中抓取网络文章,并截取网络文章在不同历史时点的历史阅读量信息;根据历史阅读量信息及对应的历史时点,对网络文章的阅读量增长趋势进行曲线拟合,得到相应的拟合曲线;根据拟合曲线预测网络文章在未来时点的文章阅读量。本发明的有益效果是能够快速对文章阅读量以及不同时段的阅读增长量进行预测。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种文章阅读量的预测方法及系统。
背景技术
文章阅读量信息在媒体领域十分重要。快速简便地求得文章阅读量,将帮助媒体公司掌握网络上所发布文章的阅读量增长趋势,从而可以有针对性地筛选文章的来源和素材。在现有技术中,只有少数系统设计者考虑如何预测文章的阅读量。预测文章阅读量仍旧是值得关注的问题。如何快速简单的预测文章的阅读量,更成为现有系统设计者值得思考的问题。在现有技术专利中,一种文章热度预测系统及预测方法[1]。该发明涉及文本分析技术领域,具体涉及一种文章热度预测系统及预测方法。一种文章热度预测系统,包括:获取模块,映射模块,回归模型建立模块,LSTM预测模块。该发明通过LSTM来对文章的热度进行预测,在预测时既考虑了当前时刻该文章的阅读量信息、转发量信息、点赞量信息、评论量信息和引用量信息等,又考虑到了当前时刻之前多个预定时间长度内的数据信息,提高了文章热度预测的准确率,使预测结果更加可信。该发明在预测文章阅读量时考虑了大量的系统参数,同时使用获取模块,映射模块,回归模块及LSTM模块对文章的热度进行预测,使得系统十分复杂。
发明内容
本发明的目的在于提供一种文章阅读量的预测方法及系统。
为达此目的,本发明采用以下技术方案:
提供一种文章阅读量的预测方法,具体包括以下步骤:
步骤S1,于网络中抓取网络文章,并截取所述网络文章在不同历史时点的历史阅读量信息;
步骤S2,根据所述历史阅读量信息及对应的所述历史时点,对所述网络文章的阅读量增长趋势进行曲线拟合,得到相应的拟合曲线;
步骤S3,根据所述拟合曲线预测所述网络文章在未来时点的文章阅读量。
作为本发明的一种优选方案,所述步骤S2中,所述拟合曲线的拟合函数表达式为:
R=logy(x+1)
其中,R表示文章阅读量,x表示时点;y为拟合参数。
作为本发明的一种优选方案,执行所述步骤S3之后,还包括对文章阅读量增长信息进行预测的过程,具体包括:
步骤A1,根据所述拟合曲线预测所述网络文章在一未来第一时点的第一文章阅读量;
步骤A2,根据所述拟合曲线预测所述网络文章在一未来第二时点的第二文章阅读量;
所述未来第一时点先于所述未来第二时点;
步骤A3,计算所述第二文章阅读量与所述第一文章阅读量之间的差值,得到所述未来第一时点和所述未来第二时点之间的所述文章阅读量增长信息。
作为本发明的一种优选方案,所述步骤A3中,采用如下公式计算得到所述文章阅读增长信息:
ΔR=logy(x2+1)-logy(x1+1)
其中:x2>x1>0
ΔR表示所述文章阅读增长信息,x1表示所述未来第一时点,x2表示所述未来第二时点。
一种文章阅读量的预测系统,应用以上任意一项所述的文章阅读量的预测方法,所述预测系统具体包括:
数据获取模块,用于于网络中抓取网络文章,并截取所述网络文章在不同历史时点的历史阅读量信息;
数据拟合模块,连接所述数据获取模块,用于根据所述历史阅读量信息及对应的所述历史时点,对所述网络文章的阅读量增长趋势进行曲线拟合,得到相应的拟合曲线;
数据预测模块,连接所述数据拟合模块,用于根据所述拟合曲线预测所述网络文章在未来时点的文章阅读量。
作为本发明的一种优选方案,还包括一阅读量增长预测模块,连接所述数据拟合模块,所述阅读量增长预测模块具体包括:
第一预测单元,用于根据所述拟合曲线预测所述网络文章在一未来第一时点的第一文章阅读量;
第二预测单元,用于根据所述拟合曲线预测所述网络文章在一未来第二时点的第二文章阅读量;
所述未来第一时点先于所述未来第二时点;
阅读增长量预测单元,分别连接所述第一预测单元和所述第二预测单元,用于计算所述第二文章阅读量与所述第一文章阅读量之间的差值,得到所述未来第一时点和所述未来第二时点之间的所述文章阅读量增长信息。
本发明的有益效果:能够快速对文章阅读量以及不同时段的阅读增长量进行预测。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例所述的一种文章阅读量的预测方法的流程示意图。
图2是本发明一实施例所述的对文章阅读量增长信息进行预测的过程的流程示意图。
图3是本发明一实施例所述的一种文章阅读量的预测系统的结构示意图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
在本发明的描述中,除非另有明确的规定和限定,若出现术语“连接”等指示部件之间的连接关系,该术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个部件内部的连通或两个部件的相互作用关系。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
基于现有技术中存在的问题,现提供一种文章阅读量的预测方法,如图1所示,具体包括以下步骤:
步骤S1,于网络中抓取网络文章,并截取网络文章在不同历史时点的历史阅读量信息;
步骤S2,根据历史阅读量信息及对应的历史时点,对网络文章的阅读量增长趋势进行曲线拟合,得到相应的拟合曲线;
步骤S3,根据拟合曲线预测网络文章在未来时点的文章阅读量。
作为本发明的一种优选方案,步骤S2中,拟合曲线的拟合函数表达式为:
R=logy(x+1)
其中,R表示文章阅读量,x表示时点;y为拟合参数。
具体地,本实施例中,通过获取网络文章的历史数据,即各历史时点对应的历史阅读量信息,并通过曲线拟合的方式得到表征各历史时点与历史阅读量信息之间的对应关系的拟合曲线,该拟合曲线优选以时间为横坐标,以文章阅读量为纵坐标进行绘制,上述横坐标对应各历史时点,上述纵坐标对应历史阅读量信息。根据该拟合曲线可以简单明了地对未来时点的文章阅读量进行预测。
作为本发明的一种优选方案,执行步骤S3之后,还包括对文章阅读量增长信息进行预测的过程,如图2所示,具体包括:
步骤A1,根据拟合曲线预测网络文章在一未来第一时点的第一文章阅读量;
步骤A2,根据拟合曲线预测网络文章在一未来第二时点的第二文章阅读量;
未来第一时点先于未来第二时点;
步骤A3,计算第二文章阅读量与第一文章阅读量之间的差值,得到未来第一时点和未来第二时点之间的文章阅读量增长信息。
具体地,本实施例中,在各历史时点对应的历史阅读量信息得到表征各历史时点与历史阅读量信息之间的对应关系的拟合曲线后,能够根据该拟合曲线获取任意未来时点的文章阅读量,从而能够获取任意两个未来时点之间的文章阅读量差值,该文章阅读量差值用于表示任意两个未来时点之间的文章阅读增长信息。因此,本发明的拟合曲线还能够用于进一步预测任意两个未来时点之间的文章阅读增长信息。
作为本发明的一种优选方案,步骤A3中,采用如下公式计算得到文章阅读增长信息:
ΔR=logy(x2+1)-logy(x1+1)
其中:x2>x1>0
ΔR表示文章阅读增长信息,x1表示未来第一时点,x2表示未来第二时点。
一种文章阅读量的预测系统,应用以上任意一项的文章阅读量的预测方法,如图3所示,预测系统具体包括:
数据获取模块1,用于于网络中抓取网络文章,并截取网络文章在不同历史时点的历史阅读量信息;
数据拟合模块2,连接数据获取模块1,用于根据历史阅读量信息及对应的历史时点,对网络文章的阅读量增长趋势进行曲线拟合,得到相应的拟合曲线;
数据预测模块3,连接数据拟合模块2,用于根据拟合曲线预测网络文章在未来时点的文章阅读量。
作为本发明的一种优选方案,还包括一阅读量增长预测模块4,连接数据拟合模块2,阅读量增长预测模块4具体包括:
第一预测单元41,用于根据拟合曲线预测网络文章在一未来第一时点的第一文章阅读量;
第二预测单元42,用于根据拟合曲线预测网络文章在一未来第二时点的第二文章阅读量;
未来第一时点先于未来第二时点;
阅读增长量预测单元43,分别连接第一预测单元41和第二预测单元42,用于计算第二文章阅读量与第一文章阅读量之间的差值,得到未来第一时点和未来第二时点之间的文章阅读量增长信息。
需要声明的是,上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领域技术人员应该明白,还可以对本发明做各种修改、等同替换、变化等等。但是,这些变换只要未背离本发明的精神,都应在本发明的保护范围之内。另外,本申请说明书和权利要求书所使用的一些术语并不是限制,仅仅是为了便于描述。
Claims (6)
1.一种文章阅读量的预测方法,其特征在于,具体包括以下步骤:
步骤S1,于网络中抓取网络文章,并截取所述网络文章在不同历史时点的历史阅读量信息;
步骤S2,根据所述历史阅读量信息及对应的所述历史时点,对所述网络文章的阅读量增长趋势进行曲线拟合,得到相应的拟合曲线;
步骤S3,根据所述拟合曲线预测所述网络文章在未来时点的文章阅读量。
2.根据权利要求1所述的文章阅读量的预测方法,其特征在于,所述步骤S2中,所述拟合曲线的拟合函数表达式为:
R=logy(x+1)
其中,R表示文章阅读量,x表示时点;y为拟合参数。
3.根据权利要求1所述的文章阅读量的预测方法,其特征在于,执行所述步骤S3之后,还包括对文章阅读量增长信息进行预测的过程,具体包括:
步骤A1,根据所述拟合曲线预测所述网络文章在一未来第一时点的第一文章阅读量;
步骤A2,根据所述拟合曲线预测所述网络文章在一未来第二时点的第二文章阅读量;
所述未来第一时点先于所述未来第二时点;
步骤A3,计算所述第二文章阅读量与所述第一文章阅读量之间的差值,得到所述未来第一时点和所述未来第二时点之间的所述文章阅读量增长信息。
4.根据权利要求3所述的文章阅读量的预测方法,其特征在于,所述步骤A3中,采用如下公式计算得到所述文章阅读增长信息:
ΔR=logy(x2+1)-logy(x1+1)
其中:x2>x1>0
ΔR表示所述文章阅读增长信息,x1表示所述未来第一时点,x2表示所述未来第二时点。
5.一种文章阅读量的预测系统,其特征在于,应用如权利要求1-4中任意一项所述的文章阅读量的预测方法,所述预测系统具体包括:
数据获取模块,用于于网络中抓取网络文章,并截取所述网络文章在不同历史时点的历史阅读量信息;
数据拟合模块,连接所述数据获取模块,用于根据所述历史阅读量信息及对应的所述历史时点,对所述网络文章的阅读量增长趋势进行曲线拟合,得到相应的拟合曲线;
数据预测模块,连接所述数据拟合模块,用于根据所述拟合曲线预测所述网络文章在未来时点的文章阅读量。
6.根据权利要求5所述的文章阅读量的预测系统,其特征在于,还包括一阅读量增长预测模块,连接所述数据拟合模块,所述阅读量增长预测模块具体包括:
第一预测单元,用于根据所述拟合曲线预测所述网络文章在一未来第一时点的第一文章阅读量;
第二预测单元,用于根据所述拟合曲线预测所述网络文章在一未来第二时点的第二文章阅读量;
所述未来第一时点先于所述未来第二时点;
阅读增长量预测单元,分别连接所述第一预测单元和所述第二预测单元,用于计算所述第二文章阅读量与所述第一文章阅读量之间的差值,得到所述未来第一时点和所述未来第二时点之间的所述文章阅读量增长信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911162587.5A CN110990674A (zh) | 2019-11-25 | 2019-11-25 | 一种文章阅读量的预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911162587.5A CN110990674A (zh) | 2019-11-25 | 2019-11-25 | 一种文章阅读量的预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110990674A true CN110990674A (zh) | 2020-04-10 |
Family
ID=70086145
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911162587.5A Pending CN110990674A (zh) | 2019-11-25 | 2019-11-25 | 一种文章阅读量的预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110990674A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112015965A (zh) * | 2020-08-27 | 2020-12-01 | 中国搜索信息科技股份有限公司 | 一种新媒体稿件热度计算方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020152246A1 (en) * | 2000-07-21 | 2002-10-17 | Microsoft Corporation | Method for predicting the readings of japanese ideographs |
CN105447313A (zh) * | 2015-11-23 | 2016-03-30 | 成都云堆移动信息技术有限公司 | 电子文件阅读数非自然增长识别方法 |
CN106202383A (zh) * | 2016-07-08 | 2016-12-07 | 武汉烽火普天信息技术有限公司 | 一种应用于网络爬虫的网络带宽占比动态预测方法与系统 |
CN107527113A (zh) * | 2017-08-01 | 2017-12-29 | 北京理工大学 | 一种混合动力车辆行驶工况的工况预测方法 |
CN108599995A (zh) * | 2018-03-28 | 2018-09-28 | 北京大米科技有限公司 | 网络线路故障判定方法及服务器 |
-
2019
- 2019-11-25 CN CN201911162587.5A patent/CN110990674A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020152246A1 (en) * | 2000-07-21 | 2002-10-17 | Microsoft Corporation | Method for predicting the readings of japanese ideographs |
CN105447313A (zh) * | 2015-11-23 | 2016-03-30 | 成都云堆移动信息技术有限公司 | 电子文件阅读数非自然增长识别方法 |
CN106202383A (zh) * | 2016-07-08 | 2016-12-07 | 武汉烽火普天信息技术有限公司 | 一种应用于网络爬虫的网络带宽占比动态预测方法与系统 |
CN107527113A (zh) * | 2017-08-01 | 2017-12-29 | 北京理工大学 | 一种混合动力车辆行驶工况的工况预测方法 |
CN108599995A (zh) * | 2018-03-28 | 2018-09-28 | 北京大米科技有限公司 | 网络线路故障判定方法及服务器 |
Non-Patent Citations (1)
Title |
---|
周悦: "微信公众号文章热度的预测与应用", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112015965A (zh) * | 2020-08-27 | 2020-12-01 | 中国搜索信息科技股份有限公司 | 一种新媒体稿件热度计算方法 |
CN112015965B (zh) * | 2020-08-27 | 2021-06-29 | 中国搜索信息科技股份有限公司 | 一种新媒体稿件热度计算方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9882966B2 (en) | Method for providing data for a mobile device from a field device, computer program and arrangement for executing same | |
CN109274309B (zh) | 马达控制方法、装置、电子设备及存储介质 | |
US20120054650A1 (en) | Automated operator interface generation in a control system | |
US20170120525A1 (en) | 3D Printing Method | |
CN109131166A (zh) | 用户的车辆使用偏好配置的设置 | |
CN103530175B (zh) | 应用程序的分类处理方法和装置 | |
US11187673B2 (en) | Device and method for verification, calibration and/or adjustment of an inline measuring device | |
CN103914375A (zh) | 一种自绘界面软件的测试方法和装置 | |
CN104980525B (zh) | 一种基于状态中间件的普适性移动计算系统 | |
WO2018005028A1 (en) | Notifications based on user interactions with emails | |
US20200242464A1 (en) | Incremental ai firmware updates using in-device training and peer-to-peer updates | |
CN110955715A (zh) | Erp系统和目标平台的数据转换方法、装置以及电子设备 | |
CN104484558A (zh) | 生物信息项目的分析报告自动生成方法及系统 | |
US20210345020A1 (en) | Declarative iot data control | |
WO2020252666A1 (zh) | 工业物联网的边缘计算设备、方法和计算机可读存储介质 | |
WO2013139738A1 (en) | Method for supporting automated metadata augmentation in a hierarchical level architecture for machine-to-machine (m2m) cloud computing and corresponding system | |
CN111339642A (zh) | 仿真模型率定方法、系统、可读介质、设备 | |
CN103914501A (zh) | 基于海量实时数据库的电力行业实时报表方法 | |
CN110990674A (zh) | 一种文章阅读量的预测方法及系统 | |
CN107871088B (zh) | 一种信息处理方法、装置、终端和计算机可读存储介质 | |
CN115291545A (zh) | 一种电力电子产品的多层控制系统及方法 | |
CN102739469B (zh) | 一种基于时间序列的Web服务响应时间预测方法 | |
CN115380295A (zh) | 用于优化制造过程的系统、方法和计算机程序产品 | |
CN103024055B (zh) | 用于移动终端的网页压缩方法、系统和云端服务器 | |
CN102801581B (zh) | 一种web服务连接成功率的预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200410 |