CN111523027B - 基于区块链技术的数据新闻自动撰写机器人 - Google Patents
基于区块链技术的数据新闻自动撰写机器人 Download PDFInfo
- Publication number
- CN111523027B CN111523027B CN202010299519.XA CN202010299519A CN111523027B CN 111523027 B CN111523027 B CN 111523027B CN 202010299519 A CN202010299519 A CN 202010299519A CN 111523027 B CN111523027 B CN 111523027B
- Authority
- CN
- China
- Prior art keywords
- news
- information
- access record
- user
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种基于区块链技术的数据新闻自动撰写机器人。包括:对公共自媒体和多媒体网站发布的新闻访问记录进行搜索和抓取,获取新闻大数据;从所述新闻大数据中提取多个热点信息,对所述热点信息进行分析,确定所述热点信息的第一特征信息和第二特征信息;获取用户访问记录数据量,根据所述用户访问记录数据量确定用户新闻喜好权重值;根据所述第一特征信息和所述第二特征信息撰写新闻资讯,并根据所述用户新闻喜好权重值将所述新闻资讯推送给对应用户,本发明通过对热点信息的特征信息进行提取,更够精确快速的撰写新闻资讯,通过对用户新闻喜好权重值进行分析,能够根据用户喜好推送对应新闻资讯。
Description
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于区块链技术的数据新闻自动撰写机器人。
背景技术
随着信息时代的发展,人们对于从网上获取新闻资讯的依赖性也越来越强,一个新闻网站每天的点击量可能都会破千万,这也造成了新闻资讯的发展越来越贴近网络,但是现有的网络新闻主要通过人工录入、转载等,但是随着自媒体和多媒体发展的越来越快,很多新闻都通过自媒体和多媒体平台来进行撰写,但是这样撰写的新闻针对的是大众,而不是单一的用户,在推送新闻资讯时,会广泛推送,不能精确根据用户的喜好推送新闻资讯,在大多数时间推送的新闻会被用户当成是垃圾新闻,给用户不适的体验。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
有鉴于此,本发明提出了一种基于区块链技术的数据新闻自动撰写机器人,旨在解决现有技术在监控处理链上数据过多的产生延迟的技术问题。
本发明的技术方案是这样实现的:
一方面,本发明提供了一种基于区块链技术的数据新闻自动撰写机器人,所述基于区块链技术的数据新闻自动撰写机器人包括以下步骤:
对公共自媒体和多媒体网站发布的新闻访问记录进行搜索和抓取,获取新闻大数据;
从所述新闻大数据中提取多个热点信息,对所述热点信息进行分析,确定所述热点信息的第一特征信息和第二特征信息;
获取用户访问记录数据量,根据所述用户访问记录数据量确定用户新闻喜好权重值;
根据所述第一特征信息和所述第二特征信息撰写新闻资讯,并根据所述用户新闻喜好权重值将所述新闻资讯推送给对应用户。
在以上技术方案的基础上,优选的,所述从所述新闻大数据中提取多个热点信息,对所述热点信息进行分析,确定所述热点信息的第一特征信息和第二特征信息,具体包括:
从所述新闻大数据中提取多个热点信息,根据所述热点信息确定多个关键词信息;
通过冒泡算法对所述关键词信息进行计算,确定所述热点信息的第一特征信息和第二特征信息。
在以上技术方案的基础上,优选的,所述从所述新闻大数据中提取多个热点信息,根据所述热点信息确定多个关键词信息,具体包括:
从所述新闻大数据中获取多个热点信息,并提取所述热点信息的访问记录量;
获取所述公共自媒体和多媒体网站发布的新闻访问记录总量,计算所述热点信息的访问记录量对于新闻访问记录总量的访问记录比重值;
比较所述访问记录比重值确定所述访问记录比重值最大的信息数据,作为关键词信息。
在以上技术方案的基础上,优选的,所述通过冒泡算法对所述关键词信息进行计算,确定所述热点信息的第一特征信息和第二特征信息,具体包括:
获取所述关键词信息的访问记录量;
根据所述访问记录量的大小通过冒泡算法对所述关键词信息进行排序,将所述访问记录量最大的关键词信息排在第一位,将所述访问记录量最小的关键词信息排在最后位;
将所述访问记录量第一的关键词信息作为第一特征信息,将所述访问记录量第二的关键词信息作为第二特征信息。
在以上技术方案的基础上,优选的,所述获取用户访问记录数据量,根据所述用户访问记录数据量确定用户新闻喜好权重值,具体包括:
获取用户访问记录数据量,通过公式将所述用户访问记录数据量与所述公共自媒体和多媒体网站发布的新闻访问记录总量进行计算,获取用户新闻喜好权重值。
在以上技术方案的基础上,优选的,所述获取用户访问记录数据量,通过公式将所述用户访问记录数据量与所述公共自媒体和多媒体网站发布的新闻访问记录总量进行计算,获取用户新闻喜好权重值,具体包括:
根据公式(1)计算所述用户新闻喜好权重值Pi;
其中Fi代表用户访问记录数据,Pi代表用户新闻喜好权重值,i代表用户访问的公共自媒体和多媒体网站数量。
在以上技术方案的基础上,优选的,所述根据所述第一特征信息和所述第二特征信息撰写新闻资讯,并根据所述用户新闻喜好权重值将所述新闻资讯推送给对应用户,具体包括:
根据所述第一特征信息和所述第二特征信息从大数据库中提取对应的素材,并撰写新闻资讯;
获取所述新闻资讯的类别,根据类别对应表将所述类别与所述用户新闻喜好权重值进行匹配,并将所述新闻资讯推送给匹配成功的用户。
更进一步优选的,所述基于区块链技术的数据新闻自动撰写机器人装置包括:
获取模块,用于对公共自媒体和多媒体网站发布的新闻访问记录进行搜索和抓取,获取新闻大数据;
分析模块,用于从所述新闻大数据中提取多个热点信息,对所述热点信息进行分析,确定所述热点信息的第一特征信息和第二特征信息;
确定模块,用于获取用户访问记录数据,根据所述用户访问记录数据确定用户新闻喜好权重值;
撰写模块,用于根据所述第一特征信息和所述第二特征信息撰写新闻资讯,并根据所述用户新闻喜好权重值将所述新闻资讯推送给对应用户。
第二方面,所述基于区块链技术的数据新闻自动撰写机器人还包括一种终端设备,所述终端设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于区块链技术的数据新闻自动撰写机器人程序,所述基于区块链技术的数据新闻自动撰写机器人程序配置为实现如上文所述的基于区块链技术的数据新闻自动撰写机器人的步骤。
第三方面,所述基于区块链技术的数据新闻自动撰写机器人还包括一种存储介质,所述存储介质为计算机存储介质,所述计算机存储介质上存储有基于区块链技术的数据新闻自动撰写机器人程序,所述基于区块链技术的数据新闻自动撰写机器人程序被处理器执行时实现如上文所述的基于区块链技术的数据新闻自动撰写机器人的步骤。
本发明的一种基于区块链技术的数据新闻自动撰写机器人相对于现有技术具有以下有益效果:
(1)通过对公共自媒体和多媒体网站发布的新闻访问记录中的热点信息进行分析,确定热点信息的多个特征信息,通过这些特征信息进行新闻资讯的撰写,能够更加精确的定位到用户的看点,同时也可以更快速的撰写新闻资讯;
(2)通过对用户新闻喜好权重值进行计算,判断用户对新闻的喜好范围,根据用户的喜好范围进行对应的新闻资讯,这样可以有效又精准的根据用户的喜好进行新闻资讯的推送,而不是将什么样的新闻资讯都推送给用户,造成用户的不适体验,同样,根据用户的喜好进行新闻资讯的推送,可以更加有效的利用网络资源。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例方案涉及的硬件运行环境的终端设备的结构示意图;
图2为本发明基于区块链技术的数据新闻自动撰写机器人第一实施例的流程示意图;
图3为本发明基于区块链技术的数据新闻自动撰写机器人第二实施例的流程示意图;
图4为本发明基于区块链技术的数据新闻自动撰写机器人第一实施例的功能模块示意图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,该终端设备可以包括:处理器1001,例如中央处理器(CentralProcessing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对终端设备的限定,在实际应用中终端设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于区块链技术的数据新闻自动撰写机器人程序。
在图1所示的终端设备中,网络接口1004主要用于建立终端设备与存储基于区块链技术的数据新闻自动撰写机器人系统中所需的所有数据的服务器的通信连接;用户接口1003主要用于与用户进行数据交互;本发明基于区块链技术的数据新闻自动撰写机器人设备中的处理器1001、存储器1005可以设置在基于区块链技术的数据新闻自动撰写机器人设备中,所述基于区块链技术的数据新闻自动撰写机器人设备通过处理器1001调用存储器1005中存储的基于区块链技术的数据新闻自动撰写机器人程序,并执行本发明实施提供的基于区块链技术的数据新闻自动撰写机器人。
结合图2,图2为本发明基于区块链技术的数据新闻自动撰写机器人第一实施例的流程示意图。
本实施例中,所述基于区块链技术的数据新闻自动撰写机器人包括以下步骤:
S10:对公共自媒体和多媒体网站发布的新闻访问记录进行搜索和抓取,获取新闻大数据。
应当理解的是,对公共自媒体和多媒体网站发布的新闻访问记录进行搜索和抓取,获抓取多个新闻访问记录,并对已经抓取的新闻做记录,从中提取新闻大数据。
应当理解的是,对公共自媒体和多媒体网站发布的新闻访问记录进行搜索和抓取,这里的新闻访问记录是全网用户对于新闻和热点的访问,设备终端在搜索并抓取对应的访问记录后,会对已经抓取的新闻和热点做一个记录,以防止对同一个新闻进行重复抓取。
S20:从所述新闻大数据中提取多个热点信息,对所述热点信息进行分析,确定所述热点信息的第一特征信息和第二特征信息。
应当理解的是,从所述新闻大数据中提取多个热点信息,并提取所述热点信息的访问记录量,获取所述公共自媒体和多媒体网站发布的新闻访问记录总量,计算所述热点信息的访问记录量对于新闻访问记录总量的访问记录比重值,比较所述访问记录比重值确定所述访问记录比重值最大的信息数据,作为关键词信息,通过冒泡算法对所述关键词信息进行计算,确定所述热点信息的第一特征信息和第二特征信息。
应当理解的是,从新闻大数据中提取多个热点信息,这些热点信息可能是当前点击量最多的一些热点信息,然后对这些热点信息的词汇进行扫描,剔除一些常用词语后将热点信息中出现次数较多的词语提取出来,将出现次数最多的词语作为第一特征信息,将出现次数第二多的词语作为第二特征信息,比如明星热点新闻,会将明星的名字作为第一特征信息,明星的动作作为第二特征信息。
S30:获取用户访问记录数据量,根据所述用户访问记录数据量确定用户新闻喜好权重值。
应当理解的是,获取用户访问记录数据量,通过公式将所述用户访问记录数据量与所述公共自媒体和多媒体网站发布的新闻访问记录总量进行计算,获取用户新闻喜好权重值。
应当理解的是,所述公式为:
其中Fi代表用户访问记录数据,Pi代表用户新闻喜好权重值,i代表用户访问的公共自媒体和多媒体网站数量。
应当理解的是,比如一个用户喜欢军事方面的新闻,那么设备会先获取用户访问军事网站的数据,然后获取用户访问所有公共自媒体和多媒体网站的数据,最后通过这些数据得到用户对于军事类新闻的喜好权重值。
S40:根据所述第一特征信息和所述第二特征信息撰写新闻资讯,并根据所述用户新闻喜好权重值将所述新闻资讯推送给对应用户。
应当理解的是,根据所述第一特征信息和所述第二特征信息从大数据库中提取对应的素材,并撰写新闻资讯,获取所述新闻资讯的类别,根据类别对应表将所述类别与所述用户新闻喜好权重值进行匹配,并将所述新闻资讯推送给匹配成功的用户。
应当理解的是,例如明星新闻,就会根据明星的名字和动作从大数据库中查找符合这些特征的素材,然后结合这些素材撰写新闻,并将这个新闻划分到娱乐新闻类别,然后推送给喜好娱乐新闻的用户。
需要说明的是,以上仅为举例说明,并不对本申请的技术方案构成任何限定。
通过上述描述不难发现,本实施例通过对公共自媒体和多媒体网站发布的新闻访问记录进行搜索和抓取,获取新闻大数据;从所述新闻大数据中提取多个热点信息,对所述热点信息进行分析,确定所述热点信息的第一特征信息和第二特征信息;获取用户访问记录数据量,根据所述用户访问记录数据量确定用户新闻喜好权重值;根据所述第一特征信息和所述第二特征信息撰写新闻资讯,并根据所述用户新闻喜好权重值将所述新闻资讯推送给对应用户,本实施例通过对热点信息的特征信息进行提取,更够精确快速的撰写新闻资讯,通过对用户新闻喜好权重值进行分析,能够根据用户喜好推送对应新闻资讯。
进一步地,如图3所示,基于第一实施例提出本发明基于区块链技术的数据新闻自动撰写机器人的第二实施例。
为了便于理解,以下结合图3进行具体说明:
在步骤S20'中:从所述新闻大数据中提取多个热点信息,根据所述热点信息确定多个关键词信息。
应当理解的是,从所述新闻大数据中获取多个热点信息,并提取所述热点信息的访问记录量,获取所述公共自媒体和多媒体网站发布的新闻访问记录总量,计算所述热点信息的访问记录量对于新闻访问记录总量的访问记录比重值,比较所述访问记录比重值确定所述访问记录比重值最大的信息数据,作为关键词信息。
在步骤S20”中:通过冒泡算法对所述关键词信息进行计算,确定所述热点信息的第一特征信息和第二特征信息。
应当理解的是,获取所述关键词信息的访问记录量,根据所述访问记录量的大小通过冒泡算法对所述关键词信息进行排序,将所述访问记录量最大的关键词信息排在第一位,将所述访问记录量最小的关键词信息排在最后位,将所述访问记录量第一的关键词信息作为第一特征信息,将所述访问记录量第二的关键词信息作为第二特征信息。
此外,本发明实施例还提出一种基于区块链技术的数据新闻自动撰写机器人装置。如图4所示,该基于区块链技术的数据新闻自动撰写机器人装置包括:获取模块10、分析模块20、确定模块30、撰写模块40。
获取模块10,用于对公共自媒体和多媒体网站发布的新闻访问记录进行搜索和抓取,获取新闻大数据;
分析模块20,用于从所述新闻大数据中提取多个热点信息,对所述热点信息进行分析,确定所述热点信息的第一特征信息和第二特征信息;
确定模块30,用于获取用户访问记录数据量,根据所述用户访问记录数据量确定用户新闻喜好权重值;
撰写模块40,用于根据所述第一特征信息和所述第二特征信息撰写新闻资讯,并根据所述用户新闻喜好权重值将所述新闻资讯推送给对应用户。
此外,需要说明的是,以上所描述的装置实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于区块链技术的数据新闻自动撰写机器人,此处不再赘述。
此外,本发明实施例还提出一种存储介质,所述存储介质为计算机存储介质,所述计算机存储介质上存储有基于区块链技术的数据新闻自动撰写机器人程序,所述基于区块链技术的数据新闻自动撰写机器人程序被处理器执行时实现如下操作:
对公共自媒体和多媒体网站发布的新闻访问记录进行搜索和抓取,获取新闻大数据;
从所述新闻大数据中提取多个热点信息,对所述热点信息进行分析,确定所述热点信息的第一特征信息和第二特征信息;
获取用户访问记录数据量,根据所述用户访问记录数据量确定用户新闻喜好权重值;
根据所述第一特征信息和所述第二特征信息撰写新闻资讯,并根据所述用户新闻喜好权重值将所述新闻资讯推送给对应用户。
进一步地,所述基于区块链技术的数据新闻自动撰写机器人程序被处理器执行时还实现如下操作:
从所述新闻大数据中提取多个热点信息,根据所述热点信息确定多个关键词信息;
通过冒泡算法对所述关键词信息进行计算,确定所述热点信息的第一特征信息和第二特征信息。
进一步地,所述基于区块链技术的数据新闻自动撰写机器人程序被处理器执行时还实现如下操作:
从所述新闻大数据中获取多个热点信息,并提取所述热点信息的访问记录量;
获取所述公共自媒体和多媒体网站发布的新闻访问记录总量,计算所述热点信息的访问记录量对于新闻访问记录总量的访问记录比重值;
比较所述访问记录比重值确定所述访问记录比重值最大的信息数据,作为关键词信息。
进一步地,所述基于区块链技术的数据新闻自动撰写机器人程序被处理器执行时还实现如下操作:
获取所述关键词信息的访问记录量;
根据所述访问记录量的大小通过冒泡算法对所述关键词信息进行排序,将所述访问记录量最大的关键词信息排在第一位,将所述访问记录量最小的关键词信息排在最后位;
将所述访问记录量第一的关键词信息作为第一特征信息,将所述访问记录量第二的关键词信息作为第二特征信息。
进一步地,所述基于区块链技术的数据新闻自动撰写机器人程序被处理器执行时还实现如下操作:
获取用户访问记录数据量,通过公式将所述用户访问记录数据量与所述公共自媒体和多媒体网站发布的新闻访问记录总量进行计算,获取用户新闻喜好权重值。
进一步地,所述基于区块链技术的数据新闻自动撰写机器人程序被处理器执行时还实现如下操作:
根据公式(1)计算所述用户新闻喜好权重值Pi;
其中Fi代表用户访问记录数据,Pi代表用户新闻喜好权重值,i代表用户访问的公共自媒体和多媒体网站数量。
进一步地,所述基于区块链技术的数据新闻自动撰写机器人程序被处理器执行时还实现如下操作:
根据所述第一特征信息和所述第二特征信息从大数据库中提取对应的素材,并撰写新闻资讯;
获取所述新闻资讯的类别,根据类别对应表将所述类别与所述用户新闻喜好权重值进行匹配,并将所述新闻资讯推送给匹配成功的用户。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于区块链技术的数据新闻自动撰写机器人,其特征在于:所述基于区块链技术的数据新闻自动撰写机器人包括:
对公共自媒体和多媒体网站发布的新闻访问记录进行搜索和抓取,获取新闻大数据;
从所述新闻大数据中提取多个热点信息,对所述热点信息进行分析,确定所述热点信息的第一特征信息和第二特征信息;
从所述新闻大数据中提取多个热点信息,根据所述热点信息确定多个关键词信息;
从所述新闻大数据中获取多个热点信息,并提取所述热点信息的访问记录量;
获取所述公共自媒体和多媒体网站发布的新闻访问记录总量,计算所述热点信息的访问记录量对于新闻访问记录总量的访问记录比重值;
比较所述访问记录比重值确定所述访问记录比重值最大的信息数据,作为关键词信息;
通过冒泡算法对所述关键词信息进行计算,确定所述热点信息的第一特征信息和第二特征信息;
获取所述关键词信息的访问记录量;
根据所述访问记录量的大小通过冒泡算法对所述关键词信息进行排序,将所述访问记录量最大的关键词信息排在第一位,将所述访问记录量最小的关键词信息排在最后位;
将所述访问记录量第一的关键词信息作为第一特征信息,将所述访问记录量第二的关键词信息作为第二特征信息;
获取用户访问记录数据量,根据所述用户访问记录数据量确定用户新闻喜好权重值;
根据所述第一特征信息和所述第二特征信息撰写新闻资讯,并根据所述用户新闻喜好权重值将所述新闻资讯推送给对应用户。
2.如权利要求1所述的基于区块链技术的数据新闻自动撰写机器人,其特征在于:所述获取用户访问记录数据量,根据所述用户访问记录数据量确定用户新闻喜好权重值,具体包括:
获取用户访问记录数据量,通过公式将所述用户访问记录数据量与所述公共自媒体和多媒体网站发布的新闻访问记录总量进行计算,获取用户新闻喜好权重值。
3.如权利要求2所述的基于区块链技术的数据新闻自动撰写机器人,其特征在于:所述获取用户访问记录数据量,通过公式将所述用户访问记录数据量与所述公共自媒体和多媒体网站发布的新闻访问记录总量进行计算,获取用户新闻喜好权重值,具体包括:
根据公式(1)计算所述用户新闻喜好权重值Pi;
其中Fi代表用户访问记录数据,Pi代表用户新闻喜好权重值,i代表用户访问的公共自媒体和多媒体网站数量。
4.如权利要求3所述的基于区块链技术的数据新闻自动撰写机器人,其特征在于:所述根据所述第一特征信息和所述第二特征信息撰写新闻资讯,并根据所述用户新闻喜好权重值将所述新闻资讯推送给对应用户,具体包括:
根据所述第一特征信息和所述第二特征信息从大数据库中提取对应的素材,并撰写新闻资讯;
获取所述新闻资讯的类别,根据类别对应表将所述类别与所述用户新闻喜好权重值进行匹配,并将所述新闻资讯推送给匹配成功的用户。
5.一种基于区块链技术的数据新闻自动撰写机器人装置,其特征在于,所述基于区块链技术的数据新闻自动撰写机器人装置包括:
获取模块,用于对公共自媒体和多媒体网站发布的新闻访问记录进行搜索和抓取,获取新闻大数据;
分析模块,用于从所述新闻大数据中提取多个热点信息,对所述热点信息进行分析,确定所述热点信息的第一特征信息和第二特征信息;
从所述新闻大数据中提取多个热点信息,根据所述热点信息确定多个关键词信息;
从所述新闻大数据中获取多个热点信息,并提取所述热点信息的访问记录量;
获取所述公共自媒体和多媒体网站发布的新闻访问记录总量,计算所述热点信息的访问记录量对于新闻访问记录总量的访问记录比重值;
比较所述访问记录比重值确定所述访问记录比重值最大的信息数据,作为关键词信息;
通过冒泡算法对所述关键词信息进行计算,确定所述热点信息的第一特征信息和第二特征信息;
获取所述关键词信息的访问记录量;
根据所述访问记录量的大小通过冒泡算法对所述关键词信息进行排序,将所述访问记录量最大的关键词信息排在第一位,将所述访问记录量最小的关键词信息排在最后位;
将所述访问记录量第一的关键词信息作为第一特征信息,将所述访问记录量第二的关键词信息作为第二特征信息;
确定模块,用于获取用户访问记录数据,根据所述用户访问记录数据确定用户新闻喜好权重值;
撰写模块,用于根据所述第一特征信息和所述第二特征信息撰写新闻资讯,并根据所述用户新闻喜好权重值将所述新闻资讯推送给对应用户。
6.一种终端设备,其特征在于,所述终端设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于区块链技术的数据新闻自动撰写机器人程序,所述基于区块链技术的数据新闻自动撰写机器人程序配置为实现如权利要求1至4任一项所述的基于区块链技术的数据新闻自动撰写机器人的步骤。
7.一种存储介质,其特征在于,所述存储介质为计算机存储介质,所述计算机存储介质上存储有基于区块链技术的数据新闻自动撰写机器人程序,所述基于区块链技术的数据新闻自动撰写机器人程序被处理器执行时实现如权利要求1至4任一项所述的基于区块链技术的数据新闻自动撰写机器人的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010299519.XA CN111523027B (zh) | 2020-04-16 | 2020-04-16 | 基于区块链技术的数据新闻自动撰写机器人 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010299519.XA CN111523027B (zh) | 2020-04-16 | 2020-04-16 | 基于区块链技术的数据新闻自动撰写机器人 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111523027A CN111523027A (zh) | 2020-08-11 |
CN111523027B true CN111523027B (zh) | 2023-08-01 |
Family
ID=71901646
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010299519.XA Active CN111523027B (zh) | 2020-04-16 | 2020-04-16 | 基于区块链技术的数据新闻自动撰写机器人 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111523027B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113590999A (zh) * | 2021-06-23 | 2021-11-02 | 小铁世纪(成都)科技有限公司 | 一种基于小程序的自适应内容识别及发布系统 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080011767A (ko) * | 2006-07-31 | 2008-02-11 | 김경임 | Rss 뉴스를 이용한 개인 미디어 서비스 방법 및 시스템 |
US8521763B1 (en) * | 2005-09-09 | 2013-08-27 | Minnesota Public Radio | Computer-based system and method for processing data for a journalism organization |
CN103365902A (zh) * | 2012-03-31 | 2013-10-23 | 北大方正集团有限公司 | 互联网新闻的评估方法和装置 |
US9111534B1 (en) * | 2013-03-14 | 2015-08-18 | Google Inc. | Creation of spoken news programs |
CN105069102A (zh) * | 2015-08-03 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN105630141A (zh) * | 2014-10-31 | 2016-06-01 | 小米科技有限责任公司 | 信息浏览提醒方法及装置 |
KR20160102822A (ko) * | 2015-02-23 | 2016-08-31 | 국민대학교산학협력단 | 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법 |
CN107203588A (zh) * | 2017-04-21 | 2017-09-26 | 宁波公众信息产业有限公司 | 一种数据分类管理系统 |
CN107203589A (zh) * | 2017-04-21 | 2017-09-26 | 宁波公众信息产业有限公司 | 一种信息推送系统 |
CN107590164A (zh) * | 2016-07-08 | 2018-01-16 | 广州市动景计算机科技有限公司 | 用于生成热点内容的方法、设备以及服务器 |
CN107798147A (zh) * | 2017-12-05 | 2018-03-13 | 李贺满 | 一种新闻客户端及其消息推送方法 |
CN108470064A (zh) * | 2018-03-26 | 2018-08-31 | 黑龙江省经济管理干部学院 | 一种基于智能机器人的新闻稿生成方法 |
CN109190017A (zh) * | 2018-08-02 | 2019-01-11 | 腾讯科技(北京)有限公司 | 热点信息的确定方法、装置、服务器及存储介质 |
CN109684554A (zh) * | 2018-12-26 | 2019-04-26 | 腾讯科技(深圳)有限公司 | 新闻的潜在用户的确定方法及新闻推送方法 |
CN109857923A (zh) * | 2019-02-01 | 2019-06-07 | 夏鲁宏 | 一种基于区域媒体的新闻智能推荐方法和系统 |
CN110334268A (zh) * | 2019-07-05 | 2019-10-15 | 北京国创动力文化传媒有限公司 | 一种区块链项目热词生成方法以及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10366624B2 (en) * | 2015-06-23 | 2019-07-30 | Rescon Ltd | Differentially weighted modifiable prescribed history reporting apparatus, systems, and methods for decision support and health |
US10776424B2 (en) * | 2016-07-29 | 2020-09-15 | Newswhip Media Limited | System and method for identifying and ranking trending named entities in digital content objects |
WO2018150434A1 (en) * | 2017-02-14 | 2018-08-23 | Bhalerao Mrunmayee Milind | Table of content and indexed based two level search engine |
CN108153723B (zh) * | 2017-12-27 | 2021-10-19 | 北京百度网讯科技有限公司 | 热点资讯评论文章生成方法、装置及终端设备 |
US10986169B2 (en) * | 2018-04-19 | 2021-04-20 | Pinx, Inc. | Systems, methods and media for a distributed social media network and system of record |
CN110008428B (zh) * | 2019-03-29 | 2023-06-30 | 深圳市元征科技股份有限公司 | 新闻数据处理方法、装置、区块链节点设备及存储介质 |
CN110334263A (zh) * | 2019-07-05 | 2019-10-15 | 北京国创动力文化传媒有限公司 | 一种区块链项目舆情监控方法以及装置 |
CN110442791B (zh) * | 2019-08-08 | 2022-07-01 | 北京阿尔山区块链联盟科技有限公司 | 数据推送方法和系统 |
-
2020
- 2020-04-16 CN CN202010299519.XA patent/CN111523027B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8521763B1 (en) * | 2005-09-09 | 2013-08-27 | Minnesota Public Radio | Computer-based system and method for processing data for a journalism organization |
KR20080011767A (ko) * | 2006-07-31 | 2008-02-11 | 김경임 | Rss 뉴스를 이용한 개인 미디어 서비스 방법 및 시스템 |
CN103365902A (zh) * | 2012-03-31 | 2013-10-23 | 北大方正集团有限公司 | 互联网新闻的评估方法和装置 |
US9111534B1 (en) * | 2013-03-14 | 2015-08-18 | Google Inc. | Creation of spoken news programs |
CN105630141A (zh) * | 2014-10-31 | 2016-06-01 | 小米科技有限责任公司 | 信息浏览提醒方法及装置 |
KR20160102822A (ko) * | 2015-02-23 | 2016-08-31 | 국민대학교산학협력단 | 토픽분석을 활용한 다차원 고객 클러스터링 장치 및 방법 |
CN105069102A (zh) * | 2015-08-03 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN107590164A (zh) * | 2016-07-08 | 2018-01-16 | 广州市动景计算机科技有限公司 | 用于生成热点内容的方法、设备以及服务器 |
CN107203589A (zh) * | 2017-04-21 | 2017-09-26 | 宁波公众信息产业有限公司 | 一种信息推送系统 |
CN107203588A (zh) * | 2017-04-21 | 2017-09-26 | 宁波公众信息产业有限公司 | 一种数据分类管理系统 |
CN107798147A (zh) * | 2017-12-05 | 2018-03-13 | 李贺满 | 一种新闻客户端及其消息推送方法 |
CN108470064A (zh) * | 2018-03-26 | 2018-08-31 | 黑龙江省经济管理干部学院 | 一种基于智能机器人的新闻稿生成方法 |
CN109190017A (zh) * | 2018-08-02 | 2019-01-11 | 腾讯科技(北京)有限公司 | 热点信息的确定方法、装置、服务器及存储介质 |
CN109684554A (zh) * | 2018-12-26 | 2019-04-26 | 腾讯科技(深圳)有限公司 | 新闻的潜在用户的确定方法及新闻推送方法 |
CN109857923A (zh) * | 2019-02-01 | 2019-06-07 | 夏鲁宏 | 一种基于区域媒体的新闻智能推荐方法和系统 |
CN110334268A (zh) * | 2019-07-05 | 2019-10-15 | 北京国创动力文化传媒有限公司 | 一种区块链项目热词生成方法以及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111523027A (zh) | 2020-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11763145B2 (en) | Article recommendation method and apparatus, computer device, and storage medium | |
CN106503014B (zh) | 一种实时信息的推荐方法、装置和系统 | |
CN108363815B (zh) | 一种网页页面的预读取方法、装置及智能终端设备 | |
US9805022B2 (en) | Generation of topic-based language models for an app search engine | |
US8359225B1 (en) | Trust-based video content evaluation | |
CN111259173B (zh) | 一种搜索信息推荐方法及装置 | |
CN110334356A (zh) | 文章质量的确定方法、文章筛选方法、以及相应的装置 | |
CN112036659B (zh) | 基于组合策略的社交网络媒体信息流行度预测方法 | |
US9454568B2 (en) | Method, apparatus and computer storage medium for acquiring hot content | |
CN111523027B (zh) | 基于区块链技术的数据新闻自动撰写机器人 | |
KR101780237B1 (ko) | 온라인 상에 공개된 질의응답 데이터를 기초로 한 사용자 질의에 대한 응답 방법 및 장치 | |
CN112269906B (zh) | 网页正文的自动抽取方法及装置 | |
CN113626638A (zh) | 短视频推荐处理方法、装置、智能终端及存储介质 | |
CN105824951A (zh) | 检索方法和装置 | |
CN109063015B (zh) | 热点内容的提取方法、装置及设备 | |
CN105740436B (zh) | 基于互联网搜索技术的文字作品推送方法和装置 | |
CN111368070B (zh) | 热点事件的确定方法及装置 | |
CN112632357A (zh) | 一种基于云平台的海量数据关联管理方法及装置 | |
CN111666522A (zh) | 信息处理方法、装置、设备和存储介质 | |
CN112104714A (zh) | 一种基于用户互动元素权重精准推送方法 | |
CN111970327A (zh) | 一种基于大数据处理的新闻传播方法及系统 | |
CN117648444B (zh) | 基于图卷积属性聚合的专利聚类方法和系统 | |
CN111046307B (zh) | 用于输出信息的方法和装置 | |
CN118410219A (zh) | 一种基于智能云端的医疗培训平台管理系统 | |
CN112905783A (zh) | 一种群体用户画像获取方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |