CN107301158A - 数据稿件的自动处理方法和装置 - Google Patents

数据稿件的自动处理方法和装置 Download PDF

Info

Publication number
CN107301158A
CN107301158A CN201610235949.9A CN201610235949A CN107301158A CN 107301158 A CN107301158 A CN 107301158A CN 201610235949 A CN201610235949 A CN 201610235949A CN 107301158 A CN107301158 A CN 107301158A
Authority
CN
China
Prior art keywords
contribution
data
default
template
presetting database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610235949.9A
Other languages
English (en)
Inventor
刘康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610235949.9A priority Critical patent/CN107301158A/zh
Publication of CN107301158A publication Critical patent/CN107301158A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种数据稿件的自动处理方法和装置。该方法包括:在预设触发条件下从预设数据库中获取目标数据稿件的预设稿件数据;将预设稿件数据通过预设稿件模板生成用于表达目标数据稿件中的主体内容的主体稿件,其中,预设稿件模板为与预设稿件数据相适应的用于表达目标数据稿件的模板;对预设稿件数据按照预设计算模型执行计算,得到用于表达目标数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达目标数据稿件中的解读内容的解读稿件;根据主体稿件和解读稿件生成目标数据稿件。本发明解决了相关技术中数据稿件没有解读内容的技术问题。

Description

数据稿件的自动处理方法和装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种数据稿件的自动处理方法和装置。
背景技术
目前,大多数媒体还是通过人工撰写和编辑的方式生产数据类稿件。图1是根据相关技术中的一种传统数据稿件处理方法的流程图。如图1所示,步骤S101,官方网站发布用于生成数据稿件的数据;步骤S102,人工监控数据;步骤S103,通过软件抓取数据;步骤S104,通过记者或者编辑进行撰文;步骤S105,通过发布系统对数据稿件进行发文;步骤S106,对数据稿件审核推荐。图2是根据相关技术中的另一种传统数据稿件处理方法的流程图。如图2所示,步骤S201,媒体人员在现场获取用于生成数据稿件的数据;步骤S202,通过记者或者编辑撰文;步骤S203,通过发布系统对数据稿件进行发文;步骤S204,对数据稿件审核推荐,这种传统稿件发布流程方式,从数据的获取,监控、撰文、审核、发布,最后到审核推荐,各个环节都会耗损一部分时间。
部分拥有自动写作技术的系统加入了大数据分析和表达模板来自动生成数据稿件。图3是根据相关技术中的另一种传统数据稿件处理方法的流程图。如图3所示,步骤S301,官方网站发布用于生成数据文件的数据;步骤S302,通过系统抓取数据;步骤S303,触发用于生成数据稿件的表达模板;步骤S304,通过内容管理系统(Content Management System,简称为CMS)根据该表达模板对数据稿件发文,步骤S305,对数据稿件进行人工审核或者自动推荐,这种自动写作技术的媒体通过系统抓取、触发模板、系统发文,再到完成人工审核或自动推荐生成的数据稿件,虽然提高了自动写作的速度,但是数据稿件缺少解读内容,并且同一时间只能生产一篇稿件,满足不了个性化需求。比如,国内的新华社旗下快笔小新等自动写作系统,目前仅仅能写作快讯,不能实现个性化多版本写作和推送。Automated Insights公司旗下的文章自动生成系统Wordsmith、纽约时报旗下的自动写作系统Blossom等,虽然已经实现了对数据稿件的自动写作功能,但是数据稿件缺少解读内容,但是均未涉及中文领域,并且未能实现个性化多版本的写作和推送。
针对相关技术中数据稿件没有解读内容的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据稿件的自动处理方法和装置,以至少解决相关技术中数据稿件没有解读内容的技术问题。
根据本发明实施例的一个方面,提供了一种数据稿件的自动处理方法。该数据稿件的自动处理方法包括:在预设触发条件下从预设数据库中获取目标数据稿件的预设稿件数据;将预设稿件数据通过预设稿件模板生成用于表达目标数据稿件中的主体内容的主体稿件,其中,预设稿件模板为与预设稿件数据相适应的用于表达目标数据稿件的模板;对预设稿件数据按照预设计算模型执行计算,得到用于表达目标数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达目标数据稿件中的解读内容的解读稿件;根据主体稿件和解读稿件生成目标数据稿件。
根据本发明实施例的另一方面,还提供了一种数据稿件的自动处理装置。该数据稿件的自动处理装置包括:获取单元,用于在预设触发条件下从预设数据库中获取目标数据稿件的预设稿件数据;第一生成单元,用于将预设稿件数据通过预设稿件模板生成用于表达目标数据稿件中的主体内容的主体稿件,其中,预设稿件模板为与预设稿件数据相适应的用于表达目标数据稿件的模板;处理单元,用于对预设稿件数据按照预设计算模型执行计算,得到用于表达目标数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达目标数据稿件中的解读内容的解读稿件;第二生成单元,用于根据主体稿件和解读稿件生成目标数据稿件。
在本发明实施例中,在预设触发条件下从预设数据库中获取目标数据稿件的预设稿件数据;将预设稿件数据通过预设稿件模板生成用于表达目标数据稿件中的主体内容的主体稿件;对预设稿件数据按照预设计算模型执行计算,得到用于表达目标数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达目标数据稿件中的解读内容的解读稿件;根据主体稿件和解读稿件生成目标数据稿件,达到了生成目标数据稿件的目的,从而达到了数据稿件具有解读内容的技术效果,进而解决了相关技术中数据稿件没有解读内容的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据相关技术中的一种传统数据稿件处理方法的流程图;
图2是根据相关技术中的另一种传统数据稿件处理方法的流程图;
图3是根据相关技术中的另一种传统数据稿件处理方法的流程图;
图4是根据本发明实施例的数据稿件的自动处理方法的计算机终端的硬件结构框图;
图5是根据本发明第一实施例的数据稿件的自动处理方法的流程图;
图6是根据本发明实施例的将预设稿件数据通过预设稿件模板生成用于表达目标数据稿件中的主体内容的主体稿件的方法的流程图;
图7是根据本发明实施例的根据主体稿件和解读稿件生成目标数据稿件的方法的流程图;
图8是根据本发明第二实施例的数据稿件的自动处理方法的流程图;
图9是根据本发明实施例的对预设稿件数据按照预设计算模型执行计算的方法的流程图;
图10是根据本发明第三实施例的数据稿件的自动处理方法的流程图;
图11是根据本发明实施例的将更新标识数据推送至预设数据库中的方法的流程图;
图12是根据本发明实施例的对预设稿件数据按照预设计算模型执行计算的方法的流程图;
图13是根据本发明实施例的信贷数据稿件产品的示意图;
图14是根据本发明实施例的进出口数据稿件产品的示意图;
图15是根据本发明实施例的单篇CPI数据稿件产品的示意图;
图16是根据本发明实施例的个性化多版本的CPI数据稿件产品的示意图;
图17是根据本发明实施例的NBA数据稿件产品的示意图;
图18是根据本发明实施例的足球英超联赛数据稿件产品的示意图;
图19是根据本发明实施例的数据稿件的自动处理方法的流程示意图;
图20是根据本发明实施例的自动化写作系统的登录界面的示意图;
图21是根据本发明实施例的基础数值数据管理的界面的示意图;
图22是根据本发明实施例的政策背景数据库的示意图;
图23是根据本发明实施例的分析解读数据库的示意图;
图24是根据本发明实施例的自适应模板的界面的示意图;
图25是根据本发明实施例的自适应图表系统界面的示意图;
图26是根据本发明实施例的数据稿件的自动处理装置的示意图;以及
图27是根据本发明实施例的一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种数据稿件的自动处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例所提供的数据稿件的自动处理方法的实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图4是根据本发明实施例的数据稿件的自动处理方法的计算机终端的硬件结构框图。如图4所示,计算机终端1可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端1还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的数据稿件的自动处理方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端1。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端1的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在上述运行环境下,本申请提供了如图5所示的数据稿件的自动处理方法。该数据稿件的自动处理方法可以应用于智能终端设备中,由智能终端设备中的处理器执行,智能终端设备可以是智能手机、平板电脑等。
图5是根据本发明第一实施例的数据稿件的自动处理方法的流程图。如图5所示,该数据稿件的自动处理方法的一种可选的方案包括如下步骤:
步骤S502,在预设触发条件下从预设数据库中获取目标数据稿件的预设稿件数据。
在本申请上述步骤S502提供的方案中,目标数据稿件为数据类的稿件,预设稿件数据可以为官方网站发布的实时数据。通过数据监控系统对官方网站发布的实时数据进行监控,抓取最新的预设稿件数据,该预设稿件数据可以为财经数据,体育数据,天气数据,公益数据,自然灾害数据等可以用于生成数据稿件的数据。在预设触发条件下从预设数据库中获取目标数据稿件的预设稿件数据,该预设数据库可以为数据处理系统的数据库,用于存储预设稿件数据,可选地,一旦数据监控系统监测到新的预设稿件数据,将触发自动写作系统从预设数据库中获取目标数据稿件的预设稿件数据。
步骤S504,将预设稿件数据通过预设稿件模板生成用于表达目标数据稿件中的主体内容的主体稿件。
在本申请上述步骤S504提供的方案中,在从预设数据库中获取目标数据稿件的预设稿件数据之后,将预设稿件数据通过预设稿件模板生成用于表达目标数据稿件中的主体内容的主体稿件。其中,预设稿件模板为与预设稿件数据相适应的用于表达目标数据稿件的模板,预设约有10个表达模板,从约10个表达模板中选择与预设稿件数据最为匹配的表达模板作为该预设稿件模板。可选地,不同的官方网站对应于不同的预设稿件模型。目标稿件的主体内容为预设稿件的核心主体部分,通过预设稿件数据中的核心数据通过最匹配的预设稿件模板生成。
步骤S506,对预设稿件数据按照预设计算模型执行计算,得到用于表达目标数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达目标数据稿件中的解读内容的解读稿件。
在本申请上述步骤S506提供的方案中,预设计算模型可以为对目标数据稿件进行定性分析和定量计算的计算模型。获取预设计算模型,对预设稿件数据按照预设计算模型执行计算,得到用于表达目标数据稿件的结论内容的结论稿件,比如,对于财经类的预设稿件数据,结论稿件用于表示经济学结论和周期性意义。预设数据库还存储用于表达目标稿件中的解读内容的解读稿件,不同官方网站发布的解读内容的数据会预先存储在不同的分析数据库中。在得到结论稿件之后,根据结论稿件从预设数据库中获取用于表达目标数据稿件中的解读内容的解读稿件。
步骤S508,根据主体稿件和解读稿件生成目标数据稿件。
在本申请上述步骤S508提供的方案中,根据主体稿件和解读稿件生成目标数据稿件。在得到目标数据稿件的主体稿件和解读稿件之后,根据主题稿件和解读稿件生成完整的目标数据稿件,达到了数据稿件具有解读内容的效果。
本发明实施例在预设触发条件下从预设数据库中获取目标数据稿件的预设稿件数据;将预设稿件数据通过预设稿件模板生成用于表达目标数据稿件中的主体内容的主体稿件,预设稿件模板为与预设稿件数据相适应的用于表达目标数据稿件的模板;对预设稿件数据按照预设计算模型执行计算,得到用于表达目标数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达目标数据稿件中的解读内容的解读稿件;根据主体稿件和解读稿件生成目标数据稿件,达到了数据稿件具有解读内容的效果。
作为一种可选的实施方式,目标数据稿件的预设稿件模板包括多套预设稿件模板。图6是根据本发明实施例的将预设稿件数据通过预设稿件模板生成用于表达目标数据稿件中的主体内容的主体稿件的方法的流程图。如图6所示,该将预设稿件数据通过预设稿件模板生成用于表达目标数据稿件中的主体内容的主体稿件的方法包括以下步骤:
步骤S601,从预设数据库中调取多套预设稿件模板。
在本申请上述步骤S601提供的方案中,预设数据库中预先存储多套预设稿件模板,多套预设稿件模板可以用于匹配不同的官方网站发布的实时数据,从预设数据库中调取多套预设稿件模板。可以通过算法从10套左右的表达模板中挑选与预设稿件数据相匹配的预设稿件模板,比如,从10套左右的表达模板中调取3套以上的预设稿件模板。
步骤S602,将预设稿件数据通过多套预设稿件模板生成针对于同一种主体内容的多种主体稿件。
在本申请上述步骤S602提供的方案中,在从预设数据库中调取多套预设稿件模板之后,将预设稿件数据通过多套预设稿件模板生成针对于同一种主体内容的多种主体稿件。该多种主体稿件的类型有常规版、精要版、研判版、民生版等类型,适应于不同人群的需求。
该实施例通过从预设数据库中调取多套预设稿件模板,将预设稿件数据通过多套预设稿件模板生成针对于同一种主体内容的多种主体稿件,实现了对数据稿件的多版本的个性化写作。
作为一种可选的实施方式,图7是根据本发明实施例的根据主体稿件和解读稿件生成目标数据稿件的方法的流程图。如图7所示,该根据主体稿件和解读稿件生成目标数据稿件的方法包括以下步骤:
步骤S701,为多种主体稿件分别添加解读稿件,得到多种表达风格的目标数据稿件。
在本申请上述步骤S701提供的方案中,在获取预设数据稿件的主体稿件和解读稿件之后,为多种主体稿件分别添加该解读稿件,从而将多种主体稿件和解读稿件生成多种表达风格的目标数据稿件,该多种表达风格可以为常规版、精要版、研判版、民生版等风格,从而在同一时间可以生成多篇数据稿件,满足了个性化需求。
步骤S702,将多种表达风格的目标数据稿件按照预设重组模板执行重组,得到个性化目标数据稿件。
在本申请上述步骤S702提供的方案中,在为多种主体稿件分别添加解读稿件,得到多种表达风格的目标数据稿件之后,获取预设重组模板,预设重组模板为将多种表达风格的目标数据稿件按照预设条件进行重组的模板,该预设条件可以为不同人群的预设需求,将多种表达风格的目标数据稿件按照预设重组模板执行重组,得到个性化目标数据稿件,该个性化目标数据稿件适应于不同人群,达到了对数据稿件的多版本的个性化需求,避免了有的用户觉得数据稿件内容不够丰富、有的用户觉得数据稿件太过冗余、有的用户觉得数据稿件晦涩难懂等问题的发生。
该实施例通过为多种主体稿件分别添加解读稿件,得到多种表达风格的目标数据稿件;将多种表达风格的目标数据稿件按照预设重组模板执行重组,得到个性化目标数据稿件,达到了对数据稿件的多版本的个性化写作的效果。
作为一种可选的实施方式,在根据主体稿件和解读稿件生成目标数据稿件之后,可以将目标数据稿件向特定的人群推送。图8是根据本发明第二实施例的数据稿件的自动处理方法的流程图。如图8所示,该数据稿件的自动处理方法还包括以下步骤:
步骤S801,接收用于请求获取预设风格的目标数据稿件的请求数据。
在本申请上述步骤S801提供的方案中,目标数据稿件可以向特定的人群推送。在根据主体稿件和解读稿件生成目标数据稿件之后,用户可以选择自己阅读目标数据稿件的风格,发出用于请求获取预设风格的目标数据稿件的请求数据,自动写作系统接收该请求数据。
步骤S802,根据请求数据发布预设风格的目标数据稿件至目标用户。
在本申请上述步骤S802提供的方案中,在接收用于请求获取预设风格的目标数据稿件的请求数据之后,根据请求数据发布预设风格的目标数据稿件至目标用户。
该实施例通过接收用于请求获取预设风格的目标数据稿件的请求数据,根据请求数据发布预设风格的目标数据稿件至目标用户,达到了将不同风格的数据稿件推送至不同的目标用户的效果。
作为一种可选的实施方式,图9是根据本发明实施例的对预设稿件数据按照预设计算模型执行计算的方法的流程图。如图9所示,该对预设稿件数据按照预设计算模型执行计算的方法包括以下步骤:
步骤S901,触发预设数据库中的定性分析模型。
在本申请上述步骤S901提供的方案中,预设计算模型包括定性分析模型,对预设稿件数据按照预设计算模型执行计算,可以触发预设数据库中的定性分析模型。定性分析模型为按照一定的标准和底线对目标数据稿件进行分析的模型。
步骤S902,对预设稿件数据按照定性分析模型执行分析,得到分析结果。
在本申请上述步骤S902提供的方案中,在触发预设数据库中的定性分析模型之后,对预设数据稿件数据按照定性分型模型执行分析。得到结论稿件中的分析结果。
步骤S903,触发预设数据库中的定量计算模型。
在本申请上述步骤S903提供的方案中,预设计算模型包括定量计算模型,对预设稿件数据按照预设计算模型执行计算,可以触发预设数据库中的定量计算模型。定量计算模型为用于对数据的变量、公式等进行计算的模型。
步骤S904,对预设稿件数据按照定量计算模型执行计算,得到第一计算结果。
在本申请上述步骤S904提供的方案中,在触发预设数据库中的定量计算模型之后,对预设稿件数据按照定量计算模型执行计算,得到第一计算结果,该第一计算结果为结论稿件中的计算结果,表达数据间的关系。
步骤S905,根据分析结果和第一计算结果生成结论稿件。
在本申请上述步骤S905提供的方案中,在得到分析结果和第一计算结果之后,根据分析结果和第一计算结果生成结论稿件,进一步根据结论稿件调取已抓取进数据库中与结论相匹配的分析评论,得到解读内容。
该实施例通过对预设稿件数据按照定性分析模型执行分析,得到分析结果,触发预设数据库中的定量计算模型,对预设稿件数据按照定量计算模型执行计算,得到第一计算结果,根据分析结果和第一计算结果生成结论稿件,得到用于表达目标数据稿件的结论内容的结论稿件。
作为一种可选的实施方式,图10是根据本发明第三实施例的数据稿件的自动处理方法的流程图。如图10所示,该数据稿件的自动处理方法的流程图包括以下步骤:
步骤S1001,检测预设网站的标识数据是否有更新。
在本申请上述步骤S1001提供的方案中,标识数据为用于标识预设网站发布的内容的数据,也即,预设网站发布的内容的关键数据。将财经全部官方网站的公布入口以及体育全部的实时数据库列入监控列表,可以通过数据监控系统监控财经全部官方网站的公布入口以及体育全部的实时数据库。
步骤S1002,当检测到预设网站的标识数据有更新时,获取更新标识数据。
在本申请上述步骤S1002提供的方案中,当检测到预设网站的标识数据有更新时,获取更新标识数据。一旦检测到标识数据有更新,将自动启动写作系统,并触发数据处理系统中数据库的运行,将数据推送至数据库中。
步骤S1003,将更新标识数据推送至预设数据库中。
在本申请上述步骤S1003提供的方案中,将更新标识数据推送至预设数据库中。
该实施例检测预设网站的标识数据是否有更新;当检测到预设网站的标识数据有更新时,获取更新标识数据;将更新标识数据推送至预设数据库中,从而将数据稿件的预设稿件数据存储至预设数据库中。
作为一种可选的实施方式,图11是根据本发明实施例的将更新标识数据推送至预设数据库中的方法的流程图。如图11所示,该将更新标识数据推送至预设数据库中的方法包括以下步骤:
步骤S1101,获取更新标识数据的数据类型。
在本申请上述步骤S1101提供的方案中,将更新标识数据推送至预设数据库中时,获取更新标识数据的数据类型,也即,识别更新标识数据是哪一类数据,比如,信贷数据,进出口数据等。数据类型用于确定预设网站发布的内容的类型。
步骤S1102,根据数据类型将更新标识数据推送至与数据类型相对应的预设数据库中。
在本申请上述步骤S1102提供的方案中,在获取更新标识数据的类型之后,将根据数据类型将更新标识数据推送至与数据类型相对应的预设数据库中。可以进而根据更新标识数据计算出相应的经济学结论和周期性意义。
该实施例通过获取更新标识数据的数据类型;根据数据类型将更新标识数据推送至与数据类型相对应的预设数据库中,从而将数据稿件的预设稿件数据存储至预设数据库中。
作为一种可选的实施方式,图12是根据本发明实施例的对预设稿件数据按照预设计算模型执行计算的方法的流程图。如图12所示,该对预设稿件数据按照预设计算模型执行计算的方法包括以下步骤:
步骤S1201,触发预设数据库中的预设计算模型。
在本申请上述步骤S1201提供的方案中,预设数据库中存储预设计算模型,触发预设数据库中的预设计算模型。
步骤S1202,获取预设数据库中存储的前值。
在本申请上述步骤S1202提供的方案中,在触发预设数据库中的预设计算模型之后,获取预设数据库中存储的前值,其中,该前值为预设网站发布的历史数据,用于与预设稿件数据进行对比计算。
步骤S1203,获取预设数据库中存储的预测值。
在本申请上述步骤S1203提供的方案中,在触发预设数据库中的预设计算模型之后,获取预设数据库中存储的预测值,该预测值为预设网站发布的预期数据。
步骤S1204,将预设稿件数据、前值和预测值按照预设计算模型执行对比计算,得到第二计算结果。
在本申请上述步骤S1204提供的方案中,将预设稿件数据、前值和预测值按照预设计算模型执行对比计算,得到第二计算结果。比如,预设稿件数据为预设财经稿件数据,对预设财经稿件数据、前值和预测值按照预设计算模型执行对比计算,得出相应的经济学结论和周期意义。
步骤S1205,根据第二计算结果生成结论稿件。
在本申请上述步骤S1205提供的方案中,根据第二计算结果生成用于表示目标数据稿件的结论内容的结论稿件,根据结论稿件从分析数据库调取与结论稿件相对应的解读内容,进而根据主体稿件和解读稿件生成目标数据稿件。
该实施例通过触发预设数据库中的预设计算模型;获取预设数据库中存储的前值;获取预设数据库中存储的预测值;将预设稿件数据、前值和预测值按照预设计算模型执行对比计算,得到第二计算结果;根据计算结果生成结论稿件,从而得到用于表达目标数据稿件的结论内容的结论稿件。
下面结合优选的实施例对本发明的技术方案进行说明。
图13是根据本发明实施例的信贷数据稿件产品的示意图。如图13所示,该信贷数据稿件产品为财经自动写作系统Dreamwriter的信贷数据稿件产品。在预设触发条件下从预设数据库中获取信贷数据稿件的预设信贷稿件数据,将预设信贷稿件数据通过预设稿件模板生成用于表达信贷数据稿件中的主体内容的主体稿件,其中,预设稿件模板为与预设信贷稿件数据相适应的用于表达信贷数据稿件的模板;对预设信贷稿件数据按照预设计算模型执行计算,得到用于表达信贷数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达信贷数据稿件中的解读内容的解读稿件,根据主体稿件和解读稿件生成该信贷数据稿件,生成关于7月份人民币贷款新增1.48万亿M2余额同比增长13.3%的信贷数据稿件。
图14是根据本发明实施例的进出口数据稿件产品的示意图。如图14所示,该进口数据稿件产品为财经自动写作系统的进口数据稿件产品。在预设触发条件下从预设数据库中获取进口数据稿件的预设进口稿件数据,将预设进口稿件数据通过预设稿件模板生成用于表达进口数据稿件中的主体内容的主体稿件,其中,预设稿件模板为与预设信贷稿件数据相适应的用于表达进口数据稿件的模板;对预设进口稿件数据按照预设计算模型执行计算,得到用于表达进口数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达进口数据稿件中的解读内容的解读稿件,根据主体稿件和解读稿件生成该进口数据稿件,生成关于7月出口同比下降8.9%进口同比下降8.6%的进口数据稿件。
图15是根据本发明实施例的单篇CPI数据稿件产品的示意图。如图15所示,该CPI数据稿件产品为财经自动写作系统的单篇CPI数据稿件产品,也即,该CPI数据稿件产品只有一种表达风格。在预设触发条件下从预设数据库中获取CPI数据稿件的预设CPI稿件数据,将预设CPI稿件数据通过预设稿件模板生成用于表达CPI数据稿件中的主体内容的主体稿件,其中,预设稿件模板为与预设CPI稿件数据相适应的用于表达CPI数据稿件的模板;对预设CPI稿件数据按照预设计算模型执行计算,得到用于表达CPI数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达CPI数据稿件中的解读内容的解读稿件,根据主体稿件和解读稿件生成该CPI数据稿件,生成关于7月CPI同比上涨1.6%创9个月新高的CPI数据稿件。该单篇CPI数据稿件产品由腾讯财经开发的自动化新闻写作机器人,根据算法在第一时间自动生成稿件,瞬时输出分析和研判,可以一分钟内将重要的资讯和解读内容送达至用户,提高了数据稿件自生成到发布的效率。
图16是根据本发明实施例的个性化多版本的CPI数据稿件产品的示意图。如图16所示,该CPI数据稿件产品为财经自动写作系统的个性化多版本的CPI数据稿件产品,也即,该CPI数据稿件产品用多种表达风格表达同一主体内容的数据稿件。CPI数据稿件的预设稿件模板包括多套预设CPI稿件模板,从预设数据库中调取多套预设CPI稿件模板;将预设CPI稿件数据通过多套预设CPI稿件模板生成针对于同一种主体内容的多种主体稿件,为多种主体稿件分别添加解读稿件,得到多种表达风格的CPI数据稿件;将多种表达风格的CPI数据稿件按照预设重组模板执行重组,得到个性化CPI数据稿件。该实施例的多种表达风格分别为常规版,精要版,民生版和研判版等用于表达9月份CPI涨幅回落至1.6%的CPI数据稿件。其中,常规版的数据稿件为普通数据稿件的表达形式,研判版的数据稿件用于对数据稿件进行研析和评判,民生版的数据稿件用于从民生方面对数据稿件的内容进行表达。
在根据主体稿件和解读稿件生成CPI数据稿件之后,接收用于请求获取预设风格的CPI数据稿件的请求数据,该请求数据为对数据稿件进行查看的请求数据;根据请求数据发布预设风格的CPI数据稿件至目标用户,可以实现生成三种以上不同风格的数据稿件,并将不同风格的数据稿件进行发布,推送至不同的目标用户,从而有针对性地发布数据稿件,满足了同一数据稿件适应不同目标用户的不同需求。
图17是根据本发明实施例的NBA数据稿件产品的示意图。如图17所示,该NBA数据稿件产品为体育自动写作系统的NBA数据稿件产品。在预设触发条件下从预设数据库中获取NBA数据稿件的预设NBA稿件数据,将预设NBA稿件数据通过预设稿件模板生成用于表达NBA数据稿件中的主体内容的主体稿件,其中,预设稿件模板为与预设NBA稿件数据相适应的用于表达NBA数据稿件的模板;对预设NBA稿件数据按照预设计算模型执行计算,得到用于表达NBA数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达NBA数据稿件中的解读内容的解读稿件,根据主体稿件和解读稿件生成该NBA数据稿件,生成勇士主场123:101战胜火箭的NBA数据稿件。该NBA数据稿件产品为腾讯开发的财经和体育新闻写作机器人,根据数据和算法实时生成的数据稿件,可以一秒钟将重要的财经资讯和体育赛况送达至用户,提高了数据稿件的时效性。
图18是根据本发明实施例的足球英超联赛数据稿件产品的示意图。如图18所示,该足球英超联赛数据稿件产品为体育自动写作系统的足球英超联赛数据稿件产品。在预设触发条件下从预设数据库中获取足球英超联赛数据稿件的预设足球英超联赛稿件数据,将预设足球英超联赛稿件数据通过预设稿件模板生成用于表达足球英超联赛数据稿件中的主体内容的主体稿件,其中,预设稿件模板为与预设足球英超联赛稿件数据相适应的用于表达足球英超联赛数据稿件的模板;对预设足球英超联赛稿件数据按照预设计算模型执行计算,得到用于表达足球英超联赛数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达足球英超联赛数据稿件中的解读内容的解读稿件,根据主体稿件和解读稿件生成该足球英超联赛数据稿件,该足球英超联赛数据稿件为阿森纳主场3:0战胜曼联的数据稿件。该足球英超联赛数据稿件产品为由腾讯开发的财经和体育新闻写作机器人,根据数据和算法实时生成的数据稿件,可以一秒钟将重要的财经资讯和体育赛况送达至用户,提高了数据稿件的时效性。
图19是根据本发明实施例的数据稿件的自动处理方法的流程示意图。如图19所示,财经官方网站发布的官网公告,或者体育官方网站发布的实时赛况,Dreamwriter的数据监控系统自动触发数据稿件的写作系统,将最新的预设稿件数据推送至数据处理系统的数据库并加以识别。然后将预设稿件数据中的核心数据通过最匹配的预设稿件模板生成数据稿件的主体稿件,其中,预设稿件模板为与预设稿件数据相适应的用于表达目标数据稿件的模板,预设约10个模板,该主体稿件为数据稿件的核心主体部分。同时通过定量计算和定性分析两套计算模型对预设稿件数据执行计算,得出结论稿件,该结论稿件用于表达目标数据稿件的结论内容,然后根据结论稿件从预设数据库中获取用于表达目标数据稿件中的解读内容的解读稿件,也即,调取推送进数据库中的与结论稿件相匹配的分析评论,该分析评论为解读内容,其中,该预设数据库通过抓取回定、自主学习、人工智能等方式处理数据。接下来再加入算法,同时生成多个版本的个性化样稿,提交到CMS系统进行自动审核发布和推荐展示。可选地,风险加权级别较高的稿件提交到人工审核窗口。整个流程理论上是实时的,可以以毫秒计算,考虑到各个环节的衔接有可能损耗一些时间,总共的流程耗时应该在1分钟以内,提高了数据稿件生成的效率。
可选地,全网数据监控系统会在官方数据发布的同时自动触发写作系统。数据监控系统将财经全部的官方网站的公布入口以及体育全部的实时数据库都列入监控列表,一旦有标识数据更新,将标识数据作为预设稿件数据,同时将自动启动Dreamwriter写作系统,并触发数据处理系统中的数据库运行,将该预设稿件数据推送到数据库。其中,标识数据为用于标识预设网站发布的内容的数据,也即,预设网站的关键数据。
可选地,新的预设稿件数据通过数据处理系统识别数据类型并调用定量计算模型和定性计算模型对新的预设稿件数据执行计算,得到用于表达目标数据稿件的结论内容的结论稿件。数据处理系统对刚刚引起系统触发的新的预设稿件数据进行识别,比如,当预设稿件数据为财经数据时,首先要识别该预设稿件数据的数据类型,该数据类型用于确定预设网站发布的内容的类型是信贷数据还是进出口数据。当识别出该预设稿件的类型之后,推送该预设稿件数据推送到与预设稿件数据的类型对应的数据库。接下来触发与数据类型对应的数据库的预设计算模型,将新的预设稿件数据与前值、预测值等进行对比计算,得出结论稿件,该结论稿件反映出相应的经济学结论和周期性意义。
可选地,将预设稿件数据和结论连同数据库中历史积累和实时抓取的各项资料和分析等通过自适应模板系统生成文章。自适应模板系统分为两个部分:第一部分是核心主体部分,由算法从10套左右的模板中挑选最匹配的一套预设稿件模板,将最新的预设稿件数据通过该预设稿件模板生成该部分的数据稿件文本和图表,该数据稿件文本和图标在计算机和移动终端上都可以匹配;第二部分是分析评论部分,由预设计算模型对预设稿件数据执行按照预设计算模型执行计算,得到用于表达数据稿件的结论内容的结论稿件,根据这个结论稿件从分析数据库中调取与结论稿件相对应的解读内容,根据该结论稿件和解读内容最后生成完整的数据稿件。
可选地,自动写作系统可以根据算法实现针对同一事件,同时写出多种不同风格、不同角度的数据稿件,并向特定的人群推送。个性化写作系统在预设稿件数据更新时启动,也即,当具有特定类别的预设稿件数据发布时启动,此时由算法从十套左右的模板中挑选三套以上的预设稿件模板,该预设稿件模板为用于将预设稿件数据生成主体稿件的核心主体部分模板。通过三套以上的预设稿件模板各自生成该部分的数据稿件文本和图表,数据稿件文本和图标在计算机和移动终端上均可以适配。在每一套预设稿件模板生成的数据稿件文本和图表上加入解读内容,得到多种表达风格的目标数据稿件。新增个性化多版本模板重组,根据个性化多版本的预设条件整理重组模板,最终生成包括三篇以上不同风格的个性化目标数据稿件,可以在发布的同时向特定人群推送,从而达到了数据稿件具有解读内容的技术效果,并且实现了多版本的数据稿件的写作和推送。
图20是根据本发明实施例的自动化写作系统的登录界面的示意图。如图20所示,该自动化协作系统为腾讯财经-自动化写作系统,用于对数据稿件进行处理。在使用该自动化协作系统之前,对该自动化协作系统进行登录。该自动化写作系统的登录界面包括用户名的输入区域和与用户名相对应的密码输入区域。用户通输入用户名和与用户名相对应的密码从而完成对该自动化写作系统的登录。
图21是根据本发明实施例的基础数值数据管理的界面的示意图。如图21所示,该基础数值数据管理的界面为Dreamwriter财经自动写作系统数据处理系统的基础数值数据管理总界面,用于维护所有数值类数据的抓取、整理和更新,包括获取预设数据库中存储的前值、获取预设数据库中存储的预测值等。
图22是根据本发明实施例的政策背景数据库的示意图。如图22所示,该政策背景数据库为Dreamwriter财经自动写作系统数据处理系统的政策背景数据库。Dreamwriter政策背景数据库用于维护官方政策类数据的抓取、整理和更新,包括部委、地方以及行业的政策和法规等。
图23是根据本发明实施例的分析解读数据库的示意图。如图23所示,该分析解读数据库为Dreamwriter财经自动写作系统数据处理系统的分析解读数据库。该Dreamwriter分析解读数据库用于调用定量计算模型和定性分析模型对预设稿件数据执行计算,得出结论稿件,再调取已抓取进数据库中的与结论稿件相匹配的分析评论,得到解读内容。
图24是根据本发明实施例的自适应模板的界面的示意图。如图24所示,该自适应模板为Dreamwriter财经自动写作系统数据处理系统的自适应模板系统界面,包括个性化多版本的自适应模板。Dreamwriter自适应模板系统负责根据算法实现针对同一事件,同时生成多个不同风格不同角度的稿件,并向发布审核系统推送,从而满足不同用户的不同需求。
图25是根据本发明实施例的自适应图表系统界面的示意图。如图25所示,该自适应图表系统界面为Dreamwriter财经自动写作系统数据处理系统的自适应图表系统界面,该Dreamwriter自适应图表系统负责将数值类数据通过图表系统生成可以在计算机和移动终端上均可以适配的自适应图表。
本发明实施例不仅通过对预设稿件数据进行抓取以及表达编排,也可以由机器人完成实时的全自动发文,速度更快,比以往人工稿件快5分钟左右(行业内公认的反应时间是5至20分钟),抢占了先机,并且根据计算模型等定性和定量分析,给出最及时的解读内容,另外,还能根据算法评估用户喜好,产生自适应表达模板,完成多版本的个性化写作、发布和推送,满足了不同人群对同一报道的不同需求。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质,如只读存储器(Read-Only Memory,简称为ROM)/(Random Access Memory,简称为RAM)、磁碟、光盘中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
本发明实施例还提供了一种用于实施上述数据稿件的自动处理方法的装置。图26是根据本发明实施例的数据稿件的自动处理装置的示意图。如图26所示,该装置包括:第一获取单元10,第一生成单元20,处理单元30和第二生成单元40。
该实施例的数据稿件的自动处理装置中,第一获取单元10可以用于执行本发明实施例中的步骤S502,第一生成单元20可以用于执行本发明实施例中的步骤S504,处理单元30可以用于执行本发明实施例中的步骤S506,第二生成单元40可以用于执行本发明实施例中的步骤S508。
第一获取单元10,用于在预设触发条件下从预设数据库中获取目标数据稿件的预设稿件数据。
第一生成单元20,用于将预设稿件数据通过预设稿件模板生成用于表达目标数据稿件中的主体内容的主体稿件,其中,预设稿件模板为与预设稿件数据相适应的用于表达目标数据稿件的模板。
处理单元30,用于对预设稿件数据按照预设计算模型执行计算,得到用于表达目标数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达目标数据稿件中的解读内容的解读稿件。
第二生成单元40,用于根据主体稿件和解读稿件生成目标数据稿件。
可选地,目标数据稿件的预设稿件模板包括多套预设稿件模板,第一生成单元20包括调取模块和第一生成模块。其中,调取模块,用于从预设数据库中调取多套预设稿件模板;第一生成模块,用于将预设稿件数据通过多套预设稿件模板生成针对于同一种主体内容的多种主体稿件。
可选地,第二生成单元40包括添加模块和重组模块。其中,添加模块,用于为多种主体稿件分别添加解读稿件,得到多种表达风格的目标数据稿件;重组模块,用于将多种表达风格的目标数据稿件按照预设重组模板执行重组,得到个性化目标数据稿件,其中,预设重组模板为将多种表达风格的目标数据稿件按照预设条件进行重组的模板。
可选地,该数据稿件的自动处理装置还包括:接收单元和发布单元。其中,接收单元,用于在根据主体稿件和解读稿件生成目标数据稿件之后,接收用于请求获取预设风格的目标数据稿件的请求数据;发布单元,用于根据请求数据发布预设风格的目标数据稿件至目标用户。
可选地,处理单元30包括:第一触发模块,分析模块,第二触发模块计算模块和第二生成模块。其中,第一触发模块,用于触发预设数据库中的定性分析模型;分析模块,用于对预设稿件数据按照定性分析模型执行分析,得到分析结果;第二触发模块,用于触发预设数据库中的定量计算模型;计算模块,用于计算对预设稿件数据按照定量计算模型执行计算,得到第一计算结果;第二生成模块,用于根据分析结果和第一计算结果生成结论稿件。
可选地,该数据稿件的自动处理装置还包括:检测单元,第二获取单元和推送单元。其中,检测单元,用于在从预设数据库中获取预设稿件数据之前,检测预设网站的标识数据是否有更新,其中,标识数据为用于标识预设网站发布的内容的数据;第二获取单元,用于当检测到预设网站的标识数据有更新时,获取更新标识数据;推送单元,用于将更新标识数据推送至预设数据库中,其中,第一获取单元10用于从预设数据库中获取更新标识数据。
可选地,推送单元包括获取模块和推送模块。其中,获取模块,用于获取更新标识数据的数据类型,其中,数据类型用于确定预设网站发布的内容的类型;以及推送模块,用于根据数据类型将更新标识数据推送至与数据类型相对应的预设数据库中。
该实施例通过第一获取单元10在预设触发条件下从预设数据库中获取目标数据稿件的预设稿件数据,通过第一生成单元20将预设稿件数据通过预设稿件模板生成用于表达目标数据稿件中的主体内容的主体稿件,预设稿件模板为与预设稿件数据相适应的用于表达目标数据稿件的模板,通过处理单元30对预设稿件数据按照预设计算模型执行计算,得到用于表达目标数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达目标数据稿件中的解读内容的解读稿件,通过第二生成单元40根据主体稿件和解读稿件生成目标数据稿件,达到了数据稿件具有解读内容的效果。
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一种数据稿件的自动处理方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
在预设触发条件下从预设数据库中获取目标数据稿件的预设稿件数据;
将预设稿件数据通过预设稿件模板生成用于表达目标数据稿件中的主体内容的主体稿件,其中,预设稿件模板为与预设稿件数据相适应的用于表达目标数据稿件的模板;
对预设稿件数据按照预设计算模型执行计算,得到用于表达目标数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达目标数据稿件中的解读内容的解读稿件;
根据主体稿件和解读稿件生成目标数据稿件。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:从预设数据库中调取多套预设稿件模板;将预设稿件数据通过多套预设稿件模板生成针对于同一种主体内容的多种主体稿件。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:为多种主体稿件分别添加解读稿件,得到多种表达风格的目标数据稿件;将多种表达风格的目标数据稿件按照预设重组模板执行重组,得到个性化目标数据稿件,其中,预设重组模板为将多种表达风格的目标数据稿件按照预设条件进行重组的模板。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:在根据主体稿件和解读稿件生成目标数据稿件之后,接收用于请求获取预设风格的目标数据稿件的请求数据;根据请求数据发布预设风格的目标数据稿件至目标用户。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:触发预设数据库中的定性分析模型;对预设稿件数据按照定性分析模型执行分析,得到分析结果;触发预设数据库中的定量计算模型;对预设稿件数据按照定量计算模型执行计算,得到第一计算结果;根据分析结果和第一计算结果生成结论稿件。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:在从预设数据库中获取预设稿件数据之前,检测预设网站的标识数据是否有更新,其中,标识数据为用于标识预设网站发布的内容的数据;当检测到预设网站的标识数据有更新时,获取更新标识数据;将更新标识数据推送至预设数据库中。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:将更新标识数据推送至预设数据库中包括:获取更新标识数据的数据类型,其中,数据类型用于确定预设网站发布的内容的类型;根据数据类型将更新标识数据推送至与数据类型相对应的预设数据库中。
可选地,触发预设数据库中的预设计算模型;获取预设数据库中存储的前值,其中,前值为预设网站发布的历史数据;获取预设数据库中存储的预测值,其中,预测值为预设网站发布的预期数据;将预设稿件数据、前值和预测值按照预设计算模型执行对比计算,得到第二计算结果;根据计算结果生成结论稿件。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器ROM、随机存取存储器RAM、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本发明的实施例还提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,图27是根据本发明实施例的一种计算机终端的结构框图。如图27所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器271、存储器273、以及传输装置275。
其中,存储器273可用于存储软件程序以及模块,如本发明实施例中的数据稿件的自动处理方法和装置对应的程序指令/模块,处理器271通过运行存储在存储器273内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的数据稿件的自动处理方法。存储器273可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器273可进一步包括相对于处理器271远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置275用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置275包括一个网络适配器NIC,其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置275为射频RF模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器273用于存储预设动作条件和预设权限用户的信息、以及应用程序。
处理器271可以通过传输装置调用存储器273存储的信息及应用程序,以执行下述步骤:
在预设触发条件下从预设数据库中获取目标数据稿件的预设稿件数据;
将预设稿件数据通过预设稿件模板生成用于表达目标数据稿件中的主体内容的主体稿件,其中,预设稿件模板为与预设稿件数据相适应的用于表达目标数据稿件的模板;
对预设稿件数据按照预设计算模型执行计算,得到用于表达目标数据稿件的结论内容的结论稿件,并根据结论稿件从预设数据库中获取用于表达目标数据稿件中的解读内容的解读稿件;
根据主体稿件和解读稿件生成目标数据稿件。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (15)

1.一种数据稿件的自动处理方法,其特征在于,包括:
在预设触发条件下从预设数据库中获取目标数据稿件的预设稿件数据;
将所述预设稿件数据通过预设稿件模板生成用于表达所述目标数据稿件中的主体内容的主体稿件,其中,所述预设稿件模板为与所述预设稿件数据相适应的用于表达所述目标数据稿件的模板;
对所述预设稿件数据按照预设计算模型执行计算,得到用于表达所述目标数据稿件的结论内容的结论稿件,并根据所述结论稿件从所述预设数据库中获取用于表达所述目标数据稿件中的解读内容的解读稿件;以及
根据所述主体稿件和所述解读稿件生成所述目标数据稿件。
2.根据权利要求1所述的方法,其特征在于,所述目标数据稿件的预设稿件模板包括多套预设稿件模板,将所述预设稿件数据通过预设稿件模板生成用于表达所述目标数据稿件中的主体内容的主体稿件包括:
从所述预设数据库中调取所述多套预设稿件模板;以及
将所述预设稿件数据通过所述多套预设稿件模板生成针对于同一种主体内容的多种主体稿件。
3.根据权利要求2所述的方法,其特征在于,根据所述主体稿件和所述解读稿件生成所述目标数据稿件包括:
为所述多种主体稿件分别添加所述解读稿件,得到多种表达风格的目标数据稿件;以及
将所述多种表达风格的目标数据稿件按照预设重组模板执行重组,得到个性化目标数据稿件,其中,所述预设重组模板为将所述多种表达风格的目标数据稿件按照预设条件进行重组的模板。
4.根据权利要求3所述的方法,其特征在于,在根据所述主体稿件和所述解读稿件生成所述目标数据稿件之后,所述方法还包括:
接收用于请求获取预设风格的目标数据稿件的请求数据;以及
根据所述请求数据发布所述预设风格的目标数据稿件至目标用户。
5.根据权利要求1所述的方法,其特征在于,对所述预设稿件数据按照预设计算模型执行计算,得到用于表达所述目标数据稿件的结论内容的结论稿件包括:
触发所述预设数据库中的定性分析模型;
对所述预设稿件数据按照所述定性分析模型执行分析,得到分析结果;
触发所述预设数据库中的定量计算模型;
对所述预设稿件数据按照所述定量计算模型执行计算,得到第一计算结果;以及
根据所述分析结果和所述第一计算结果生成所述结论稿件。
6.根据权利要求1所述的方法,其特征在于,在从所述预设数据库中获取所述预设稿件数据之前,所述方法还包括:
检测预设网站的标识数据是否有更新,其中,所述标识数据为用于标识所述预设网站发布的内容的数据;
当检测到所述预设网站的标识数据有更新时,获取更新标识数据;
将所述更新标识数据推送至所述预设数据库中,
其中,从所述预设数据库中获取所述预设稿件数据包括:从所述预设数据库中获取所述更新标识数据。
7.根据权利要求6所述的方法,其特征在于,将所述更新标识数据推送至所述预设数据库中包括:
获取所述更新标识数据的数据类型,其中,所述数据类型用于确定所述预设网站发布的内容的类型;以及
根据所述数据类型将所述更新标识数据推送至与所述数据类型相对应的预设数据库中。
8.根据权利要求6所述的方法,其特征在于,对所述预设稿件数据按照所述预设计算模型执行计算,得到用于表达所述目标数据稿件的结论内容的结论稿件包括:
触发所述预设数据库中的所述预设计算模型;
获取所述预设数据库中存储的前值,其中,所述前值为所述预设网站发布的历史数据;
获取所述预设数据库中存储的预测值,其中,所述预测值为所述预设网站发布的预期数据;
将所述预设稿件数据、所述前值和所述预测值按照所述预设计算模型执行对比计算,得到第二计算结果;以及
根据所述第二计算结果生成所述结论稿件。
9.一种数据稿件的自动处理装置,其特征在于,包括:
第一获取单元,用于在预设触发条件下从预设数据库中获取目标数据稿件的预设稿件数据;
第一生成单元,用于将所述预设稿件数据通过预设稿件模板生成用于表达所述目标数据稿件中的主体内容的主体稿件,其中,所述预设稿件模板为与所述预设稿件数据相适应的用于表达所述目标数据稿件的模板;
处理单元,用于对所述预设稿件数据按照预设计算模型执行计算,得到用于表达所述目标数据稿件的结论内容的结论稿件,并根据所述结论稿件从所述预设数据库中获取用于表达所述目标数据稿件中的解读内容的解读稿件;以及
第二生成单元,用于根据所述主体稿件和所述解读稿件生成所述目标数据稿件。
10.根据权利要求9所述的装置,其特征在于,所述目标数据稿件的预设稿件模板包括多套预设稿件模板,所述第一生成单元包括:
调取模块,用于从所述预设数据库中调取所述多套预设稿件模板;
以及
第一生成模块,用于将所述预设稿件数据通过所述多套预设稿件模板生成针对于同一种主体内容的多种主体稿件。
11.根据权利要求10所述的装置,其特征在于,所述第二生成单元包括:
添加模块,用于为所述多种主体稿件分别添加所述解读稿件,得到多种表达风格的目标数据稿件;以及
重组模块,用于将所述多种表达风格的目标数据稿件按照预设重组模板执行重组,得到个性化目标数据稿件,其中,所述预设重组模板为将所述多种表达风格的目标数据稿件按照预设条件进行重组的模板。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
接收单元,用于在根据所述主体稿件和所述解读稿件生成所述目标数据稿件之后,接收用于请求获取预设风格的目标数据稿件的请求数据;以及
发布单元,用于根据所述请求数据发布所述预设风格的目标数据稿件至目标用户。
13.根据权利要求9所述的装置,其特征在于,所述处理单元包括:
第一触发模块,用于触发所述预设数据库中的定性分析模型;
分析模块,用于对所述预设稿件数据按照所述定性分析模型执行分析,得到分析结果;
第二触发模块,用于触发所述预设数据库中的定量计算模型;
计算模块,用于计算对所述预设稿件数据按照所述定量计算模型执行计算,得到第一计算结果;以及
第二生成模块,用于根据所述分析结果和所述第一计算结果生成所述结论稿件。
14.根据权利要求9所述的装置,其特征在于,所述装置还包括:
检测单元,用于在从所述预设数据库中获取所述预设稿件数据之前,检测预设网站的标识数据是否有更新,其中,所述标识数据为用于标识所述预设网站发布的内容的数据;
第二获取单元,用于当检测到所述预设网站的标识数据有更新时,获取更新标识数据;以及
推送单元,用于将所述更新标识数据推送至所述预设数据库中,其中,所述第一获取单元用于从所述预设数据库中获取所述更新标识数据。
15.根据权利要求14所述的装置,其特征在于,所述推送单元包括:
获取模块,用于获取所述更新标识数据的数据类型,其中,所述数据类型用于确定所述预设网站发布的内容的类型;以及
推送模块,用于根据所述数据类型将所述更新标识数据推送至与所述数据类型相对应的预设数据库中。
CN201610235949.9A 2016-04-15 2016-04-15 数据稿件的自动处理方法和装置 Pending CN107301158A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610235949.9A CN107301158A (zh) 2016-04-15 2016-04-15 数据稿件的自动处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610235949.9A CN107301158A (zh) 2016-04-15 2016-04-15 数据稿件的自动处理方法和装置

Publications (1)

Publication Number Publication Date
CN107301158A true CN107301158A (zh) 2017-10-27

Family

ID=60137378

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610235949.9A Pending CN107301158A (zh) 2016-04-15 2016-04-15 数据稿件的自动处理方法和装置

Country Status (1)

Country Link
CN (1) CN107301158A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635154A (zh) * 2018-12-14 2019-04-16 成都索贝数码科技股份有限公司 一种基于文稿和新闻节目自动生成互联网图文稿件的方法
CN111079373A (zh) * 2019-12-06 2020-04-28 北大方正集团有限公司 设置定制文件的自定义字体的方法、装置和可读存储介质
CN111612414A (zh) * 2020-04-24 2020-09-01 上海第一财经传媒有限公司 一种移动媒体应用管理系统
CN114841155A (zh) * 2022-04-21 2022-08-02 科技日报社 主题内容智能聚合方法、装置、电子设备及存储介质
CN117057724A (zh) * 2023-07-04 2023-11-14 中国经济信息社有限公司 一种稿件自动建稿与签发方法、装置、电子设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101605210A (zh) * 2009-05-31 2009-12-16 上海文广新闻传媒集团 财经数据制播综合系统
CN104123269A (zh) * 2014-07-16 2014-10-29 华中科技大学 一种基于模板的出版物半自动生成方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101605210A (zh) * 2009-05-31 2009-12-16 上海文广新闻传媒集团 财经数据制播综合系统
CN104123269A (zh) * 2014-07-16 2014-10-29 华中科技大学 一种基于模板的出版物半自动生成方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DREAMWRITER: "9月份CPI涨幅回落至1.6%", 《HTTPS://NEW.QQ.COM/CMSN/20151014/20151014020228》 *
推推兵: "腾讯发首篇"写作机器人"撰写财经稿引热议", 《HTTP://TUITUIBING.COM/NEWS/74-CN.HTML》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635154A (zh) * 2018-12-14 2019-04-16 成都索贝数码科技股份有限公司 一种基于文稿和新闻节目自动生成互联网图文稿件的方法
CN109635154B (zh) * 2018-12-14 2022-11-29 成都索贝数码科技股份有限公司 一种基于文稿和新闻节目自动生成互联网图文稿件的方法
CN111079373A (zh) * 2019-12-06 2020-04-28 北大方正集团有限公司 设置定制文件的自定义字体的方法、装置和可读存储介质
CN111079373B (zh) * 2019-12-06 2021-12-03 北大方正集团有限公司 设置定制文件的自定义字体的方法、装置和可读存储介质
CN111612414A (zh) * 2020-04-24 2020-09-01 上海第一财经传媒有限公司 一种移动媒体应用管理系统
CN111612414B (zh) * 2020-04-24 2024-04-02 上海第一财经传媒有限公司 一种移动媒体应用管理系统
CN114841155A (zh) * 2022-04-21 2022-08-02 科技日报社 主题内容智能聚合方法、装置、电子设备及存储介质
CN117057724A (zh) * 2023-07-04 2023-11-14 中国经济信息社有限公司 一种稿件自动建稿与签发方法、装置、电子设备及介质

Similar Documents

Publication Publication Date Title
CN107301158A (zh) 数据稿件的自动处理方法和装置
CN108021929A (zh) 基于大数据的移动端电商用户画像建立与分析方法及系统
CN109272408A (zh) 车贷款金融产品智能推荐方法、装置、设备及介质
CN109242524A (zh) 基于用户的行为顺序预测购买概率的方法及其设备
CN106339507B (zh) 流媒体消息推送方法和装置
CN109670104A (zh) 基于机器学习的信息推送方法、设备、装置及存储介质
CN110135942A (zh) 产品推荐方法、装置及计算机可读存储介质
CN107835231A (zh) 反馈信息的处理方法及终端设备
CN106897284A (zh) 电子书籍的推荐方法及装置
CN107688987A (zh) 电子装置、保险推荐方法、及计算机可读存储介质
CN107798027A (zh) 一种信息热度预测方法、信息推荐方法及装置
CN107577706B (zh) 用户行为数据处理方法、装置及计算机可读存储介质
CN107818491A (zh) 电子装置、基于用户上网数据的产品推荐方法及存储介质
CN108052670A (zh) 一种相机特效的推荐方法及装置
CN106648688A (zh) 一种信息展示方法和装置
CN108463822A (zh) 利用视觉样式用于信息资源的内容元素的动态渲染交互统计数据
CN106776716A (zh) 一种智能匹配销售顾问和用户的方法及设备
CN107944897A (zh) 数据标签分发系统、方法、服务器和客户端
CN108269117A (zh) 数据的推送、确定方法及装置、计算机终端
CN112100221A (zh) 一种资讯推荐方法、装置、推荐服务器及存储介质
CN107864405A (zh) 一种收视行为类型的预测方法、装置及计算机可读介质
CN108932260A (zh) 服饰搭配推荐方法及装置
CN107566148A (zh) 终端应用操作数据的分析方法、系统、装置及终端
CN110569416B (zh) 基于数据爬取的app控件的处理方法及相关产品
CN104239421A (zh) 一种推送应用到终端的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171027

RJ01 Rejection of invention patent application after publication