CN110147541A - 一种经济报告的生成方法及装置 - Google Patents

一种经济报告的生成方法及装置 Download PDF

Info

Publication number
CN110147541A
CN110147541A CN201910431955.5A CN201910431955A CN110147541A CN 110147541 A CN110147541 A CN 110147541A CN 201910431955 A CN201910431955 A CN 201910431955A CN 110147541 A CN110147541 A CN 110147541A
Authority
CN
China
Prior art keywords
information
template
report
economic
paragraph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910431955.5A
Other languages
English (en)
Other versions
CN110147541B (zh
Inventor
席丽娜
晋耀红
李德彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dinfo Beijing Science Development Co ltd
Original Assignee
Beijing Shenzhou Taiyue Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shenzhou Taiyue Software Co Ltd filed Critical Beijing Shenzhou Taiyue Software Co Ltd
Priority to CN201910431955.5A priority Critical patent/CN110147541B/zh
Publication of CN110147541A publication Critical patent/CN110147541A/zh
Application granted granted Critical
Publication of CN110147541B publication Critical patent/CN110147541B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/189Automatic justification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种经济报告的生成方法及装置,用户录入报告信息后,该方法利用报告信息和预置报告模板的标识进行匹配,得到目标报告模板,然后根据报告信息以及目标报告模板中每个段落模板的动态模板元素的类型,调取相应的数据库,生成相应的动态文本信息;将每个动态文本信息与待填充模板元素对应的填充信息和静态模板元素按照所在段落模板中的排列顺序进行拼接,生成报告文本。因此,本申请的经济报告生成过程需要的人工干预少,与传统的人工撰写相比,报告生成速度快,可提高经济报告生成效率,并且降低用户工作量。

Description

一种经济报告的生成方法及装置
技术领域
本申请涉及文本处理领域,尤其涉及一种经济报告的生成方法及装置。
背景技术
经济报告是以预定计划指标、统计数据和调查研究所获得的信息资料为依据,对某一时期内某一领域的经济状况进行分析的报告。经济报告的撰写格式通常较为固定,在经济报告的撰写过程中,经济报告的内容在多个部分中或者多个经济报告之间可能存在相同的描述,传统的人工撰写经济报告的方式,用户通常重复撰写这些相同的内容,从而导致经济报告生成效率低下。
发明内容
本申请提供了一种经济报告的生成方法及装置,以解决传统的人工撰写经济报告的方式,用户通常重复撰写这些相同的内容,从而导致经济报告生成效率低下的问题。
第一方面,本申请提供了一种经济报告的生成方法,所述方法包括:
获取用户输入的报告信息,所述报告信息包括报告频度、报告时间、报告分析对象和报告分析数据;
将所述报告信息与预置报告模板的标识进行匹配,得到目标报告模板,所述预置报告模板由至少一个段落模板组成,每个所述段落模板包括待填充模板元素、静态模板元素和动态模板元素,所述段落模板为无标题段落模板或有标题段落模板;
获取待填充模板元素对应的填充信息;
根据所述报告信息以及目标报告模板中每个段落模板的动态模板元素的类型,调取相应的数据库,生成相应的动态文本信息;
将每个所述动态文本信息与待填充模板元素对应的填充信息和静态模板元素按照所在段落模板中的排列顺序进行拼接,生成报告文本。
第二方面,本申请还提供了一种经济报告的生成装置,所述装置包括:
第一获取模块,用于获取用户输入的报告信息,所述报告信息包括报告频度、报告时间、报告分析对象和报告分析数据;
第一匹配模块,用于将所述报告信息与预置报告模板的标识进行匹配,得到目标报告模板,所述预置报告模板由至少一个段落模板组成,每个所述段落模板包括待填充模板元素、静态模板元素和动态模板元素,所述段落模板为无标题段落模板或有标题段落模板;
第二获取模块,用于获取待填充模板元素对应的填充信息;
动态文本信息生成模块,用于根据所述报告信息以及目标报告模板中每个段落模板的动态模板元素的类型,调取相应的数据库,生成相应的动态文本信息;
报告文本生成模块,用于将每个所述动态文本信息与待填充模板元素对应的填充信息和静态模板元素按照所在段落模板中的排列顺序进行拼接,生成报告文本。
由以上技术方案可知,本申请提供了一种经济报告的生成方法及装置,用户录入报告信息后,该方法利用报告信息和预置报告模板的标识进行匹配,得到目标报告模板,然后根据报告信息以及目标报告模板中每个段落模板的动态模板元素的类型,调取相应的数据库,生成相应的动态文本信息;将每个动态文本信息与待填充模板元素对应的填充信息和静态模板元素按照所在段落模板中的排列顺序进行拼接,生成报告文本。因此,本申请的经济报告生成过程需要的人工干预少,与传统的人工撰写相比,报告生成速度快,可提高经济报告生成效率,并且降低用户工作量。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一种经济报告的生成方法的流程图;
图2为步骤105一实施例的流程图;
图3为步骤105另一实施例的流程图;
图4为构建趋势库的方法流程图。
图5为本申请提供的一种经济报告的生成装置的结构示意图;
图6为动态文本信息生成模块一实施例的结构示意图;
图7为动态文本信息生成模块一实施例的结构示意图。
具体实施方式
参见图1,第一方面,本申请的一实施例提供了一种经济报告的生成方法,所述方法包括:
步骤101:获取用户输入的报告信息,所述报告信息包括报告频度、报告时间、报告分析对象和报告分析数据。
具体地,报告频度为所做报告的频率,例如每月做一次报告、每个季度做一次报告等;报告时间为报告内容的具体时间,例如具体月份(如八月)、季度(如第四季度)等;报告分析对象为报告需要分析的内容,如工业经济等;报告分析数据为报告分析中所用到的分析模型,例如经济预测分析模型等。用户可根据实际需撰写报告的情况,输入上述报告信息。
步骤102:将所述报告信息与预置报告模板的标识进行匹配,得到目标报告模板,所述预置报告模板由至少一个段落模板组成,每个所述段落模板包括待填充模板元素、静态模板元素和动态模板元素,所述段落模板为无标题段落模板或有标题段落模板。
每个预置报告模板均设有标识,该标识包括报告频度、报告时间、报告分析对象和报告分析数据。具体地,报告频度为对应的预置报告模板的报告频率;报告时间为对应的预置报告模板的具体完成时间;报告分析对象为对应的预置报告模板分析的内容;报告分析数据为对应的预置报告模板分析中所用到的分析模型。
利用用户输入的报告信息与每个预置报告模板的标识进行匹配,将标识与用户录入的报告信息一致的预置模板确定为目标报告模板。
预置报告模板由至少一个段落模板组成,每个段落模板均包括待填充模板元素、静态模板元素和动态模板元素。例如:
【报告数据】预测结果显示,我省【报告时间】+【分析对象】+{预测结果},#累计预测结果#。
其中,【报告数据】、【报告时间】和【分析对象】为待填充模板元素,该部分由用户进行录入,在模板中可用符号“【】”标识出,也可以用其他符号进行标识;“预测结果显示”和“我省”为静态模板元素,即预先由工作人员进行设置的默认文本信息;#累计预测结果#为动态模板元素,在模板中可用符号“##”标识出,也可以用其他符号进行标识;其中{预测结果}=#指定时间预测结果#+#累计预测结果#,表示预测结果需要指定时间预测记过和累积预测结果两个动态模板元素组合而成;“+”表示文本的连接符号。
根据实际的报告的撰写情况,一般报告的起始和结束为无标题段落,中间部分为具体说明内容,通常为有标题段落。对于无标题段落的段落模板如下例所示:
【报告数据】预测结果显示,我省【报告时间】+【分析对象】+{预测结果},#累计预测结果#。
其中,【报告数据】、【报告时间】和【分析对象】为待填充模板元素,该部分由用户进行录入;“预测结果显示”和“我省”为静态模板元素,即预先由工作人员进行设置的默认文本信息;#累计预测结果#为动态模板元素,其中{预测结果}=#指定时间预测结果#+#累计预测结果#,表示预测结果需要指定时间预测结果累积预测结果两个动态模板元素组合而成;“+”表示文本的连接符号。
对于有标题段落的段落模板如下例所示:
【指标分类名称】说明
【指标分类名称】+N#指标变化趋势#
有利因素:#指标变化趋势利弊判别#+#指标变化趋势说明现象#
[【分析参考时间】+【分析指标名称】+{指标详细变化情况分析}+#影响因素分析#+#影响结果分析#]
不利因素:#指标变化趋势利弊判别#+#指标变化趋势说明现象#
[【分析参考时间】+【分析指标名称】+{指标详细变化情况分析}+#影响因素分析#+#影响结果分析#]
其中,“【指标分类名称】说明”为段落标题,并且“【指标分类名称】”、“【分析参考时间】”和“【分析指标名称】”为待填充模板元素,由用户进行录入,如指标分类名称可为宏观经济指标、生产性指标等,分析指标名称可为CPI等。“#指标变化趋势#”、“#指标变化趋势利弊判别#”、“#指标变化趋势说明现象#”、“#影响因素分析#”和“#影响结果分析#”为动态模板元素;N表示由多个相同的动态模板元素组成,例如,N#指标变化趋势#表示有两个以上的#指标变化趋势#组成;“+”表示文本的连接符号;“说明”、“有利因素”和“不利因素”为静态模板元素,由工作人员在制定模板时进行录入的默认文本。
步骤103:获取待填充模板元素对应的填充信息。
待填充模板元素可由用户根据实际撰写需求进行录入,如上例中的【报告数据】、【报告时间】和【分析对象】等。
步骤104:根据所述报告信息以及目标报告模板中每个段落模板的动态模板元素的类型,调取相应的数据库,生成相应的动态文本信息。
步骤105:将每个所述动态文本信息与待填充模板元素对应的填充信息和静态模板元素按照所在段落模板中的排列顺序进行拼接,生成报告文本。
如段落模板为:【报告数据】预测结果显示,我省【报告时间】+【分析对象】+{预测结果},#累计预测结果#。待填充模板元素对应的填充信息和动态文本信息分别拼接在段落模板的相应位置,如待填充模板元素【报告时间】对应填充信息为“1998年1月”,【分析对象】对应填充信息“工业经济增长率”,则按照段落模板中的排布顺序进行拼接,得到“我省1998年1月工业经济增长率”的文本内容,其他部分均按照上述方式进行拼接,不再赘述,最后完成每个段落模板内各个模板元素的拼接,以形成报告文本。
由以上技术方案可知,本申请提供了一种经济报告的生成方法,用户录入报告信息后,该方法利用报告信息和预置报告模板的标识进行匹配,得到目标报告模板,然后根据报告信息以及目标报告模板中每个段落模板的动态模板元素的类型,调取相应的数据库,生成相应的动态文本信息;将每个动态文本信息与待填充模板元素对应的填充信息和静态模板元素按照所在段落模板中的排列顺序进行拼接,生成报告文本。因此,本申请的经济报告生成过程需要的人工干预少,与传动的人工撰写相比,报告生成速度快,提高经济报告生成效率,并降低用户工作量。
参见图2,在本申请的另一实施例中,在所述动态模板元素为调用函数类动态模板元素的情况下,上述实施例步骤104包括如下步骤:
步骤201:如果所述动态模板元素为调用函数类动态模板元素,则根据所述报告信息的报告分析数据,调取函数库中对应的预设函数模型及业务数据库中所述预设函数模型所需数据,计算得到所述报告分析数据对应的分析结果。
预设函数模型为用户提供的报告分析所使用的函数模型。根据用户录入的报告分析数据,如经济预测模型预测结果,调取相应的预设函数模型,如经济预测模型,以及调取业务数据库中该预设函数模型所需的数据,然后利用预设函数模型进行计算,得到分析结果。
步骤202:将所述分析结果、报告分析对象和报告时间与所述动态模板元素中的预设输出文本按照预设的排列顺序进行拼接,得到对应段落的动态文本信息。
动态模板元素具体的输入和输出由工作人员进行预先设置,例如:
输入参数
参数名称:预测方法名称;参数类型:String;示例:工业经济运行预测模型
参数名称:预测月份;参数类型:Integer(1-12);示例:9
参数名称:分析对象;参数类型:String;示例:工业增加值增速
输出结果
字段名称:生成内容;字段类型:String;字段值:“9月工业增加值增速预计9%,较上月上升0.2百分点。”
字段名称:预测结果数据序列;字段类型:Object;字段值:[
字段名称:序列数据;字段类型:Object;字段值:[
字段名称:序列名称;字段类型:String;字段值:时间
字段名称:序列值;字段类型:Array[Integer];字段值:[1,2,3,……,8,9]、
字段名称:序列名称;字段类型:String;字段值:工业增加值增速
字段名称:序列值;字段类型:Array[Double];字段值:[8.6,8.4,7.8,……,9.6,9.0]
]
]
由此可以看出,动态模板元素中的输出结果中“9月工业增加值增速预计9%,较上月上升0.2百分点。”和“工业增加值增速”为预设的输出文本,其余部分为由预设函数模型进行计算得到的相应结果,并与报告分析对象和报告时间按照预设的排列顺序进行拼接,得到其所在段落的动态文本。其中,分析结果、报告分析对象和报告时间与对应段落的动态模板元素中的预设输出文本的排列顺序由工作人员预先设置。
参见图3,在本申请的另一实施例中,在动态模板元素为变化趋势类动态模板元素的情况下,如“#指标变化趋势说明现象#”,上述实施例步骤104包括如下步骤:
步骤301:如果动态模板元素为变化趋势类动态模板元素,则对所述动态模板元素所在的段落模板进行解析,得到对应的业务要素。
具体地,在所述段落模板为有标题段落模板的情况下,该解析的步骤包括:
(1)对所述动态模板元素所在的段落模板进行解析,得到所述段落模板中的段落标题。
(2)将所述段落标题确定为业务要素。
继续以步骤102中的有标题段落模板的例子为例,对该有标题段落模板进行解析后,其段落标题为“【指标分类名称】说明”,并将该段落标题确定为该有标题段落模板对应的业务要素。
在所述段落模板为无标题段落模板的情况下,该解析的步骤包括:
(1)对所述动态模板元素所在的段落模板进行解析,得到所述段落模板中的段落分析对象;
(2)将所述段落模板中的段落分析对象确定为业务要素。
继续步骤102中的无标题段落模板的例子为例,对该无标题段落模板进行解析后,得到其具体的分析对象,将分析对象确定为该无标题段落模板对应的业务要素。
步骤302:根据每个所述业务要素,调取业务知识库,查找到所述业务知识库中所述业务要素所包含的经济指标实体以及每个经济指标实体对应的经济指标变化趋势类别信息和经济指标关联信息。
由步骤301解析得到的业务要素,如宏观经济指标,根据业务要素,调取业务知识库,查找到业务要素包含的经济指标实体以及每个经济指标实体对应的经济指标变化趋势类别信息和经济指标关联信息;其中经济指标关联信息包括指标变化趋势说明现象信息和影响经济要素及影响方式信息等。以业务要素为宏观经济指标为例,业务知识库中存储宏观经济指标对应的“GDP”、“CPI”和“PPI”等经济指标实体;“CPI上涨-》有利因素”和“PPI下跌-》不利因素”等为经济指标变化趋势类别信息;“CPI上涨-》需求端旺盛”和“PPI下跌-》成本有压力”等为指标变化趋势说明现象信息;“CPI上涨-》工业增加值增速-》积极影响”等为影响经济要素及影响方式信息。
业务知识库可由语义模型对历史经济报告中抽取目标信息后进行自动补充。语义模型包括抽取槽点,抽取槽点可为具体的经济指标实体,如“GDP”、“CPI”和“PPI”等,每个抽取槽点还可由用户根据实际撰写需求添加子槽点,如“CPI”的抽取槽点下可增加“指标变化趋势”、“同比变化趋势”等子槽点,每个槽点都有对应的抽取表达式。
具体抽取过程为:首先获取抽取表达式,所述抽取表达式包括前置定位信息、抽取文本信息和后置定位信息,前置定位信息可以是经济指标实体,如CPI,后置的定位信息可以是与前置定位信息不同的其他经济指标实体,如“PPI”,也可以是预设的标点符号或者段落结束符号等,抽取文本信息可为需抽取的目标信息的正则表达式,其中目标信息可以是词、词组或短句等。
然后将所述前置定位信息和后置定位信息分别与历史经济报告的文本进行匹配,确定起始词和结束词;根据所述起始词和结束词,确定待抽取区域;利用所述抽取文本信息与所述待抽取区域内的文本进行匹配,得到与所述抽取文本信息相匹配的目标信息。
例如,历史经济报告的文本中的文本内容为“有利因素:CPI持续上涨,需求端旺盛。8月份,受食品价格上涨和季节性因素影响,全省居民消费支出(CPI)同比上涨2.3%,较上月上升0.2个百分点,连续两个月增长高于2%,证明市场需求端较为旺盛,对9月工业增加值增速有积极影响。”前置定位信息为CPI,后置定位信息为段落结束符,则经前置定位信息和后置定位信息确定的待抽取区域为“CPI持续上涨,需求端旺盛。8月份,受食品价格上涨和季节性因素影响,全省居民消费支出(CPI)同比上涨2.3%,较上月上升0.2个百分点,连续两个月增长高于2%,证明市场需求端较为旺盛,对9月工业增加值增速有积极影响。”,然后,利用抽取文本信息的正则表达式对待抽取区域的文本进行匹配,得到各个槽点对应的目标信息,如“指标变化趋势”槽点下的目标信息为“上涨”和“持续上涨”,再建立槽点与对应的目标信息的映射关系,即得到“指标变化趋势-》上涨”和“指标变化趋势-》持续上涨”,完成对业务知识库的自动填充。
步骤303:根据所述经济指标实体、报告时间和报告频度,获取业务数据库中对应的指标值序列。
指标值序列由业务数据库中在该经济指标实体下的报告时间和报告频度内的指标数据组成。
步骤304:根据所述指标值序列,得到对应的经济数据曲线。
步骤305:将所述经济数据曲线对应的报告时间和报告频度与趋势库中所述经济指标实体对应的变化趋势信息中的时间信息进行匹配,得到所述趋势库中所述经济指标实体在相同的报告时间和报告频度的经济趋势变化曲线;所述变化趋势信息包括经济指标实体对应的时间信息和经济指标趋势走向信息。其中,时间信息为具体的日期,如“xx年xx月”等;经济指标趋势信息为上涨、下跌等。
步骤306:将所述经济数据曲线与趋势库中所述经济指标实体在所述报告时间和报告频度相同的经济趋势变化曲线按照预设的匹配算法进行匹配,得到与所述经济数据曲线相匹配的经济趋势变化曲线。其中,趋势库中存储有大量的经济趋势变化曲线。预设的匹配算法为现有的匹配算法,如DTW算法等。
步骤307:将相匹配的经济趋势变化曲线对应的变化趋势信息确定为对应的经济指标实体的变化趋势信息。
步骤308:将所述经济指标实体的变化趋势信息中的经济指标趋势走向信息与所述业务知识库中所述经济指标实体对应的经济指标变化趋势类别信息和经济指标关联信息进行匹配,确定所述经济指标实体的经济指标变化趋势类别信息和经济指标关联信息。
以经济指标实体为CPI为例,业务知识库中存储的CPI的经济指标变化趋势类别信息为“CPI上涨-》有利因素”和“CPI下跌-》不利因素”;经济指标变化趋势信息为“CPI上涨-》需求端旺盛”和“CPI下跌-》成本有压力”,根据由经济数据曲线匹配确定的经济指标趋势走向信息,如“CPI上涨”,与业务知识库中所述经济指标实体对应的经济指标变化趋势类别信息和经济指标关联信息进行匹配,最终得到经济指标实体CPI的经济指标变化趋势为“CPI上涨-》有利因素”和经济指标关联信息“CPI上涨-》需求端旺盛”。
步骤309:将所述经济指标实体的经济指标变化趋势类别信息和经济指标关联信息与对应段落的动态模板元素中的预设输出文本按照预设的排列顺序进行拼接,得到对应段落的动态文本信息。动态模板元素和拼接的过程具体参见步骤202的输出结果设计,不再赘述。
参见图4,上述实施例中的趋势库的构建包括如下步骤:
步骤401:获取抽取表达式,所述抽取表达式包括前置定位信息、抽取文本信息和后置定位信息。
前置定位信息可以是经济指标实体,如CPI,后置的定位信息可以是与前置定位信息不同的其他经济指标实体,如“PPI”,也可以是预设的标点符号或者段落结束符号等,抽取文本信息可为需抽取的目标信息的正则表达式,其中目标信息可以是词、词组或短句等。
步骤402:将所述前置定位信息和后置定位信息分别与历史经济报告的文本进行匹配,确定起始词和结束词。
步骤403:根据所述起始词和结束词,确定待抽取区域。
例如,历史经济报告的文本中的文本内容为“有利因素:CPI持续上涨,需求端旺盛。8月份,受食品价格上涨和季节性因素影响,全省居民消费支出(CPI)同比上涨2.3%,较上月上升0.2个百分点,连续两个月增长高于2%,证明市场需求端较为旺盛,对9月工业增加值增速有积极影响。”前置定位信息为CPI,后置定位信息为段落结束符,则匹配之后,确定的起始词为“CPI”,结束词为段落结束符。最终确定的待抽取区域为“CPI持续上涨,需求端旺盛。8月份,受食品价格上涨和季节性因素影响,全省居民消费支出(CPI)同比上涨2.3%,较上月上升0.2个百分点,连续两个月增长高于2%,证明市场需求端较为旺盛,对9月工业增加值增速有积极影响。”
步骤404:利用所述抽取文本信息与所述待抽取区域内的文本进行匹配,得到变化趋势信息和经济指标关联信息,所述变化趋势信息包括经济指标实体对应的时间信息和经济指标趋势走向信息。
由待抽取文本信息,如正则表达式与待抽取区域内的文本进行匹配,得到相匹配的目标信息,如“上涨”、“连续增长”、“八月”、“需求端旺盛”。其中,“上涨”为CPI的经济趋势走向信息,“八月”为CPI的时间信息,“需求端旺盛”为CPI的经济指标关联信息。
步骤405:将趋势库中所述经济指标实体对应的经济指标关联信息添加到业务知识库内所经济指标实体对应的经济指标关联信息中。
趋势库中挖掘出来的经济指标关联信息可添加到业务知识库内,用来辅助构建业务知识库。
步骤406:建立所述变化趋势信息与对应的经济趋势变化曲线的映射关系,形成趋势库。
具体地,如将上述趋势变化词“上涨”、“连续增长”、“八月”与八月的经济变化趋势变化曲线进行映射。
参见图5,第二方面,本申请提供了一种经济报告的生成装置,所述装置包括:
第一获取模块501,用于获取用户输入的报告信息,所述报告信息包括报告频度、报告时间、报告分析对象和报告分析数据;
第一匹配模块502,用于将所述报告信息与预置报告模板的标识进行匹配,得到目标报告模板,所述预置报告模板由至少一个段落模板组成,每个所述段落模板包括待填充模板元素、静态模板元素和动态模板元素,所述段落模板为无标题段落模板或有标题段落模板;
第二获取模块503,用于获取待填充模板元素对应的填充信息;
动态文本信息生成模块504,用于根据所述报告信息以及目标报告模板中每个段落模板的动态模板元素的类型,调取相应的数据库,生成相应的动态文本信息;
报告文本生成模块505,用于将每个所述动态文本信息与待填充模板元素对应的填充信息和静态模板元素按照所在段落模板中的排列顺序进行拼接,生成报告文本。
由以上技术方案可知,本申请提供了一种经济报告的生成装置,用户录入报告信息后,利用报告信息和预置报告模板的标识进行匹配,得到目标报告模板,然后根据报告信息以及目标报告模板中每个段落模板的动态模板元素的类型,调取相应的数据库,生成相应的动态文本信息;将每个动态文本信息与待填充模板元素对应的填充信息和静态模板元素按照所在段落模板中的排列顺序进行拼接,生成报告文本。因此,本申请的经济报告生成过程需要的人工干预少,与传动的人工撰写相比,报告生成速度快,提高经济报告生成效率,并且降低用户工作量。
进一步地,参见图6,所述动态文本信息生成模块包括:
计算单元601,用于如果所述动态模板元素为调用函数类动态模板元素,则根据所述报告信息的报告分析数据,调取函数库中对应的预设函数模型及业务数据库中所述预设函数模型所需数据,计算得到所述报告分析数据对应的分析结果;
第一动态文本生成单元602,用于将所述分析结果、报告分析对象和报告时间与所述动态模板元素中的预设输出文本按照预设的排列顺序进行拼接,得到对应段落的动态文本信息。
进一步地,参见图7,所述动态文本信息生成模块包括:
解析单元701,用于如果动态模板元素为变化趋势类动态模板元素,则对所述动态模板元素所在的段落模板进行解析,得到对应的业务要素;查找单元702,用于根据每个所述业务要素,调取业务知识库,查找到所述业务知识库中所述业务要素所包含的经济指标实体以及每个经济指标实体对应的经济指标变化趋势类别信息和经济指标关联信息;
获取单元703,用于根据所述经济指标实体、报告时间和报告频度,获取业务数据库中对应的指标值序列;
经济数据曲线生成单元704,用于根据所述指标值序列,得到对应的经济数据曲线;
确定单元705,用于根据所述经济数据曲线,调用趋势库中的经济趋势变化曲线和业务知识库中所述经济指标实体对应的经济指标变化趋势类别信息和经济指标关联信息,确定所述经济指标实体的经济指标变化趋势类别信息和经济指标关联信息;
第二动态文本生成单元706,用于将所述经济指标实体的变化趋势类别信息和指标变化趋势信息与对应段落的动态模板元素中的预设输出文本按照预设的排列顺序进行拼接,得到对应段落的动态文本信息。
本领域的技术人员可以清楚地了解到本申请实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请实施例中的技术方案本质上或者或对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以似的一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分可相互参见即可,每个实施例重点说明的都是与其他实施例的不同之处,尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

Claims (10)

1.一种经济报告的生成方法,其特征在于,所述方法包括:
获取用户输入的报告信息,所述报告信息包括报告频度、报告时间、报告分析对象和报告分析数据;
将所述报告信息与预置报告模板的标识进行匹配,得到目标报告模板,所述预置报告模板由至少一个段落模板组成,每个所述段落模板包括待填充模板元素、静态模板元素和动态模板元素,所述段落模板为无标题段落模板或有标题段落模板;
获取待填充模板元素对应的填充信息;
根据所述报告信息以及目标报告模板中每个段落模板的动态模板元素的类型,调取相应的数据库,生成相应的动态文本信息;
将每个所述动态文本信息与待填充模板元素对应的填充信息和静态模板元素按照所在段落模板中的排列顺序进行拼接,生成报告文本。
2.如权利要求1所述的方法,其特征在于,所述根据所述报告信息以及目标报告模板中每个段落模板的动态模板元素的类型,调取相应的数据库,生成相应的动态文本信息包括:
如果所述动态模板元素为调用函数类动态模板元素,则根据所述报告信息的报告分析数据,调取函数库中对应的预设函数模型及业务数据库中所述预设函数模型所需数据,计算得到所述报告分析数据对应的分析结果;
将所述分析结果、报告分析对象和报告时间与所述动态模板元素中的预设输出文本按照预设的排列顺序进行拼接,得到对应段落的动态文本信息。
3.如权利要求1所述的方法,其特征在于,所述根据所述报告信息以及目标报告模板中每个段落模板的动态模板元素的类型,调取相应的数据库,生成相应的动态文本信息包括:
如果动态模板元素为变化趋势类动态模板元素,则对所述动态模板元素所在的段落模板进行解析,得到对应的业务要素;
根据每个所述业务要素,调取业务知识库,查找到所述业务知识库中所述业务要素所包含的经济指标实体以及每个经济指标实体对应的经济指标变化趋势类别信息和经济指标关联信息;
根据所述经济指标实体、报告时间和报告频度,获取业务数据库中对应的指标值序列;
根据所述指标值序列,得到对应的经济数据曲线;
根据所述经济数据曲线,调用趋势库中所述经济指标实体对应的变化趋势信息及经济趋势变化曲线和业务知识库中所述经济指标实体对应的经济指标变化趋势类别信息和经济指标关联信息,确定所述经济指标实体的经济指标变化趋势类别信息和经济指标关联信息;
将所述经济指标实体的经济指标变化趋势类别信息和经济指标关联信息与对应段落的动态模板元素中的预设输出文本按照预设的排列顺序进行拼接,得到对应段落的动态文本信息。
4.如权利要求3所述的方法,其特征在于,所述根据所述经济数据曲线,调用趋势库中所述经济指标实体对应的变化趋势信息及经济趋势变化曲线和业务知识库中所述经济指标实体对应的经济指标变化趋势类别信息和经济指标关联信息,确定所述经济指标实体的经济指标变化趋势类别信息和经济指标关联信息包括:
将所述经济数据曲线对应的报告时间和报告频度与趋势库中所述经济指标实体对应的变化趋势信息中的时间信息进行匹配,得到所述趋势库中所述经济指标实体在相同的报告时间和报告频度的经济趋势变化曲线;所述变化趋势信息包括经济指标实体对应的时间信息和经济指标趋势走向信息;
将所述经济数据曲线与趋势库中所述经济指标实体在相同报告时间和报告频度的经济趋势变化曲线按照预设的匹配算法进行匹配,得到与所述经济数据曲线相匹配的经济趋势变化曲线;
将相匹配的经济趋势变化曲线对应的变化趋势信息确定为对应的经济指标实体的变化趋势信息;
将所述经济指标实体的变化趋势信息中的经济指标趋势走向信息与所述业务知识库中所述经济指标实体对应的经济指标变化趋势类别信息和经济指标关联信息进行匹配,确定所述经济指标实体的经济指标变化趋势类别信息和经济指标关联信息。
5.如权利要求3所述的方法,其特征在于,所述趋势库的构建包括:
获取抽取表达式,所述抽取表达式包括前置定位信息、抽取文本信息和后置定位信息;
将所述前置定位信息和后置定位信息分别与历史经济报告的文本进行匹配,确定起始词和结束词;
根据所述起始词和结束词,确定待抽取区域;
利用所述抽取文本信息与所述待抽取区域内的文本进行匹配,得到变化趋势信息和经济指标关联信息,所述变化趋势信息包括经济指标实体对应的时间信息和经济指标趋势走向信息;
将趋势库中所述经济指标实体对应的经济指标关联信息添加到业务知识库内所述经济指标实体对应的经济指标关联信息中;
建立所述变化趋势信息与对应的经济趋势变化曲线的映射关系,形成趋势库。
6.如权利要求3所述的方法,其特征在于,在所述段落模板为有标题段落模板的情况下,所述对所述动态模板元素所在的段落模板进行解析,得到对应的业务要素包括,
对所述动态模板元素所在的段落模板进行解析,得到所述段落模板中的段落标题;
将所述段落标题确定为业务要素。
7.如权利要求3所述的方法,其特征在于,在所述段落模板为无标题段落模板的情况下,所述对所述动态模板元素所在的段落模板进行解析,得到对应的业务要素包括,
对所述动态模板元素所在的段落模板进行解析,得到所述段落模板中的段落分析对象;
将所述段落模板中的段落分析对象确定为业务要素。
8.一种经济报告的生成装置,其特征在于,所述装置包括:
第一获取模块,用于获取用户输入的报告信息,所述报告信息包括报告频度、报告时间、报告分析对象和报告分析数据;
第一匹配模块,用于将所述报告信息与预置报告模板的标识进行匹配,得到目标报告模板,所述预置报告模板由至少一个段落模板组成,每个所述段落模板包括待填充模板元素、静态模板元素和动态模板元素,所述段落模板为无标题段落模板或有标题段落模板;
第二获取模块,用于获取待填充模板元素对应的填充信息;
动态文本信息生成模块,用于根据所述报告信息以及目标报告模板中每个段落模板的动态模板元素的类型,调取相应的数据库,生成相应的动态文本信息;
报告文本生成模块,用于将每个所述动态文本信息与待填充模板元素对应的填充信息和静态模板元素按照所在段落模板中的排列顺序进行拼接,生成报告文本。
9.如权利要求8所述的装置,其特征在于,所述动态文本信息生成模块包括:
计算单元,用于如果所述动态模板元素为调用函数类动态模板元素,则根据所述报告信息的报告分析数据,调取函数库中对应的预设函数模型及业务数据库中所述预设函数模型所需数据,计算得到所述报告分析数据对应的分析结果;
第一动态文本生成单元,用于将所述分析结果、报告分析对象和报告时间与对应段落的动态模板元素中的预设输出文本按照预设的排列顺序进行拼接,得到所述动态文本信息。
10.如权利要求8所述的装置,其特征在于,所述动态文本信息生成模块包括:
解析单元,用于如果动态模板元素为变化趋势类动态模板元素,则对所述动态模板元素所在的段落模板进行解析,得到对应的业务要素;
查找单元,用于根据每个所述业务要素,调取业务知识库,查找到所述业务知识库中所述业务要素所包含的经济指标实体以及每个经济指标实体对应的经济指标变化趋势类别信息和经济指标关联信息;获取单元,用于根据所述经济指标实体、报告时间和报告频度,获取业务数据库中对应的指标值序列;
经济数据曲线生成单元,用于根据所述指标值序列,得到对应的经济数据曲线;
确定单元,用于根据所述经济数据曲线,调用趋势库中的所述经济指标实体对应的变化趋势信息及经济趋势变化曲线和业务知识库中所述经济指标实体对应的经济指标变化趋势类别信息和经济指标关联信息,确定所述经济指标实体的经济指标变化趋势类别信息和经济指标关联信息;
第二动态文本生成单元,用于将所述经济指标实体的经济指标变化趋势类别信息和经济指标关联信息与对应段落的动态模板元素中的预设输出文本按照预设的排列顺序进行拼接,得到对应段落的动态文本信息。
CN201910431955.5A 2019-05-23 2019-05-23 一种经济报告的生成方法及装置 Active CN110147541B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910431955.5A CN110147541B (zh) 2019-05-23 2019-05-23 一种经济报告的生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910431955.5A CN110147541B (zh) 2019-05-23 2019-05-23 一种经济报告的生成方法及装置

Publications (2)

Publication Number Publication Date
CN110147541A true CN110147541A (zh) 2019-08-20
CN110147541B CN110147541B (zh) 2023-08-25

Family

ID=67592858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910431955.5A Active CN110147541B (zh) 2019-05-23 2019-05-23 一种经济报告的生成方法及装置

Country Status (1)

Country Link
CN (1) CN110147541B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111190946A (zh) * 2019-12-10 2020-05-22 平安医疗健康管理股份有限公司 报告生成方法、装置、计算机设备和存储介质
CN111553137A (zh) * 2020-03-30 2020-08-18 平安医疗健康管理股份有限公司 报告生成方法、装置、存储介质及计算机设备
CN111782916A (zh) * 2020-08-20 2020-10-16 支付宝(杭州)信息技术有限公司 用于生成业务资讯报告的方法及装置
CN112052658A (zh) * 2020-09-04 2020-12-08 深圳市长隆科技有限公司 水质检测仪的检测报告自动生成方法、系统和设备
CN112100287A (zh) * 2020-09-15 2020-12-18 北京通付盾人工智能技术有限公司 一种基于动态规划技术的集成式云端kyc方法
CN112199931A (zh) * 2020-09-24 2021-01-08 联合赤道环境评价有限公司 一种基于大数据的环保咨询类报告智能生成方法
CN112307152A (zh) * 2019-08-29 2021-02-02 北京字节跳动网络技术有限公司 一种数据解析方法、装置、电子设备及存储介质
CN112749536A (zh) * 2019-10-31 2021-05-04 北京国双科技有限公司 文书生成方法、装置和设备
WO2021139343A1 (zh) * 2020-06-29 2021-07-15 平安科技(深圳)有限公司 基于自然语言处理的数据分析方法、装置和计算机设备
CN113379282A (zh) * 2021-06-24 2021-09-10 南方电网数字电网研究院有限公司 一种基于电力的经济景气状态分析方法、系统及存储介质
WO2021196825A1 (zh) * 2020-03-31 2021-10-07 深圳壹账通智能科技有限公司 摘要生成方法、装置、电子设备及介质
CN114139517A (zh) * 2021-11-11 2022-03-04 浙江华东工程数字技术有限公司 一种基于章节标签自动组合报告的方法及系统
CN114169306A (zh) * 2021-12-13 2022-03-11 平安养老保险股份有限公司 一种生成电子回执单的方法、装置、设备及可读存储介质
CN114255841A (zh) * 2021-12-17 2022-03-29 杭州太美星程医药科技有限公司 一种报告导出方法、装置及电子设备
CN114357961A (zh) * 2021-12-25 2022-04-15 上海瑞和工程咨询有限公司 一种项目可行性研究报告生成方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100274584A1 (en) * 2009-04-23 2010-10-28 Kim Hyong S Method and system for presenting and processing multiple text-based medical reports
CN108564997A (zh) * 2018-04-19 2018-09-21 北京深度智耀科技有限公司 一种临床研究报告生成方法和装置
CN109783787A (zh) * 2018-12-29 2019-05-21 远光软件股份有限公司 一种结构化文档的生成方法、装置及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100274584A1 (en) * 2009-04-23 2010-10-28 Kim Hyong S Method and system for presenting and processing multiple text-based medical reports
CN108564997A (zh) * 2018-04-19 2018-09-21 北京深度智耀科技有限公司 一种临床研究报告生成方法和装置
CN109783787A (zh) * 2018-12-29 2019-05-21 远光软件股份有限公司 一种结构化文档的生成方法、装置及存储介质

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112307152A (zh) * 2019-08-29 2021-02-02 北京字节跳动网络技术有限公司 一种数据解析方法、装置、电子设备及存储介质
CN112749536A (zh) * 2019-10-31 2021-05-04 北京国双科技有限公司 文书生成方法、装置和设备
CN111190946A (zh) * 2019-12-10 2020-05-22 平安医疗健康管理股份有限公司 报告生成方法、装置、计算机设备和存储介质
CN111553137A (zh) * 2020-03-30 2020-08-18 平安医疗健康管理股份有限公司 报告生成方法、装置、存储介质及计算机设备
CN111553137B (zh) * 2020-03-30 2023-03-21 深圳平安医疗健康科技服务有限公司 报告生成方法、装置、存储介质及计算机设备
WO2021196825A1 (zh) * 2020-03-31 2021-10-07 深圳壹账通智能科技有限公司 摘要生成方法、装置、电子设备及介质
WO2021139343A1 (zh) * 2020-06-29 2021-07-15 平安科技(深圳)有限公司 基于自然语言处理的数据分析方法、装置和计算机设备
CN111782916A (zh) * 2020-08-20 2020-10-16 支付宝(杭州)信息技术有限公司 用于生成业务资讯报告的方法及装置
CN111782916B (zh) * 2020-08-20 2024-03-22 支付宝(杭州)信息技术有限公司 用于生成业务资讯报告的方法及装置
CN112052658A (zh) * 2020-09-04 2020-12-08 深圳市长隆科技有限公司 水质检测仪的检测报告自动生成方法、系统和设备
CN112100287A (zh) * 2020-09-15 2020-12-18 北京通付盾人工智能技术有限公司 一种基于动态规划技术的集成式云端kyc方法
CN112100287B (zh) * 2020-09-15 2023-12-29 北京通付盾人工智能技术有限公司 一种基于动态规划技术的集成式云端kyc方法
CN112199931A (zh) * 2020-09-24 2021-01-08 联合赤道环境评价有限公司 一种基于大数据的环保咨询类报告智能生成方法
CN113379282A (zh) * 2021-06-24 2021-09-10 南方电网数字电网研究院有限公司 一种基于电力的经济景气状态分析方法、系统及存储介质
CN114139517A (zh) * 2021-11-11 2022-03-04 浙江华东工程数字技术有限公司 一种基于章节标签自动组合报告的方法及系统
CN114169306A (zh) * 2021-12-13 2022-03-11 平安养老保险股份有限公司 一种生成电子回执单的方法、装置、设备及可读存储介质
CN114255841A (zh) * 2021-12-17 2022-03-29 杭州太美星程医药科技有限公司 一种报告导出方法、装置及电子设备
CN114357961A (zh) * 2021-12-25 2022-04-15 上海瑞和工程咨询有限公司 一种项目可行性研究报告生成方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN110147541B (zh) 2023-08-25

Similar Documents

Publication Publication Date Title
CN110147541A (zh) 一种经济报告的生成方法及装置
US10824682B2 (en) Enhanced online user-interaction tracking and document rendition
US20210365500A1 (en) System and method for question-based content answering
US20200372066A1 (en) Content summarization leveraging systems and processes for key moment identification and extraction
US10936950B1 (en) Processing sequential interaction data
US10726624B2 (en) Automatic creation of drill paths
CN117609444B (zh) 一种基于大模型的搜索问答方法
CN110717008B (zh) 基于语意识别的搜索结果排序方法及相关装置
US10324966B2 (en) Search by example
CN114218951B (zh) 实体识别模型的训练方法、实体识别方法及装置
US10324589B2 (en) Navigation by usage locations in a document editing application
CN106610928A (zh) 一种文档对象模型及电子病历编辑器
CN109542299A (zh) 用于电子书的金句展示方法、电子设备及计算机存储介质
CN111858953B (zh) 用于智慧城市少样本数据建模的实体关系表示方法及系统
JP6605683B1 (ja) 見積方法、課金方法、コンピュータ、及びプログラム
US10146400B2 (en) Icon-based user interfaces
CN110377907A (zh) 一种招聘信息标准化方法及装置
US20240346254A1 (en) Natural language training and/or augmentation with large language models
Svensgård The Enhancement Effect of LangChain on Long Text Summarization
US11734502B1 (en) Systems and methods to maintain amends to an annotation as discrete chronological events
Zhong Plunger Style Optimization by Machine Learning
CN111737409B (zh) 辅助系统及存储介质
Gopal Computer technique simplifies decline-curve analysis
Beninger et al. Estimating decline curves with confidence
Frattallone-Llado et al. Using Multimodal Data to Improve Precision of Inpatient Event Timelines

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190904

Address after: Room 630, 6th floor, Block A, Wanliu Xingui Building, 28 Wanquanzhuang Road, Haidian District, Beijing

Applicant after: DINFO (BEIJING) SCIENCE DEVELOPMENT Co.,Ltd.

Address before: Room 601, Block A, Wanliu Xingui Building, 28 Wanquanzhuang Road, Haidian District, Beijing

Applicant before: ULTRAPOWER SOFTWARE Co.,Ltd.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: 230000 zone B, 19th floor, building A1, 3333 Xiyou Road, hi tech Zone, Hefei City, Anhui Province

Applicant after: Dingfu Intelligent Technology Co.,Ltd.

Address before: Room 630, 6th floor, Block A, Wanliu Xingui Building, 28 Wanquanzhuang Road, Haidian District, Beijing

Applicant before: DINFO (BEIJING) SCIENCE DEVELOPMENT Co.,Ltd.

GR01 Patent grant
GR01 Patent grant