CN115688725A - 报告框架模板的生成方法、装置、电子设备及介质 - Google Patents

报告框架模板的生成方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN115688725A
CN115688725A CN202210533230.9A CN202210533230A CN115688725A CN 115688725 A CN115688725 A CN 115688725A CN 202210533230 A CN202210533230 A CN 202210533230A CN 115688725 A CN115688725 A CN 115688725A
Authority
CN
China
Prior art keywords
topic
type
preset
report
paragraph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210533230.9A
Other languages
English (en)
Inventor
郭梦伊
胡屹
周迪雯
高兰天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202210533230.9A priority Critical patent/CN115688725A/zh
Publication of CN115688725A publication Critical patent/CN115688725A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本公开提供一种报告框架模板的生成方法、装置、电子设备及介质,涉及人工智能及金融科技领域。该方法包括:获取多篇标准报告,将多篇标准报告按照预设的读者类型进行分类;识别每篇标准报告中的各个段落主题;根据各个段落主题,计算每篇标准报告下的每种预设主题类型的主题占比;计算属于同一种读者类型的至少一篇标准报告的总体主题占比;对总体主题占比进行调整,确定每种读者类型下的总体主题占比参考区间;按照读者类型和预设主题类型,配置对应的关注事项和框架指标体系;获取用户输入的报告框架要素;将分别对应报告框架要素的框架指标体系、关注事项和总体主题占比参考区间进行组装,生成报告框架模板。

Description

报告框架模板的生成方法、装置、电子设备及介质
技术领域
本公开涉及人工智能及金融科技领域,具体涉及一种报告框架模板的生成方法、装置、设备、介质和程序产品。
背景技术
在企业生产经营过程中,需要面向不同的干系人来编写各种报告,例如项目计划、成果总结、经营分析等。有的报告需要按照预先设定的模板进行编写,用户只需在模板的指定位置来填写相应内容即可。但有的报告有相似的行文逻辑,但没有严格的格式或提纲要求,因此对于此类报告,难以通过预先定义标准模板的方式来提升报告编写的效率。此外,由于没有标准模板,也难以保障报告的质量。
发明内容
鉴于上述问题,本公开提供一种可提升报告编写效率的报告框架模板的生成方法、装置、设备、介质和程序产品。
根据本公开的第一个方面,提供了一种报告框架模板的生成方法,包括:获取多篇标准报告,将多篇标准报告按照预设的读者类型进行分类,其中,标准报告为已发布的研究报告,读者类型为多种;识别每篇标准报告中的各个段落主题,其中,每个段落主题包含至少一种预设主题类型;根据各个段落主题,计算每篇标准报告下的每种预设主题类型的主题占比;根据每篇标准报告下的每种预设主题类型的主题占比,计算属于同一种读者类型的至少一篇标准报告的总体主题占比;对总体主题占比进行调整,确定每种读者类型下的总体主题占比参考区间;按照读者类型和预设主题类型,配置对应的关注事项和框架指标体系,其中,框架指标体系与预设的至少一个指标类型相匹配,指标类型表征框架指标体系描述的主体;获取用户输入的报告框架要素,报告框架要素包括目标读者类型和目标指标类型;以及将分别对应报告框架要素的框架指标体系、关注事项和总体主题占比参考区间进行组装,生成报告框架模板。
根据本公开的实施例,识别各个段落主题,具体包括针对每篇标准报告的任意一个段落,执行以下操作:对该段落进行分词处理,得到多个单词;使用词袋模型将每个单词转换为词向量;使用TF-IDF算法对每个词向量进行计算,提取该段落对应的至少一种预设主题类型,计算每种预设主题类型在该段落的词频比例;以及根据每种预设主题类型及其词频比例,确定该段落的主题。
根据本公开的实施例,在该段落对应的预设主题类型为多种时,根据每种预设主题类型及其词频比例,确定该段落的主题,具体包括:判断是否存在一个预设主题类型的词频比例大于或者等于预设比例阈值,如果是,则将该预设主题类型确定为该段落的主题;否则,将每种预设主题类型按照词频比例进行分配,得到该段落的主题。
根据本公开的实施例,使用TF-IDF算法对每个词向量进行计算的步骤之后,还包括以下中的任意一种:若提取到该段落对应的预设主题类型为一种,则将提取的预设主题类型确定为该段落的主题;若未提取到该段落对应的预设主题类型,则将该段落的上一个段落的主题确定为该段落的主题;若一篇标准报告中的每个段落均未提取到对应的预设主题类型,则将该标准报告的各个段落主题设置为空。
根据本公开的实施例,预设主题类型包括第一主题类型,每篇标准报告下的第一主题类型的主题占比,根据以下公式计算得出:
Figure BDA0003640278030000021
其中,n为一篇标准报告的段落总个数,n为正整数;Ai为该篇标准报告的第i个段落的字数,1≤i≤n且i为整数;ai为第一主题类型在第i个段落的词频比例。
根据本公开的实施例,读者类型包括第一读者类型,预设主题类型包括第二主题类型,根据每篇标准报告下的每种预设主题类型的主题占比,计算属于同一种读者类型的至少一篇标准报告的总体主题占比,具体包括:针对属于第一读者类型的至少一篇标准报告,对每篇标准报告下的第二主题类型的主题占比进行求和平均,得到属于第一读者类型的第二主题类型的总体主题占比。
根据本公开的实施例,属于第一读者类型的第二主题类型的总体主题占比根据以下公式计算得出:
Figure BDA0003640278030000031
其中,x为多篇标准报告中属于第一读者类型的标准报告篇数,x为正整数;C1,j为属于第一读者类型的第j篇标准报告下的第二主题类型的主题占比,1≤j≤n且j为整数。
根据本公开的实施例,对总体主题占比进行调整,确定每种读者类型下的总体主题占比参考区间,具体包括:根据预设变动比例,对属于第一读者类型的第二主题类型的总体主题占比的上限和/或下限进行变动,得到属于第一读者类型的第二主题类型的总体主题占比参考区间。
根据本公开的实施例,框架指标体系包括第一框架指标体系和第二框架指标体系,按照读者类型和预设主题类型,配置对应的框架指标体系,具体包括:按照不同的读者类型和每种读者类型下的不同预设主题类型,配置对应的第一框架指标体系,第一框架指标体系具有不同级别的标题框架;从至少一种预设主题类型中选取部分预设主题类型,按照预设的指标类型配置对应的第二框架指标体系,其中,指标类型表征第二框架指标体系描述的主体。
根据本公开的实施例,将分别对应报告框架要素的框架指标体系、关注事项和总体主题占比参考区间进行组装,生成报告框架模板,具体包括:根据目标读者类型,配置对应的第一框架指标体系和关注事项,确定目标读者类型下的总体主题占比参考区间;根据目标指标类型,配置对应的第二框架指标体系;将第一框架指标体系和第二框架指标体系进行组合,得到框架指标体系;以及
按照不同的预设主题类型依次列出框架指标体系、关注事项和总体主题占比参考区间,生成报告框架模板。
本公开的第二方面提供了一种报告框架模板的生成装置,包括:标准报告获取模块,用于获取多篇标准报告,将多篇标准报告按照预设的读者类型进行分类,其中,标准报告为已发布的研究报告,读者类型为多种;段落主题识别模块,用于识别每篇标准报告中的各个段落主题,其中,每个段落主题包含至少一种预设主题类型;主题占比计算模块,用于根据各个段落主题,计算每篇标准报告下的每种预设主题类型的主题占比;总体主题占比计算模块,用于根据每篇标准报告下的每种预设主题类型的主题占比,计算属于同一种读者类型的至少一篇标准报告的总体主题占比;参考区间确定模块,用于对总体主题占比进行调整,确定每种读者类型下的总体主题占比参考区间;关注事项配置模块,用于按照读者类型和预设主题类型,配置对应的关注事项和框架指标体系,其中,框架指标体系与预设的至少一个指标类型相匹配,指标类型表征框架指标体系描述的主体;用户输入模块,用于获取用户输入的报告框架要素,报告框架要素包括目标读者类型和目标指标类型;以及框架模板生成模块,用于将分别对应报告框架要素的框架指标体系、关注事项和总体主题占比参考区间进行组装,生成报告框架模板。
本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述报告框架模板的生成方法。
本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述报告框架模板的生成方法。
本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述报告框架模板的生成方法。
与现有技术相比,本公开提供的报告框架模板的生成方法及装置,至少具有以下有益效果:
(1)本公开通过人工智能和自动化手段生成报告框架模板,并可依照用户的个性化需求例如报告面向读者等因素来生成相应的报告框架,实现报告编写核心流程的自动化,从而提升报告的编写效率;
(2)本公开结合优秀报告格式和关注点,给出对于报告各主题段落篇幅参考建议并且罗列关注点,进一步提升报告的编写质量和效率。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的适于报告框架模板的生成方法及装置的应用场景;
图2示意性示出了根据本公开实施例的报告框架模板的生成方法的流程图;
图3示意性示出了根据本公开实施例的各个段落主题的识别过程的流程图;
图4示意性示出了根据本公开实施例的段落主题的确定过程的流程图;
图5示意性示出了根据本公开实施例的段落主题类型的提取过程的流程图;
图6示意性示出了根据本公开实施例的总体主题占比的计算过程的流程图;
图7示意性示出了根据本公开实施例的总体主题占比参考区间的确定过程的流程图;
图8示意性示出了根据本公开实施例的框架指标体系的配置过程的流程图;
图9示意性示出了根据本公开实施例的报告框架模板的生成过程的流程图;
图10示意性示出了根据本公开实施例的报告框架模板的生成装置的方框图;
图11示意性示出了根据本公开实施例的适于实现报告框架模板的生成方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。
在本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
在本公开的技术方案中,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
本公开的实施例提供一种报告框架模板的生成方法、装置、设备、存储介质和程序产品,涉及人工智能及金融科技领域。该方法包括:获取多篇标准报告,将多篇标准报告按照预设的读者类型进行分类,其中,标准报告为已发布的研究报告,读者类型为多种;识别每篇标准报告中的各个段落主题,其中,每个段落主题包含至少一种预设主题类型;根据各个段落主题,计算每篇标准报告下的每种预设主题类型的主题占比;根据每篇标准报告下的每种预设主题类型的主题占比,计算属于同一种读者类型的至少一篇标准报告的总体主题占比;对总体主题占比进行调整,确定每种读者类型下的总体主题占比参考区间;按照读者类型和预设主题类型,配置对应的关注事项和框架指标体系,其中,框架指标体系与预设的至少一个指标类型相匹配,指标类型表征框架指标体系描述的主体;获取用户输入的报告框架要素,报告框架要素包括目标读者类型和目标指标类型;以及将分别对应报告框架要素的框架指标体系、关注事项和总体主题占比参考区间进行组装,生成报告框架模板。
在详细描述本公开的具体实施例之前,首先对技术术语进行阐释,以便于更好地理解本公开。
词频-逆文档频次算法(Term Frequency-Inverse Document Frequency,TF-IDF):一种基于统计的计算方法,常用于评估一个文档集中一个词对某份文档的重要程度。一个词对文档越重要,那就越可能是文档的关键词,常将TF-IDF算法用于关键词提取中。
词袋模型(Bag-of-Words Model,简称BOW):是一种在自然语言处理和信息检索(IR)下被简化的表达模型,通过词袋模型进行单词的向量化表示。
图1示意性示出了根据本公开实施例的适于报告框架模板的生成方法及装置的应用场景100。需要注意的是,图1所示仅为可以应用本公开实施例的应用场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的应用场景100可以包括终端设备101、102、103、网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的报告框架模板的生成方法一般可以由服务器105执行。相应地,本公开实施例所提供的报告框架模板的生成装置一般可以设置于服务器105中。本公开实施例所提供的报告框架模板的生成方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的报告框架模板的生成装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
以下将基于图1描述的应用场景,通过图2~图9对本公开实施例的报告框架模板的生成方法进行详细描述。
图2示意性示出了根据本公开实施例的报告框架模板的生成方法的流程图。
如图2所示,该实施例的报告框架模板的生成方法可以包括操作S210~操作S280。
在操作S210,获取多篇标准报告,将多篇标准报告按照预设的读者类型进行分类,其中,标准报告为已发布的研究报告,读者类型为多种。
具体地,针对银行行业,标准报告例如可以为银行行业内已发布的研究报告,可以从互联网或局域网下载文本导入进来,并按照预设的读者类型进行分类存储。每种读者类型表征每篇标准报告面向的受众或者审阅者,在获取标准报告的同时自行录入,作为必选项,单选。该读者类型例如可以包括总行业务人员、总行科技人员和分行业务人员。
在操作S220,识别每篇标准报告中的各个段落主题,其中,每个段落主题包含至少一种预设主题类型。
段落主题是指该段落的文字表述的主要内容,每个段落主题包含至少一种预设主题类型。具体地,预设主题类型例如可以包括总体情况、细化情况、原因分析、政策导向和工作计划。
在操作S230,根据各个段落主题,计算每篇标准报告下的每种预设主题类型的主题占比。
在操作S240,根据每篇标准报告下的每种预设主题类型的主题占比,计算属于同一种读者类型的至少一篇标准报告的总体主题占比。
在操作S250,对总体主题占比进行调整,确定每种读者类型下的总体主题占比参考区间。
在操作S260,按照读者类型和预设主题类型,配置对应的关注事项和框架指标体系,其中,框架指标体系与预设的至少一个指标类型相匹配,指标类型表征框架指标体系描述的主体。
在操作S270,获取用户输入的报告框架要素,报告框架要素包括目标读者类型和目标指标类型。
在操作S280,将分别对应报告框架要素的框架指标体系、关注事项和总体主题占比参考区间进行组装,生成报告框架模板。
通过本公开的实施例,实现通过人工智能和自动化手段生成报告框架模板,并依照报告面向的读者类型或者指标类型等因素个性化生成相应的报告框架,并提示关注事项,实现报告编写核心流程的自动化,从而提升报告的编写质量和效率。
图3示意性示出了根据本公开实施例的各个段落主题的识别过程的流程图。
如图3所示,本公开实施例中,上述操作S220中的识别各个段落主题,具体可以包括针对每篇标准报告的任意一个段落,执行以下操作S2201~操作S2204。
在操作S2201,对该段落进行分词处理,得到多个单词。
分词处理例如可以通过机器学习算法来实现,该机器学习算法为现有技术,本公开不再赘述。
在操作S2202,使用词袋模型将每个单词转换为词向量。
由此,通过词袋模型进行单词的向量化表示。
在操作S2203,使用TF-IDF算法对每个词向量进行计算,提取该段落对应的至少一种预设主题类型,计算每种预设主题类型在该段落的词频比例。
其中,在使用TF-IDF算法时,利用现有文本库与文本规则作为语料库,基于词向量进行预设主题类型的提取。在提取该段落对应的预设主题类型为多种时,则分别提取每一种预设主题类型的词频,生成词频向量,计算每个词频向量的比例,也即得出每种预设主题类型在该段落的词频比例。
在操作S2204,根据每种预设主题类型及其词频比例,确定该段落的主题。
在提取出对应的预设主题类型,结合计算得出的每种预设主题类型的词频比例,可以确定该段落的主题。由此,对于任意一篇标准报告的各个段落,均可以确定其段落主题。
图4示意性示出了根据本公开实施例的段落主题的确定过程的流程图。
如图4所示,本公开实施例中,在上述操作S2203中该段落对应的预设主题类型为多种时,上述操作S2204中的根据每种预设主题类型及其词频比例,确定该段落的主题,具体可以包括以下操作S22041。
在操作S22041,判断是否存在一个预设主题类型的词频比例大于或者等于预设比例阈值,如果是,则将该预设主题类型确定为该段落的主题;否则,将每种预设主题类型按照词频比例进行分配,得到该段落的主题。
该预设比例阈值可以根据实际需要进行设置,具体本公开不做限制。为了便于说明,在提取的该段落对应的预设主题类型为多种时,该预设比例阈值例如可以设置为0.6,则当存在一个预设主题类型的词频比例大于或者等于0.6时,该段落的主题确定为该预设主题类型。否则,当所有的预设主题类型的词频比例均小于0.6时,则该段落的主题按照词频比例进行分配,
例如,提取出的第一段落对应的预设主题类型包括总体情况、细化情况和原因分析这三种,三者的词频比例为3∶1∶1,由于总体情况的词频比例满足大于或者等于预设比例阈值,可以确定第一段落的主题为总体情况。又例如,提取出的第二段落对应的预设主题类型包括总体情况、细化情况和原因分析这三种,三者的词频比例为1∶1∶1,由于所有的预设主题类型的词频比例均小于0.6,可以确定第二段落的主题为1/3总体情况、1/3细化情况和1/3原因分析。
图5示意性示出了根据本公开实施例的段落主题类型的提取过程的流程图。
如图5所示,进一步地,在上述操作S2203中的使用TF-IDF算法对每个词向量进行计算的步骤之后,还可以包括以下操作S22031~操作S22033中的任意一种。
在操作S22031,若提取到该段落对应的预设主题类型为一种,则将提取的预设主题类型确定为该段落的主题。
例如,提取到第三段落对应唯一的一种预设主题类型“总体情况”,则第三段落的主题可以确定为“总体情况”。
在操作S22032,若未提取到该段落对应的预设主题类型,则将该段落的上一个段落的主题确定为该段落的主题。
例如,未提取到第四段落对应的任意一种预设主题类型,则将该段落的上一个段落,也即第三段落的主题确定为第四段落的主题。
在操作S22033,若一篇标准报告中的每个段落均未提取到对应的预设主题类型,则将该标准报告的各个段落主题设置为空。
例如,针对某一篇标准报告,未提取到所有段落的预设主题类型,则将该篇标准报告的各个段落主题设置为空。
本公开实施例中,预设主题类型可以包括第一主题类型,上述操作S230中的每篇标准报告下的第一主题类型的主题占比可以根据以下公式计算得出:
Figure BDA0003640278030000121
其中,n为一篇标准报告的段落总个数,n为正整数;Ai为该篇标准报告的第i个段落的字数,1≤i≤n且i为整数;ai为第一主题类型在第i个段落的词频比例。
由此可见,针对一篇并非所有的段落主题均为空的标准报告,每篇标准报告下的每种预设主题类型的主题占比,实质上是指每种预设主题类型在该篇标准报告中的各个段落对应的文字数占全篇标准报告总字数的比例。
具体来说,假设某一篇标准报告有n个段落,段落的字数依次为A1、A2、……、An,在每个段落对应的预设主题类型中,总体情况定义为B1,细化情况定义为B2,原因分析定义为B3,政策导向定义为B4,工作计划定义为B5。ai、bi、ci、di、ei依次为预设主题类型B1到B5在第i个段落的词频比例,i为段落序号,i=1,2,……,n。
表1一篇标准报告的各个段落对应的预设主题类型和词频比例
Figure BDA0003640278030000122
由此,各个段落的主题可依次定义为(a1B1,b1B2,c1B3,d1B4,e1B5)、(a2B1,b2B2,c2B3,d2B4,e2B5),……,(anB1,bnB2,CnB3,dnB4,enB5)。对于每一个段落,各种预设主题类型的词频比例的总和为1,也即满足以下公式:
ai+bi+ci+di+ei=1,i=1,2,…,n
因此,若第一主题类型为总体情况B1,则该篇标准报告下的总体情况B1的主题占比为:
Figure BDA0003640278030000131
同理可得,在该篇标准报告下,预设主题类型分别为细化情况B2、原因分析B3、政策导向B4、工作计划B5的主题占比依次为:
Figure BDA0003640278030000132
图6示意性示出了根据本公开实施例的总体主题占比的计算过程的流程图。
如图6所示,本公开实施例中,读者类型包括第一读者类型,预设主题类型包括第二主题类型,上述操作S240中的根据每篇标准报告下的每种预设主题类型的主题占比,计算属于同一种读者类型的至少一篇标准报告的总体主题占比,具体可以包括以下操作S2401。
在操作S2401,针对属于第一读者类型的至少一篇标准报告,对每篇标准报告下的第二主题类型的主题占比进行求和平均,得到属于第一读者类型的第二主题类型的总体主题占比。
进一步地,属于第一读者类型的第二主题类型的总体主题占比根据以下公式计算得出:
Figure BDA0003640278030000133
其中,x为多篇标准报告中属于第一读者类型的标准报告篇数,x为正整数;C1,j为属于第一读者类型的第j篇标准报告下的第二主题类型的主题占比,1≤j≤n且j为整数。
具体来说,以第一读者类型为总行业务人员,第二主题类型为总体情况B1为例,在上述操作S210中获取的多篇标准报告中,有x篇读者类型均为总行业务人员的标准报告,其中,针对这x篇标准报告中的每一篇,如果总体情况B1的主题占比依次为C1,1、C1,2、……、C1,x,则对于读者类型为总行业务人员的x篇标准报告,总体情况B1的总体主题占比可以表示为:
Figure BDA0003640278030000141
同理可得,在这x篇标准报告中的每一篇,假设细化情况B2的主题占比依次为D1,1、D1,2、……、D1,x,原因分析B3的主题占比依次为E1,1、E1,2、……、E1,x,政策导向B4的主题占比依次为F1,1、F1,2、……、F1,x,工作计划B5的主题占比依次为G1,1、G1,2、……、G1,x,则对于读者类型为总行业务人员的x篇标准报告,细化情况B2、原因分析B3、政策导向B4、工作计划B5的总体主题占比可以依次表示为:
Figure BDA0003640278030000142
类似地,假设在获取的多篇标准报告中,有y篇读者类型均为总行科技人员的标准报告,其中,针对这y篇标准报告中的每一篇,如果总体情况B1的主题占比依次为C2,1、C2,2、……、C2,y,细化情况B2的主题占比依次为D2,1、D2,2、……、D2,y,原因分析B3的主题占比依次为E2,1、E2,2、……、E2,y,政策导向B4的主题占比依次为F2,1、F2,2、……、F2,y,工作计划B5的主题占比依次为G2,1、G2,2、……、G2,y,则对于读者类型为总行科技人员的y篇标准报告,总体情况B1、细化情况B2、原因分析B3、政策导向B4、工作计划B5的总体主题占比可以依次表示为:
Figure BDA0003640278030000143
同理可得,假设在获取的多篇标准报告中,有z篇读者类型均为分行业务人员的标准报告,其中,针对这z篇标准报告中的每一篇,如果总体情况B1的主题占比依次为C3,1、C3,2、……、C3,z,细化情况B2的主题占比依次为D3,1、D3,2、……、D3,z,原因分析B3的主题占比依次为E3,1、E3,2、……、E3,z,政策导向B4的主题占比依次为F3,1、F3,2、……、F3,z,工作计划B5的主题占比依次为G3,1、G3,2、……、G3,z,则对于读者类型为分行业务人员的z篇标准报告,总体情况B1、细化情况B2、原因分析B3、政策导向B4、工作计划B5的总体主题占比可以依次表示为:
Figure BDA0003640278030000151
图7示意性示出了根据本公开实施例的总体主题占比参考区间的确定过程的流程图。
如图7所示,本公开实施例中,上述操作S250中的对总体主题占比进行调整,确定每种读者类型下的总体主题占比参考区间,具体可以包括以下操作S2501。
在操作S2501,根据预设变动比例,对属于第一读者类型的第二主题类型的总体主题占比的上限和/或下限进行变动,得到属于第一读者类型的第二主题类型的总体主题占比参考区间。
该预设变动比例可以根据实际需要进行设置,具体本公开不做限制。例如,以第一读者类型为总行业务人员,第二主题类型为总体情况B1为例,在计算得出的总行业务人员的读者类型下的总体情况B1的总体主题占比基础上,预设变动比例设置为5%,则上限占比可以增加5%,则下限占比可以减少5%,作为该的读者类型下的总体情况B1的总体主题占比参考区间,该参考区间可以表示为:
Figure BDA0003640278030000152
进一步地,为了区分上下限的不同变动情况,该预设变动比例可以包括上限变动比例和下限变动比例,分别用于对该总体主题占比的上限和下限进行变动。该上限变动比例和下限变动比例的数值可以相同,也可以不同,具体本公开不做限定。
特别地,如果总体主题占比参考区间的下限计算低于0,则将下限取0;如果总体主题占比参考区间的上限计算高于1,则将上限取1。
上述操作S260中的关注事项,是指用户在编制此段落的主题时,对于文本的系列要求。按照读者类型和预设主题类型,配置对应的关注事项,也即:
按照不同的读者类型,配置不同的关注事项;和/或
按照同一种读者类型下的不同预设主题类型,配置不同的关注事项。
具体地,例如下表2所示,以读者类型为总行科技人员为例,在预设主题类型为总体情况时,配置的关注事项为“关注整体金融科技规划和业务规划的衔接”;在预设主题类型为细化情况时,配置的关注事项为“关注增量和存量的变化要剔除异常数据;对于有明确业务流程的按照流程法拆解指标”;在预设主题类型为原因分析时,配置的关注事项为“选择宏观、中观和微观三层分析”;在预设主题类型为政策导向时,不需要配置任何关注事项;在在预设主题类型为工作计划时,配置的关注事项为“区分业务计划和系统计划;明确业务职责和科技支持内容”。其他的读者类型和预设主题类型,对应配置的关注事项可参照下表2。
表2配置的关注事项
Figure BDA0003640278030000161
上述操作S260中的框架指标体系,是指报告输入要素和模板输出结果的对应关系。按照读者类型和预设主题类型,配置对应的框架指标体系,后续可按照用户输入选择,匹配对应的模板输出结果。
图8示意性示出了根据本公开实施例的框架指标体系的配置过程的流程图。
如图8所示,本公开实施例中,框架指标体系包括第一框架指标体系和第二框架指标体系,上述操作S260中的按照读者类型和预设主题类型,配置对应的框架指标体系,具体可以包括以下操作S2601~操作S2602。
在操作S2601,按照不同的读者类型和每种读者类型下的不同预设主题类型,配置对应的第一框架指标体系,第一框架指标体系具有不同级别的标题框架。
具体地,该第一框架指标体系例如下表3所示,可以看出,本公开实施例中,按照不同的读者类型,配置不同的第一框架指标体系;和/或,按照同一种读者类型下的不同预设主题类型,配置不同的第一框架指标体系,第一框架指标体系具体可以包括一级标题框架和二级标题框架。
表3配置的第一框架指标体系
Figure BDA0003640278030000171
在操作S2602,从至少一种预设主题类型中选取部分预设主题类型,按照预设的指标类型配置对应的第二框架指标体系,其中,指标类型表征第二框架指标体系描述的主体。
具体地,指标类型可以包括产品、客户和合作方,该第二框架指标体系例如下表4所示,可以看出,选取的部分预设主题类型为总体情况和细化情况,对该部分预设主题类型,分别按照产品、客户和合作方,配置不同的第二框架指标体系,第二框架指标体系具体可以包括前述第一框架指标体系中的二级标题框架下的三级标题框架。
表4配置的第二框架指标体系
Figure BDA0003640278030000181
需要说明的是,上述操作S2601和操作S2602没有具体的先后顺序,两者可以同时进行,或者任意一个可以先进行而另一个随后进行。
上述操作S270中的报告框架要素,是指由用户在前端输入的内容,包括目标读者类型和目标指标类型,该目标读者类型为前述预设的多种读者类型中的任意一种,作为必选项,例如可以包括总行业务人员、总行科技人员或分行业务人员中的一个。该目标指标类型为前述预设的指标类型中的任意一个或多个,作为必选项,例如可以包括产品、客户和合作方中的至少一个。
图9示意性示出了根据本公开实施例的报告框架模板的生成过程的流程图。
如图9所示,本公开实施例中,上述操作S280中的将分别对应报告框架要素的框架指标体系、关注事项和总体主题占比参考区间进行组装,生成报告框架模板,具体可以包括以下操作S2801~操作S2804。
在操作S2801,根据目标读者类型,配置对应的第一框架指标体系和关注事项,确定目标读者类型下的总体主题占比参考区间。
在操作S2802,根据目标指标类型,配置对应的第二框架指标体系。
在操作S2803,将第一框架指标体系和第二框架指标体系进行组合,得到框架指标体系。
在操作S2804,按照不同的预设主题类型依次列出框架指标体系、关注事项和总体主题占比参考区间,生成报告框架模板。
例如,用户选择输入的目标读者类型为总行科技人员,目标指标类型为客户和产品,依照上述步骤,可生成的报告框架模板为下表5所示。
表5生成的报告框架
Figure BDA0003640278030000191
Figure BDA0003640278030000201
通过本公开的实施例,通过人工智能和自动化手段生成报告框架模板,并依照用户的个性化需求生成相应的报告框架,实现报告编写核心流程的自动化,同时,结合优秀报告格式和关注点,给出对于报告各主题段落篇幅参考建议和关注点罗列,从而提升报告的编写质量和效率。
基于上述报告框架模板的生成方法,本公开还提供了一种报告框架模板的生成装置,以下将结合图10对该装置进行详细描述。
图10示意性示出了根据本公开实施例的报告框架模板的生成装置的方框图。
如图10所示,该实施例的报告框架模板的生成装置1000包括标准报告获取模块1010、段落主题识别模块1020、主题占比计算模块1030、总体主题占比计算模块1040、参考区间确定模块1050、关注事项配置模块1060、用户输入模块1070和框架模板生成模块1080。
标准报告获取模块1010,用于获取多篇标准报告,将多篇标准报告按照预设的读者类型进行分类,其中,标准报告为已发布的研究报告,读者类型为多种。在一实施例中,标准报告获取模块1010可以用于执行前文描述的操作S210,在此不再赘述。
段落主题识别模块1020,用于识别每篇标准报告中的各个段落主题,其中,每个段落主题包含至少一种预设主题类型。在一实施例中,段落主题识别模块1020可以用于执行前文描述的操作S220,在此不再赘述。
主题占比计算模块1030,用于根据各个段落主题,计算每篇标准报告下的每种预设主题类型的主题占比。在一实施例中,主题占比计算模块1030可以用于执行前文描述的操作S230,在此不再赘述。
总体主题占比计算模块1040,用于根据每篇标准报告下的每种预设主题类型的主题占比,计算属于同一种读者类型的至少一篇标准报告的总体主题占比。在一实施例中,总体主题占比计算模块1040可以用于执行前文描述的操作S240,在此不再赘述。
参考区间确定模块1050,用于对总体主题占比进行调整,确定每种读者类型下的总体主题占比参考区间。在一实施例中,参考区间确定模块1050可以用于执行前文描述的操作S250,在此不再赘述。
关注事项配置模块1060,用于按照读者类型和预设主题类型,配置对应的关注事项和框架指标体系,其中,框架指标体系与预设的至少一个指标类型相匹配,指标类型表征框架指标体系描述的主体。在一实施例中,关注事项配置模块1060可以用于执行前文描述的操作S260,在此不再赘述。
用户输入模块1070,用于获取用户输入的报告框架要素,报告框架要素包括目标读者类型和目标指标类型。在一实施例中,用户输入模块1070可以用于执行前文描述的操作S270,在此不再赘述。
框架模板生成模块1080,用于将分别对应报告框架要素的框架指标体系、关注事项和总体主题占比参考区间进行组装,生成报告框架模板。在一实施例中,框架模板生成模块1080可以用于执行前文描述的操作S280,在此不再赘述。
通过本公开的实施例,实现通过人工智能和自动化手段生成报告框架模板,并依照报告面向的读者类型或者指标类型等因素个性化生成相应的报告框架,并提示关注事项,实现报告编写核心流程的自动化,从而提升报告的编写质量和效率。
根据本公开的实施例,标准报告获取模块1010、段落主题识别模块1020、主题占比计算模块1030、总体主题占比计算模块1040、参考区间确定模块1050、关注事项配置模块1060、用户输入模块1070和框架模板生成模块1080中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,标准报告获取模块1010、段落主题识别模块1020、主题占比计算模块1030、总体主题占比计算模块1040、参考区间确定模块1050、关注事项配置模块1060、用户输入模块1070和框架模板生成模块1080中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,标准报告获取模块1010、段落主题识别模块1020、主题占比计算模块1030、总体主题占比计算模块1040、参考区间确定模块1050、关注事项配置模块1060、用户输入模块1070和框架模板生成模块1080中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图11示意性示出了根据本公开实施例的适于实现报告框架模板的生成方法的电子设备的方框图。
如图11所示,根据本公开实施例的电子设备1100包括处理器1101,其可以根据存储在只读存储器(ROM)1102中的程序或者从存储部分1108加载到随机访问存储器(RAM)1103中的程序而执行各种适当的动作和处理。处理器1101例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器1101还可以包括用于缓存用途的板载存储器。处理器1101可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 1103中,存储有电子设备1100操作所需的各种程序和数据。处理器1101、ROM 1102以及RAM 1103通过总线1104彼此相连。处理器1101通过执行ROM 1102和/或RAM1103中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM1102和RAM 1103以外的一个或多个存储器中。处理器1101也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备1100还可以包括输入/输出(I/O)接口1105,输入/输出(I/O)接口1105也连接至总线1104。电子设备1100还可以包括连接至I/O接口1105的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1106;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107;包括硬盘等的存储部分1108;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至I/O接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入存储部分1108。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的报告框架模板的生成方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 1102和/或RAM 1103和/或ROM 1102和RAM 1103以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的报告框架模板的生成方法。
在该计算机程序被处理器1101执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分1109被下载和安装,和/或从可拆卸介质1111被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可拆卸介质1111被安装。在该计算机程序被处理器1101执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (14)

1.一种报告框架模板的生成方法,其特征在于,包括:
获取多篇标准报告,将所述多篇标准报告按照预设的读者类型进行分类,其中,所述标准报告为已发布的研究报告,所述读者类型为多种;
识别每篇标准报告中的各个段落主题,其中,每个所述段落主题包含至少一种预设主题类型;
根据所述各个段落主题,计算每篇所述标准报告下的每种预设主题类型的主题占比;
根据每篇所述标准报告下的每种预设主题类型的主题占比,计算属于同一种所述读者类型的至少一篇标准报告的总体主题占比;
对所述总体主题占比进行调整,确定每种所述读者类型下的总体主题占比参考区间;
按照读者类型和预设主题类型,配置对应的关注事项和框架指标体系,其中,所述框架指标体系与预设的至少一个指标类型相匹配,所述指标类型表征所述框架指标体系描述的主体;
获取用户输入的报告框架要素,所述报告框架要素包括目标读者类型和目标指标类型;以及
将分别对应所述报告框架要素的框架指标体系、关注事项和总体主题占比参考区间进行组装,生成报告框架模板。
2.根据权利要求1所述的方法,其特征在于,所述识别各个段落主题,具体包括针对每篇所述标准报告的任意一个段落,执行以下操作:
对该段落进行分词处理,得到多个单词;
使用词袋模型将每个所述单词转换为词向量;
使用TF-IDF算法对每个所述词向量进行计算,提取该段落对应的至少一种预设主题类型,计算每种预设主题类型在该段落的词频比例;以及
根据每种所述预设主题类型及其词频比例,确定该段落的主题。
3.根据权利要求2所述的方法,其特征在于,在该段落对应的预设主题类型为多种时,所述根据每种所述预设主题类型及其词频比例,确定该段落的主题,具体包括:
判断是否存在一个预设主题类型的词频比例大于或者等于预设比例阈值,如果是,则将该预设主题类型确定为该段落的主题;否则,将每种所述预设主题类型按照词频比例进行分配,得到该段落的主题。
4.根据权利要求2所述的方法,其特征在于,所述使用TF-IDF算法对每个所述词向量进行计算的步骤之后,还包括以下中的任意一种:
若提取到该段落对应的预设主题类型为一种,则将提取的预设主题类型确定为该段落的主题;
若未提取到该段落对应的预设主题类型,则将该段落的上一个段落的主题确定为该段落的主题;
若一篇标准报告中的每个段落均未提取到对应的预设主题类型,则将该标准报告的各个段落主题设置为空。
5.根据权利要求2所述的方法,其特征在于,所述预设主题类型包括第一主题类型,所述每篇所述标准报告下的第一主题类型的主题占比,根据以下公式计算得出:
Figure FDA0003640278020000021
其中,n为一篇标准报告的段落总个数,n为正整数;Ai为该篇标准报告的第i个段落的字数,1≤i≤n且i为整数;ai为第一主题类型在第i个段落的词频比例。
6.根据权利要求1所述的方法,其特征在于,所述读者类型包括第一读者类型,所述预设主题类型包括第二主题类型,所述根据每篇所述标准报告下的每种预设主题类型的主题占比,计算属于同一种所述读者类型的至少一篇标准报告的总体主题占比,具体包括:
针对属于第一读者类型的至少一篇标准报告,对每篇标准报告下的第二主题类型的主题占比进行求和平均,得到属于第一读者类型的第二主题类型的总体主题占比。
7.根据权利要求6所述的方法,其特征在于,所述属于第一读者类型的第二主题类型的总体主题占比根据以下公式计算得出:
Figure FDA0003640278020000031
其中,x为多篇标准报告中属于第一读者类型的标准报告篇数,x为正整数;C1,j为属于第一读者类型的第j篇标准报告下的第二主题类型的主题占比,1≤j≤n且j为整数。
8.根据权利要求6所述的方法,其特征在于,所述对所述总体主题占比进行调整,确定每种所述读者类型下的总体主题占比参考区间,具体包括:
根据预设变动比例,对所述属于第一读者类型的第二主题类型的总体主题占比的上限和/或下限进行变动,得到属于第一读者类型的第二主题类型的总体主题占比参考区间。
9.根据权利要求1所述的方法,其特征在于,所述框架指标体系包括第一框架指标体系和第二框架指标体系,所述按照读者类型和预设主题类型,配置对应的框架指标体系,具体包括:
按照不同的读者类型和每种读者类型下的不同预设主题类型,配置对应的第一框架指标体系,所述第一框架指标体系具有不同级别的标题框架;
从所述至少一种预设主题类型中选取部分预设主题类型,按照预设的指标类型配置对应的第二框架指标体系,其中,所述指标类型表征所述第二框架指标体系描述的主体。
10.根据权利要求9所述的方法,其特征在于,所述将分别对应所述报告框架要素的框架指标体系、关注事项和总体主题占比参考区间进行组装,生成报告框架模板,具体包括:
根据所述目标读者类型,配置对应的第一框架指标体系和关注事项,确定所述目标读者类型下的总体主题占比参考区间;
根据所述目标指标类型,配置对应的第二框架指标体系;
将所述第一框架指标体系和第二框架指标体系进行组合,得到所述框架指标体系;以及
按照不同的预设主题类型依次列出框架指标体系、关注事项和总体主题占比参考区间,生成所述报告框架模板。
11.一种报告框架模板的生成装置,其特征在于,包括:
标准报告获取模块,用于获取多篇标准报告,将所述多篇标准报告按照预设的读者类型进行分类,其中,所述标准报告为已发布的研究报告,所述读者类型为多种;
段落主题识别模块,用于识别每篇标准报告中的各个段落主题,其中,每个所述段落主题包含至少一种预设主题类型;
主题占比计算模块,用于根据所述各个段落主题,计算每篇所述标准报告下的每种预设主题类型的主题占比;
总体主题占比计算模块,用于根据每篇所述标准报告下的每种预设主题类型的主题占比,计算属于同一种所述读者类型的至少一篇标准报告的总体主题占比;
参考区间确定模块,用于对所述总体主题占比进行调整,确定每种所述读者类型下的总体主题占比参考区间;
关注事项配置模块,用于按照读者类型和预设主题类型,配置对应的关注事项和框架指标体系,其中,所述框架指标体系与预设的至少一个指标类型相匹配,所述指标类型表征所述框架指标体系描述的主体;
用户输入模块,用于获取用户输入的报告框架要素,所述报告框架要素包括目标读者类型和目标指标类型;以及
框架模板生成模块,用于将分别对应所述报告框架要素的框架指标体系、关注事项和总体主题占比参考区间进行组装,生成报告框架模板。
12.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~10中任一项所述的方法。
13.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~10中任一项所述的方法。
14.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~10中任一项所述的方法。
CN202210533230.9A 2022-05-12 2022-05-12 报告框架模板的生成方法、装置、电子设备及介质 Pending CN115688725A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210533230.9A CN115688725A (zh) 2022-05-12 2022-05-12 报告框架模板的生成方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210533230.9A CN115688725A (zh) 2022-05-12 2022-05-12 报告框架模板的生成方法、装置、电子设备及介质

Publications (1)

Publication Number Publication Date
CN115688725A true CN115688725A (zh) 2023-02-03

Family

ID=85060239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210533230.9A Pending CN115688725A (zh) 2022-05-12 2022-05-12 报告框架模板的生成方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN115688725A (zh)

Similar Documents

Publication Publication Date Title
US11599714B2 (en) Methods and systems for modeling complex taxonomies with natural language understanding
CN109522483B (zh) 用于推送信息的方法和装置
US9268766B2 (en) Phrase-based data classification system
CN109325121B (zh) 用于确定文本的关键词的方法和装置
US11194963B1 (en) Auditing citations in a textual document
US11681876B2 (en) Cascaded fact-based summarization
CN110059172B (zh) 基于自然语言理解的推荐答案的方法和装置
CN112017062A (zh) 基于客群细分的资源额度分配方法、装置及电子设备
CN117150000B (zh) 一种投标书的生成方法、装置、设备及存储介质
CN113392200A (zh) 基于用户学习行为的推荐方法及装置
US20180239809A1 (en) Managing content creation of data sources
CN116756281A (zh) 知识问答方法、装置、设备和介质
CN111209403A (zh) 数据处理方法、装置、介质及电子设备
CN116048463A (zh) 基于标签管理的需求项内容智能推荐方法及装置
US11475211B1 (en) Elucidated natural language artifact recombination with contextual awareness
CN111459959B (zh) 用于更新事件集合的方法和装置
CN114493853A (zh) 信用等级评价方法、装置、电子设备及存储介质
CN114676694A (zh) 业务模型的生成方法、装置、设备、介质和程序产品
CN109857838B (zh) 用于生成信息的方法和装置
CN115688725A (zh) 报告框架模板的生成方法、装置、电子设备及介质
CN113095078A (zh) 关联资产确定方法、装置和电子设备
CN113935334A (zh) 文本信息处理方法、装置、设备和介质
CN110879868A (zh) 顾问方案生成方法、装置、系统、电子设备及介质
CN113342998B (zh) 一种多媒体资源推荐方法、装置、电子设备及存储介质
CN117891531B (zh) 用于saas软件的系统参数配置方法、系统、介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination