CN116089570A - 报告生成方法、装置、系统及存储介质 - Google Patents

报告生成方法、装置、系统及存储介质 Download PDF

Info

Publication number
CN116089570A
CN116089570A CN202310362771.4A CN202310362771A CN116089570A CN 116089570 A CN116089570 A CN 116089570A CN 202310362771 A CN202310362771 A CN 202310362771A CN 116089570 A CN116089570 A CN 116089570A
Authority
CN
China
Prior art keywords
report
supplemented
content
user
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310362771.4A
Other languages
English (en)
Inventor
魏炜
陈玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Shenzhen Graduate School
Original Assignee
Peking University Shenzhen Graduate School
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Shenzhen Graduate School filed Critical Peking University Shenzhen Graduate School
Priority to CN202310362771.4A priority Critical patent/CN116089570A/zh
Publication of CN116089570A publication Critical patent/CN116089570A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)

Abstract

本发明属于计算机技术领域,提供了一种报告生成方法,包括:检测用户输入的报告内容中所包含的预设问句;将预设问句解析生成数据库查询语句;根据数据库查询语句从数据库中查询得到对应的待补充数据;将待补充数据转化为待补充内容后替换预设问句,并保留溯源信息;以及输出替换所有的预设问句后的报告内容,生成得到完整报告。本发明还提供了一种报告生成装置、系统与存储介质。本发明中,用户在撰写报告时,只需在需要查找补充资料的内容位置处插入预设问句即可得到待补充内容,无需人工查找整理资料,能够节省大量的前期准备时间,避免人为错漏出现,报告的撰写更为灵活自由,增加溯源功能以方便用户校对和确保数据准确度。

Description

报告生成方法、装置、系统及存储介质
技术领域
本发明属于计算机技术领域,尤其涉及一种报告生成方法、装置、系统及存储介质。
背景技术
目前的报告生成主要有以下两种方式:
一种方式是纯人工撰写,即报告撰写人通过前期大量阅读及收集有效信息后,人工撰写出一篇报告。此种方式需要耗费撰写人大量的时间精力成本在前期准备上。另外,在撰写过程中,因为是纯人工输出,所以出现错漏的几率较大,需要后期再次进行仔细校对以确保报告的高质量,进一步地提升了时间与精力成本。
另一种方式是借助素材库自动生成,即通过从一个预先构建好的句子素材库中选取素材,并拼接成段落篇章,从而自动生成报告。此种方式则存在可选择句式少、风格固定与上下文连贯性差等缺陷,所得到的报告质量难以保证,难以满足撰写人的实际需求。
发明内容
本发明实施例提供一种报告生成方法,旨在解决现有得到报告的方式的时间与精力成本较高、错漏几率大、质量难以保证的技术问题。
本发明实施例是这样实现的,一种报告生成方法,包括:
检测用户输入的报告内容中所包含的预设问句;
将所述预设问句解析生成数据库查询语句;
根据所述数据库查询语句从数据库中查询得到对应的待补充数据;
将所述待补充数据转化为待补充内容后替换所述预设问句,并保留溯源信息;以及
输出替换所有的所述预设问句后的所述报告内容,生成得到完整报告。
本发明还提供了一种报告生成装置,包括:
检测单元,用于检测用户输入的报告内容中所包含的预设问句;
解析单元,用于将所述预设问句解析生成数据库查询语句;
查询单元,用于根据所述数据库查询语句从数据库中查询得到对应的待补充数据;以及
替换单元,用于将所述待补充数据转化为待补充内容后替换所述预设问句,并保留溯源信息;
输出单元,用于输出替换所有的所述预设问句后的所述报告内容,生成得到完整报告。
本发明还提供了一种报告生成系统,包括:如上述所述的报告生成装置。
本发明还提供了一种存储介质,所述存储介质上存储有程序指令,所述程序指令被处理器执行时实现如上述任一项所述的报告生成方法的步骤。
本发明实施例的报告生成方法,用户在撰写报告时,只需在需要查找补充资料的内容位置处插入预设问句,即可通过数据库自动准确地查询得到相应的待补充内容,无需人工查找收集整理资料,使用户能够节省大量的前期准备时间,并尽量地避免人为错漏的出现,同时可以保留用户自身的写作风格,报告的撰写过程更为灵活自由,而不局限于句子素材库,输入预设问句即可批量自动生成若干篇报告,并且增加溯源功能以方便用户校对和确保数据准确度。
对于需要撰写周期性报告的用户来说,只需要保存一个已输出的报告作为模板,每次使用时修改时间周期,即可完成新的报告。对于需要经常撰写固定样式段落的用户来说,也可利用本发明的方法来制定规范的段落模版,在需要时调用段落即可,极大地节约了用户撰写报告的时间与精力,同时提升了报告的质量、准确性与速度。
附图说明
图1至图4为本发明实施例的报告生成方法的流程示意图;
图5为本发明实施例的报告生成方法的填充数据模型与填充文字模型的示例图;
图6为本发明实施例的报告生成装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本方案中,用户在撰写报告时,只需在需要查找补充资料的内容位置处插入预设问句,即可通过数据库自动准确地查询得到相应的待补充内容,无需人工查找收集整理资料,使用户能够节省大量的前期准备时间,并尽量地避免人为错漏的出现,保证报告质量,同时可以保留用户自身的写作风格,报告的撰写过程更为灵活自由,并且增加溯源功能以方便用户校对和确保数据准确度。
实施例一
请参阅图1,本发明的报告生成方法包括步骤:
S01:检测用户输入的报告内容中所包含的预设问句;
S02:将预设问句解析生成数据库查询语句;
S03:根据数据库查询语句从数据库中查询得到对应的待补充数据;
S04:将待补充数据转化为待补充内容后替换预设问句,并保留溯源信息;以及
S05:输出替换所有的预设问句后的报告内容,生成得到完整报告。
本发明实施例的报告生成方法中,用户在撰写报告时,只需在需要查找补充资料的内容位置处插入预设问句,即可通过数据库自动准确地查询得到相应的待补充内容,无需人工查找收集整理资料,使用户能够节省大量的前期准备时间,并尽量地避免人为错漏的出现,同时可以保留用户自身的写作风格,报告的撰写过程更为灵活自由,而不局限于句子素材库,输入预设问句(如公司名、行业名等)即可批量自动生成若干篇报告,并且增加溯源功能以方便用户校对和确保数据准确度。
对于需要撰写周期性报告的用户来说,只需要保存一个已输出的报告作为模板,每次使用时修改时间周期,即可完成报告。对于需要经常撰写固定样式段落的用户来说,也可利用本发明的方法来制定规范的段落模版,在需要时调用段落即可,极大地节约了用户撰写报告的时间与精力,同时提升了报告的质量、准确性与速度。
本发明中,预设问句为自然语言问句,上述报告生成方法可以理解为基于自然语言问句的报告生成方法,为简要描述,本文以报告生成方法进行叙述。
本发明实施例的报告生成方法可用于众多通用或专用的计算机系统环境或配置中,例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本发明实施例中,以上述报告生成方法在电脑上被实施为例进行说明,由电脑上的系统来运行实现,本方法在其他设备中实施时的流程与内容可参考下文来实现。
用户以自身写作风格通过电脑编辑或撰写报告时,电脑屏幕上显示报告撰写的输入界面,所输入的报告内容在电脑屏幕上或该输入界面上显示,报告内容为报告中所包含的文字、数字、图像、图表等内容,当报告内容的某个位置需要补充相关内容时,用户在该位置上预留预设问句以便于被检测,从而针对该预设位置进行后续内容的补充替换,预设问句可以为用户自行输入的问句,也可以为网络上或其他来源所提供的模板中的问句,还可以是用户事先设定的模板中的问句,对于已存在的问句,用户直接选中想要的问句后做相关编辑即可。整篇报告内容中的预设问句为一个或多个,且在不同位置上的预设问句的内容不同,具体根据用户在撰写报告时需要补充的内容来确定。
也即是说,预设问句为本方法中的特征点,基于对预设问句的检测分析来进行相应内容的补充替换,预设问句具备的基本识别特征为“问句”,“问句”中包含有一定的可识别特征,并非指的常规的疑问句或反问句等,“问句”为所属领域的常规概念,其所具备的特征与基本格式等在所属领域有清晰的描述与划分,如何识别“问句”也为所属领域的成熟技术,在此不做赘述。
在检测到报告内容中的预设问句时,为便于通过数据库准确高效地查询到与预设问句对应的内容,需要将预设问句解析生成数据库查询语言,具体为:
1、将预设问句至少解析为实体、属性、关系、时间与动作中的一种或多种,实体、属性、关系、时间与动作为数据语言的基本形式与构成,符合通过数据库进行查询的基本要求;
2、将实体、属性、关系、时间与动作中的一种或多种转化为数据库查询语句,可以理解,由于实体、属性、关系、时间与动作等一种或多种并不能直接被数据库识别并查询,因此还需要将实体、属性、关系、时间与动作转化生成为规范的数据库查询语言,以提升查询的速度与准确性。
数据库可以为本地数据库,也可以为云端数据库,其中存储有众多从可行来源所获取的数据,可信来源如各公司各行业的各种季度或年度报表、统计以及汇总等等,数据库所提供的数据可以为用户设定选择的行业或公司的数据,也可以是系统筛选出来的特定行业或公司的数据,或者无差别的提供所有能够查询得到的公司或行业的数据。如此,当用户需要撰写报告时,数据库即可根据预设问句所解析得到的数据库查询语言,在较大范围内查询提供对应的待补充数据,以进行后续的填充替换。
另外,数据库可还可访问其他的数据来源,以在自身所存储或所能提供的数据有限或无法满足当前的查询补充要求时,从其他数据来源查询获取可用的数据提供给用户,保证待补充的数据能够及时、有效地得到补充。
在一个实施例中,数据库可每隔一段时间自动地更新获取新的数据,如每天、每周、每月或每个季度,也可以是系统推荐或默认的时间去获取新的数据,所更新的数据可以为特定的公司或行业,如用户在报告的历史撰写中所较多关注的公司或行业,如用户输入较多、查询较多的公司或行业,以保证数据的及时有效的更新。
以下为本发明实施例的步骤S2与步骤S3的几个示例:
1、假设用户在撰写报告内容时,需要补充A公司在2022年的营业收入,此时,所输入的预设问句可以为“A公司在2022年的营业收入是多少?”,即在步骤S2中输入的为“A公司2022年的营业收入是多少?”,则解析输出的数据库查询语言为“select 营业收入 from 财务数据表 where 年份=2022 and 公司=A公司”,数据库即可根据此数据库查询语言来查询A公司2022年的财务数据表,进而根据财务数据表分析得到A公司在2022年的营业收入,此时得到的A公司在2022年的营业收入即为待补充数据;
2、若是用户需要在报告内容中补充A公司在其他年份的营业收入,此时,只要改变所输入的年份即可,如在步骤S2中输入的预设问句为“A公司在2019年的营业收入是多少?”,则解析输出的数据库查询语言为“select 营业收入 from 财务数据表 where 年份=2019 and 公司=A公司”,数据库即可根据此数据库查询语言来查询A公司2019年的财务数据表,进而根据财务数据表分析得到A公司在2019年的营业收入,此时得到的A公司在2019年的营业收入即为待补充数据;
3、若是用户需要在报告内容中补充A公司在2022年的营业收入相比2021年的营业收入的增减情况,此时,所输入的预设问句可以为“A公司在2022年的营业收入相比2021年的营业收入的增减情况是?”,即在步骤S2中输入的为“A公司在2022年的营业收入相比2021年的营业收入的增减情况是?”,则解析输出的数据库查询语言为“select 营业收入 from财务数据表 where 年份 in (2022,2021) and 公司=A公司”,数据库即可根据此数据库查询语言来查询A公司在2021年与2022年的财务数据表,再根据2021年与2022年的财务数据表分别分析得到A公司在2021年与在2022年的营业收入,进而得到A公司在2022年的营业收入相比2021年的营业收入的增减情况,此时得到的增减情况即为待补充数据;
4、若是用户需要在报告内容中补充B公司在2022年的人员数量情况,此时,所输入的预设问句可以为“B公司在2022年的员工数量有多少?”,则解析输出的数据库查询语言为“select 员工数量 from 人力资源报告 where 年份=2022 and 公司=B公司”,数据库即可根据此数据库查询语言来查询B公司2022年的人力资源报告,进而根据人力资源报告分析得到B公司在2022年的员工数量,此时得到的B公司在2022年的员工数量即为待补充数据;
5、若是用户需要在报告内容中补充B公司在2022年的人员相比2021年的人员的增减情况,此时,所输入的预设问句可以为“B公司在2022年的员工相比2021年的人员增减情况为?”,则解析输出的数据库查询语言为“select 员工数量 from 人力资源报告 where年份 in (2022,2021) and 公司=B公司”,数据库即可根据此数据库查询语言来查询B公司在2021年与2022年的人力资源报告,再根据2021年与2022年的人力资源报告分析得到B公司在2021年的员工数量与在2022年的员工数量,进而得到B公司在2022年的员工相比2021年的人员增减情况,此时得到的增减情况即为待补充数据。
对于用户输入的不同预设问句,解析得到的数据库查询语言也不同,使得数据库可针对性地查询得到对应的内容进行补充替换。以上关于将预设问句解析生成数据库查询语言的描述以及数据库查询语言的格式仅为示例性地,不应理解为对本发明的限制。
可以理解,由于在报告内容中的不同语句环境下,需要补充的内容不同,例如有些需要补充的内容可能为文字形式,有些需要补充的内容可能为数字形式,有些需要补充的内容则可能为文字与数字结合的形式,若是将查询得到的待补充数据直接补充替换预设问句,可能会不符合语句环境而导致语句不通顺等问题,因此,需要将待补充数据转化为相应的待补充内容后再用以替换预设问句,保证补充替换的内容与语句环境适应,以避免在报告内容输出后还需要人工复查的麻烦,而将报告内容中所有的预设问句都补充替换后,即可得到完整报告。
更多地,可以是用户在报告内容中每预留一个待补充位置,系统就自动将该待补充位置补充完整,也可以是用户在整篇报告内容都暂时编辑完后,将所有的待补充位置都补充完整。
在一个较佳的实施例中,用户每预留一个待补充位置,系统都将待补充位置补充完整,如此,能够进一步地提升报告的撰写速度,并且也便于用户即时地检查所补充的内容,保证待补充内容符合用户的实际需求。
在本实施例中,溯源信息指的是待补充数据的数据来源/信息来源信息,如来源于某个网页、某个公司的某个季度或年度的报表等等,溯源信息可以为网络链接等,其存储于数据库中并与对应的待补充数据/待补充内容关联。当用户需要溯源时,可点击原预设问句处的待补充内容,通过该待补充内容可转接到对应的溯源信息,而点击该溯源信息即可找到待补充内容所对应的待补充数据的来源与原所处位置,实现数据的溯源,以方便用户校对和确保数据准确度。
本发明实施例的报告生成方法,预设问句为自然语言问句,基于对报告内容中的预设问句的检测与解析,得到用户在撰写报告内容时想要补充的内容的相关数据,根据相关数据在数据库中检索查询以得到用户想要补充在报告内容中的补充内容,将补充内容替换原来的预设问句,即可实现报告内容的撰写,免去了用户需要从网络上或其他来源查询相关数据的时间与精力,同时保证了数据来源的广泛性与准确性,保证了报告内容的质量,并且增加了溯源功能以方便用户校对和确保数据准确度。
更进一步地,请结合图2,步骤S05之后包括步骤:
S06:将当前输出的完整报告存储为报告模板。
为使用户在下次还需要撰写相关报告时节省时间与精力,本实施例中,将当前输出的完整报告存储为报告模板,报告模板可以存储于云端或本地。对于一些需要周期性撰写关于某家公司的报告以汇报工作或分析行业情况的用户来说,可以在原有的报告模板的基础上直接调用更新,将更新后的报告内容输出即可得到新的报告内容,对于即使是一些撰写报告不是很频繁的用户来说,同样能够将报告模板应用于其他报告的撰写中,只要小幅度的修改或替换一些内容即可,同样能够节省用户从头撰写新的报告的时间与精力。
在一个实施例中,可先在云端或本地建立一个报告模板库并建立与本地设备的连接,用户在每撰写完成一个报告时,即可将报告同步存储于云端或本地中,当需要撰写新的报告时,通过本地设备即可直接访问、调用报告模板库,在报告模板库中选择想要的历史报告进行相应编辑即可。
实施例二
请参阅图3,更进一步地,步骤S01包括步骤:
S011:接收用户所编辑的报告内容;
S012:检测报告内容中的待补充位置;
S013:当接收到设定的用户操作时,在当前页面显示问句模板,问句模板包括多个预设问句;以及
S014:将用户选择的预设问句填充到待补充位置。
为保证能够及时地补充相应的内容,当用户在以自身的写作风格编辑好报告内容时,系统检测报告内容中需要补充内容的位置,即待补充位置,然后等待用户做出对应的设定操作来触发问句模板,设定操作可以是用户在待补充位置或页面上的其他位置点击了某些功能框,也可以是用户在想要补充内容的位置处输入了设定的内容,如设定的符号、编码等,系统在检测到设定的内容后即自动弹出问句模板。
问句模板可以显示在该待补充位置上,也可以显示在用户当前编辑报告内容的页面上的任何位置,只要便于用户查看选择即可。问句模板中包括多个预设问句,如上文中提到的A公司的年营业收入、不同年份的营业收入增减情况、B公司的员工数量等,以供用户选择想要的、符合当前语句的预设问句。在用户选定了想要的预设问句后,系统即将该预设问句填充到待补充位置处,以进行后续的解析与替换补充等步骤。
在本实施例中,待补充位置可以为预留在报告内容中的字符、空格、括号与空位等形式来表示,如“{”、“【”、“(”、“#”以及“/”等等,只要能够表示出“待补充”的意义即可,便于系统针对这些形式来进行准确的检测。
示例性地,以下“盈利预测与估值”的报告内容:
预测公司{21-23年}{归母净利润}为{3.05、3.83、5.16亿元},分别同比增长{31.3%、25.7%、34.5%},对应EPS分别为{1.80、2.26、3.04元}。加回激励费用的调整后EPS分别为{1.95、2.66、3.30元},最新收盘价对应{21-23年}调整后PE分别为{72x、53x、42x}。采取绝对估值,根据FCFF模型测算,给予公司目标市值{281亿元},仍有{19%}的上涨空间,首次覆盖给予{增持}评级。
上文中的{}中的内容都可以用问句模版替代,如第一个{}中适用的预设问句可以为“哪年到哪年?(或为哪两年、后两年等)”,第二个{}中适用的预设问句可以为“利润情况?(或为营收情况、盈利情况等)”,第三个{}中适用的预设问句可以为“多少?”,如此,只需在各个{}中批量输入不同公司名,即可快速得到对各公司的盈利预测与估值,极大地减少用户的工作量,提升报告撰写速度与准确性。
更进一步地,预设问句的句式包括5W2H句式。
在本实施例中,预设问句的句式可以用5W2H句式来表现,5W2H句式出自于5W2H分析法,该分析法又叫七问分析法,其简单、方便、易于理解、富有启发意义,广泛用于企业管理和技术活动,对于决策和执行性的活动措施也非常有帮助,也有助于弥补考虑问题的疏漏,便于准确地查询得到相应数据。
5W2H分析法用五个以W开头的英语单词和两个以H开头的英语单词进行设问,具体而言即为:WHAT(是什么)、WHY(为什么)、WHO(是谁)、WHEN(什么时候)、WHERE(在哪里)、HOW(怎么做、措施是什么等)、HOW MUCH(有多少、什么程度等),可以发现解决问题的线索,寻找发明思路,进行设计构思。
5W2H分析法可以准确界定、清晰表述问题,提高工作效率,有效掌控事件的本质,有助于思路的条理化,杜绝盲目性,有助于全面思考问题,从而避免在流程设计中遗漏项目,使得预设问句能够更准确地表现出用户想要补充的内容的核心,进而更为准确迅速地查询得到相应数据。
实施例三
更进一步地,待补充位置包括用户在编辑报告内容时预留的设定字符,步骤S012包括步骤:
S0121:检测用户在编辑报告内容时预留的设定字符。
在本实施例中,以用户在撰写报告时主动预留的设定字符作为待补充内容的指代,当检测到报告内容中的设定字符时,即表明该设定字符所处的位置为用户需要数据库来补充内容的位置。
在本实施例中,使用特殊字符“{”触发问句模版,即设定字符为“{”,当用户在编辑页面中输入“{”,系统检测到该字符的存在,会弹出问句模版列表供用户选择输入。而如果用户只想单独输入“{”这一符号而不是问句模版,则无需理会弹出对问句模版列表,继续输入内容即可。
在其他实施例中,待补充位置的表现形式还可以为其他,并不限于上述的设定字符,在具体的实施例中具体选择即可。
实施例四
更进一步地,待补充内容包括数字形式与文字形式,请参阅图4,步骤S04包括步骤:
S041:根据预设问句的前后文关系,判断需要补充的内容为数字形式或文字形式;
S042:若需要补充的内容为数字形式,则将待补充数据作为数字形式的待补充内容后替换预设问句;
S043:若需要补充的内容为文字形式,则根据待补充数据的数据变化情况,将待补充数据生成为文字形式的待补充内容后替换预设问句。
可以理解,用户在撰写报告内容时,内容基本上为文字与数字,因此,需要补充的内容也基本为数字形式或文字形式,因此,用户所预留的位置处所期望得到数据库回答的内容形式可以是数字形式或者文字形式,而有时候所查询到的待补充数据并不能直接用于填充替换预设问句,此时就需要先确定当前语句中所期望填充的内容具体为什么形式,再将待补充数据做相应处理后进行填充替换。
本实施例中,通过预设问句的前后文的语句的语义关系等,来判断需要补充的内容为数字形式还是文字形式,若需要补充的为数字形式的内容,语句的语义就会直接体现出来,如年营业额为?数量为?大小为?长度是?等等,这时就可将数字形式的数据直接填充替换。而若是需要补充的为文字形式的内容,有时候会需要做相应理解,如增减情况为?人员变化情况为?变化趋势为?等等,这时就需要将数据做相应的分析处理后,再转化为文字形式的待补充内容进行填充替换。
进一步地,请结合图5,假设用户输入的一段报告内容为“公司2019年整体业务较上半年同期{nlg},实现营业收入{kg},同比增长{kg}”,其中的{}与nlg、kg即为预设问句的表现形式,通过步骤S041至步骤S043进行相应处理:
1、根据上述第一个预设问句、第二个预设问句与第三个预设问句,即从左至右“{nlg}”处、第一个“{kg}”处与第二个“{kg}”处的前后文关系,判断确认第一个需要补充的内容为文字形式,第二个需要补充的内容为数字形式,第三个需要补充的内容为文字形式;
2、步骤S042可以建立为填充数据模型来具体实现相关的处理:对于数字形式的期望回答形式(即{}中的内容为“kg”),数据库所查询到的待补充数据会通过填充数据模型,被直接用于替换报告内容中的预设问句完成填空,如图5所示,数据库查询得到第一个“{kg}”处为123亿元,第二个“{kg}”处为23%,则将123亿元与23%直接用于填充替换上述两个“{kg}”,即营业收入为123亿元,同比增长23%;
3、步骤S043可以建立为填充文字模型来具体实现相关的处理:对于文字型的期望回答形式(即{}中的内容为“nlg”),系统会根据数据库所查询到的待补充数据确定数据变化情况,如数据表现为增长形式,则运用文字生成模块通过数据分析生成回答,将待补充数据生成为文字形式的待补充内容,即将数据变化形式转化为文字,然后用于替换报告内容中的预设问句完成填空,如图5中,数据库查询得到“{nlg}”处为保持稳定增长,则将保持稳定增长直接用于填充替换上述的“{nlg}”,即公司2019年整体业务较上半年同期保持稳定增长;
4、通过步骤S041至S043的处理,最终输出得到“公司2019年整体业务较上半年同期保持稳定增长,实现营业收入123亿元,同比增长23%”的报告内容,自动准确地实现了对预设问句的替换,从而实现对本段报告内容的自动补充撰写,得到完整报告。
实施例五
请参阅图6,本发明的报告生成装置100包括:
检测单元10,用于检测用户输入的报告内容中所包含的预设问句;
解析单元20,用于将预设问句解析生成数据库查询语句;
查询单元30,用于根据数据库查询语句从数据库中查询得到对应的待补充数据;以及
替换单元40,用于将待补充数据转化为待补充内容后替换预设问句,并保留溯源信息;
输出单元50,用于输出替换所有的预设问句后的报告内容,生成得到完整报告。
本发明实施例的报告生成装置100,用户在撰写报告的过程中,只需在需要查找补充资料的内容位置处插入预设问句,即可通过数据库主动准确地查询得到相应的待补充内容,无需人工查找收集整理资料,使用户能够节省大量的前期准备时间,并尽量地避免人为错漏的出现,同时可以保留用户自身的写作风格,报告的撰写过程更为灵活自由,而不局限于句子素材库,输入预设问句(如公司名、行业名等)即可批量自动生成若干篇报告,并且增加溯源功能以方便用户校对和确保数据准确度。
对于需要撰写周期性报告的用户来说,只需要保存一个报告模板,每次使用时修改时间周期,即可完成报告。对于需要经常撰写固定样式段落的用户来说,也可利用本发明的方法来制定规范的段落模版,在需要时调用段落即可,极大地节约了用户撰写报告的时间与精力,同时提升了报告的质量、准确性与速度。
所属领域的技术人员可以清楚地了解到,为描述的方便简洁,上述描述的报告生成装置100的结构和实现原理,可以参考前述实施例一至四中的报告生成方法的实现原理,在此不再赘述。
实施例六
本发明的报告生成系统包括上述报告生成装置100。
本发明实施例的报告生成系统中,用户在撰写报告时,只需在需要查找补充资料的内容位置处插入预设问句,即可通过数据库自动准确地查询得到相应的待补充内容,无需人工查找收集整理资料,使用户能够节省大量的前期准备时间,并尽量地避免人为错漏的出现,同时可以保留用户自身的写作风格,报告的撰写过程更为灵活自由,而不局限于句子素材库,输入预设问句(如公司名、行业名等)即可批量自动生成若干篇报告,并且增加溯源功能以方便用户校对和确保数据准确度。
对于需要撰写周期性报告的用户来说,只需要保存一个已输出的报告作为模板,每次使用时修改时间周期,即可完成报告。对于需要经常撰写固定样式段落的用户来说,也可利用本发明的方法来制定规范的段落模版,在需要时调用段落即可,极大地节约了用户撰写报告的时间与精力,同时提升了报告的质量、准确性与速度。
所属领域的技术人员可以清楚地了解到,为描述的方便简洁,上述描述的报告生成系统的结构和实现原理,可以参考前述实施例六中的报告生成装置的实现原理,在此不再赘述。
实施例七
本发明的存储介质上存储有程序指令,程序指令被处理器执行时实现如上述任一实施例的报告生成方法的步骤。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。
一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。
在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过指令来指令相关的硬件来完成,该指令可存储于一取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random AccessMemory,RAM)等。
本发明实施例的存储介质运行自然语言问句的报告生成方法,该报告生成方法中,用户在撰写报告时,只需在需要查找补充资料的内容位置处插入预设问句,即可通过数据库自动准确地查询得到相应的待补充内容,无需人工查找收集整理资料,使用户能够节省大量的前期准备时间,并尽量地避免人为错漏的出现,同时可以保留用户自身的写作风格,报告的撰写过程更为灵活自由,而不局限于句子素材库,输入预设问句(如公司名、行业名等)即可批量自动生成若干篇报告,并且增加溯源功能以方便用户校对和确保数据准确度。
对于需要撰写周期性报告的用户来说,只需要保存一个已输出的报告作为模板,每次使用时修改时间周期,即可完成报告。对于需要经常撰写固定样式段落的用户来说,也可利用本发明的方法来制定规范的段落模版,在需要时调用段落即可,极大地节约了用户撰写报告的时间与精力,同时提升了报告的质量、准确性与速度。
所属领域的技术人员可以清楚地了解到,为描述的方便简洁,上述描述的存储介质,可以参考前述实施例一至四中的报告生成方法的实现原理,在此不再赘述。
在本说明书的描述中,参考术语“实施例一”、“实施例二”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种报告生成方法,其特征在于,包括:
检测用户输入的报告内容中所包含的预设问句;
将所述预设问句解析生成数据库查询语句;
根据所述数据库查询语句从数据库中查询得到对应的待补充数据;
将所述待补充数据转化为待补充内容后替换所述预设问句,并保留溯源信息;以及
输出替换所有的所述预设问句后的所述报告内容,生成得到完整报告。
2.根据权利要求1所述的报告生成方法,其特征在于,所述检测用户输入的报告内容中所包含的预设问句,包括:
接收用户所编辑的报告内容;
检测所述报告内容中的待补充位置;
当接收到设定的用户操作时,在当前页面显示问句模板,所述问句模板包括多个预设问句;以及
将用户选择的所述预设问句填充到所述待补充位置。
3.根据权利要求2所述的报告生成方法,其特征在于,所述待补充位置包括用户在编辑报告内容时预留的设定字符,所述检测所述报告内容中的待补充位置,包括:
检测用户在编辑所述报告内容时预留的设定字符。
4.根据权利要求2所述的报告生成方法,其特征在于,所述预设问句的句式包括5W2H句式。
5.根据权利要求1所述的报告生成方法,其特征在于,待补充内容包括数字形式与文字形式,所述将所述待补充数据转化为待补充内容后替换所述预设问句,包括:
根据所述预设问句的前后文关系,判断需要补充的内容为数字形式或文字形式;
若需要补充的内容为数字形式,则将所述待补充数据作为数字形式的待补充内容后替换所述预设问句;
若需要补充的内容为文字形式,则根据所述待补充数据的数据变化情况,将所述待补充数据生成为文字形式的待补充内容后替换所述预设问句。
6. 根据权利要求1所述的报告生成方法,其特征在于,所述将所述预设问句解析生成数据库查询语句,包括:
将所述预设问句至少解析为实体、属性、关系、时间与动作中的一种或多种;以及
将实体、属性、关系、时间与动作中的一种或多种转化为数据库查询语句。
7.根据权利要求1所述的报告生成方法,其特征在于,所述输出替换所有的所述预设问句后的所述报告内容,生成得到完整报告之后,包括:
将当前输出的所述完整报告存储为报告模板。
8.一种报告生成装置,其特征在于,包括:
检测单元,用于检测用户输入的报告内容中所包含的预设问句;
解析单元,用于将所述预设问句解析生成数据库查询语句;
查询单元,用于根据所述数据库查询语句从数据库中查询得到对应的待补充数据;以及
替换单元,用于将所述待补充数据转化为待补充内容后替换所述预设问句,并保留溯源信息;
输出单元,用于输出替换所有的所述预设问句后的所述报告内容,生成得到完整报告。
9.一种报告生成系统,其特征在于,包括:如权利要求8所述的报告生成装置。
10.一种存储介质,其特征在于,所述存储介质上存储有程序指令,所述程序指令被处理器执行时实现如权利要求1至7任一项所述的报告生成方法的步骤。
CN202310362771.4A 2023-04-07 2023-04-07 报告生成方法、装置、系统及存储介质 Pending CN116089570A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310362771.4A CN116089570A (zh) 2023-04-07 2023-04-07 报告生成方法、装置、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310362771.4A CN116089570A (zh) 2023-04-07 2023-04-07 报告生成方法、装置、系统及存储介质

Publications (1)

Publication Number Publication Date
CN116089570A true CN116089570A (zh) 2023-05-09

Family

ID=86202911

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310362771.4A Pending CN116089570A (zh) 2023-04-07 2023-04-07 报告生成方法、装置、系统及存储介质

Country Status (1)

Country Link
CN (1) CN116089570A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107590115A (zh) * 2017-09-13 2018-01-16 北京勤哲软件技术有限责任公司 一种Word报告自动生成方法与装置
CN109471890A (zh) * 2018-10-16 2019-03-15 深圳壹账通智能科技有限公司 报表文件的生成方法、终端设备及介质
CN113821616A (zh) * 2021-08-09 2021-12-21 北京交通大学 领域自适应的槽位填充方法、装置、设备及存储介质
CN115563949A (zh) * 2022-10-13 2023-01-03 山东旗帜信息有限公司 一种文本报告自动生成方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107590115A (zh) * 2017-09-13 2018-01-16 北京勤哲软件技术有限责任公司 一种Word报告自动生成方法与装置
CN109471890A (zh) * 2018-10-16 2019-03-15 深圳壹账通智能科技有限公司 报表文件的生成方法、终端设备及介质
CN113821616A (zh) * 2021-08-09 2021-12-21 北京交通大学 领域自适应的槽位填充方法、装置、设备及存储介质
CN115563949A (zh) * 2022-10-13 2023-01-03 山东旗帜信息有限公司 一种文本报告自动生成方法及系统

Similar Documents

Publication Publication Date Title
CN110825882B (zh) 一种基于知识图谱的信息系统管理方法
Baier et al. Bridging abstraction layers in process mining
CN107392143B (zh) 一种基于svm文本分类的简历精确解析方法
US10740558B2 (en) Translating a current document using a planned workflow associated with a profile of a translator automatically selected by comparing terms in previously translated documents with terms in the current document
Dawood From requirements engineering to uml using natural language processing–survey study
US20110060712A1 (en) Method and system for design check knowledge construction
CN111753536B (zh) 一种专利申请文本的自动撰写方法和装置
Fong et al. What did they do? deriving high-level edit histories in wikis
CN111191429A (zh) 数据表格自动填充的系统和方法
CN116258131A (zh) 基于模板引擎的方案编制方法及系统
Osman et al. Generate use case from the requirements written in a natural language using machine learning
CN115859935A (zh) 一种基于指标库的数据分析报告模板生成系统及方法
Brath et al. Automated insights on visualizations with natural language generation
CN113688606A (zh) 一种自动化进行文档报告写作的方法
Alwadain et al. Crowd-generated data mining for continuous requirements elicitation
CN116089570A (zh) 报告生成方法、装置、系统及存储介质
Arachchi et al. System Implementation Failures in the ERP Development Process
CN115017271A (zh) 用于智能生成rpa流程组件块的方法及系统
de Almeida Falbo et al. Semantic Documentation in Requirements Engineering.
Uenalan et al. Using enhanced wiki-based solutions for managing requirements
Vaz Delivering better projects on time by ensuring requirements quality upfront
Leopold et al. On labeling quality in business process models
Georgiades et al. A novel software tool for supporting and automating the requirements engineering process with the use of natural language
CN111581815A (zh) 一种基于xml的工艺模型本体构建方法
Armbrust et al. Establishing and maintaining traceability between large aerospace process standards

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination