CN106649223A - 基于自然语言处理的金融报告自动生成方法 - Google Patents

基于自然语言处理的金融报告自动生成方法 Download PDF

Info

Publication number
CN106649223A
CN106649223A CN201611202408.2A CN201611202408A CN106649223A CN 106649223 A CN106649223 A CN 106649223A CN 201611202408 A CN201611202408 A CN 201611202408A CN 106649223 A CN106649223 A CN 106649223A
Authority
CN
China
Prior art keywords
data
report
analysis
template
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611202408.2A
Other languages
English (en)
Inventor
郑锦光
吴珂皓
张梦迪
张强
鲍捷
马新磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wen Jie Internet Technology Co Ltd
Original Assignee
Beijing Wen Jie Internet Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Wen Jie Internet Technology Co Ltd filed Critical Beijing Wen Jie Internet Technology Co Ltd
Priority to CN201611202408.2A priority Critical patent/CN106649223A/zh
Publication of CN106649223A publication Critical patent/CN106649223A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种基于自然语言处理的金融报告自动生成方法,步骤如下:1、原始数据处理;根据产品调研及客户需求,按照特定数据结构模板提取生成有效数据;2、中间数据处理;将数据存入数据库中;3、结构数据处理;系统对结构数据进行自动分析,生成有价值的报告原始内容;4、数据展示处理;根据需求制定展示模板,确定报告展示方式,通过数据提交接口,提交前一步结果数据到报告生成系统,最后生成可用报告;5、最终报告定制;系统自动生成的有效数据集合文档。本发明可以解决结合金融领域知识与自然语言处理技术,通过对海量数据获取、分析、整合、提取、建库、模板、生成等多道流程,最终生成具备初级行业分析人员能力的智能金融报告的技术问题。

Description

基于自然语言处理的金融报告自动生成方法
技术领域
本发明涉及金融分析技术领域。
背景技术
自然语言处理:自然语言处理是一门融合人工智能和语言学、计算机科学等理论技术的交叉学科,包括词性标注、分类,命名实体识别,句法分析,情感分析等技术,目前已应用于搜索引擎、推荐系统、舆情分析等相关领域。本专利将自然语言处理技术应用到金融数据分析领域,对海量复杂多样的企业信息进行处理,以提取出行业分析人员最关注的数据指标,并进行投资分析总结,最大化减少不必要的重复人力劳动,帮助分析人员进行投资决策。
金融报告:金融报告是广泛存在于金融领域的行业发展调研总结,涵盖金融业各个细分领域的调查分析,包括企业分析报告,债券评级报告,投前行业研究报告,新挂牌企业报告,企业持续跟踪过程中的需求报告,投后风险提示报告等。
报告自动生成技术:报告自动生成技术是一种需求广泛的文字编辑处理自动化技术,在各个行业领域广泛应用。
在金融领域中,投资分析人员常常需要阅读大量的年报,行业分析报告、法律公告、实时新闻及数据等,同时撰写生成相应的结论分析报告,提供决策分析。在报告的制作方面,主要有以下几种方案:
(一)、金融从业人员的分析报告。
传统人工分析大量行业新闻、数据、年报、券商分析研报、上市招股书、定增公告、投资建议书等各种文件报告,并手动整理提炼出关键信息,生成所需结论内容。此方案主要依赖从业人员多年的行业经验智力积累,难以规模化应用到全领域信息覆盖,并具备极高的学习泛化门槛。
(二)、其他领域的简报自动生成方案。
应用于新闻领域,如时事、体育等,提供快速最简的新闻时讯内容,自动化程度高,相对较少的人力干预,可满足读者多样化的新闻信息获取需求。此方案具备较高的程序自动化水平,可节省大量人力手工劳动,但只有简单的信息提取整合能力,不具备计算推理功能,智能化程度较低。
发明内容
本发明的目的是提供一种基于自然语言处理的金融报告自动生成方法,以解决结合金融领域知识与自然语言处理技术,通过对海量数据获取、分析、整合、提取、建库、模板、生成等多道流程,最终生成具备初级行业分析人员能力的智能金融报告的技术问题。
为了实现上述发明目的,本发明所采用的技术方案的步骤如下:
1).原始数据处理;根据产品调研及客户需求,确定初始数据来源和信息提取方式,初步对原生数据进行处理,去除原始文件无用结构,按照特定数据结构模板提取生成有效数据,包括
201 制定数据提取需求;根据产品团队及市场客户所处的细分领域,制定满足相关人员急需的关键数据需求,确定最终报告的应用场景;
202 分析确定数据来源;根据数据需求及系统运行工作方式,确定所需数据来源,得到具体数字版本原生数据;
203 判断是否网页数据;根据数据是否为网页的形式,判断决定后续的数据处理流程;
204 网页数据;当数据来源是网页数据时,分析网页地址的构造形式、来源,包括网页访问过程中的跳转,网页所在域名的站点;网页内容的结构组成,包括静态数据、动态数据的内容;网页数据的获取方式,包括网页文件、网站数据库、第三方提供商数据调用;
205 网页获取解析;自有开发的网页爬取解析器在分析确定网页地址及网页内容结构后,根据指定顺序及逻辑,分析判断有用数据所处位置及组成形式,摒弃无效网页结构和标签,自动提取出有效数据;
206 判断是否图片数据;当原生数据非网页数据时,判断是否为图片数据,决定后续的数据处理流程;
207 图片数据;当数据来源是图片数据时,分析图片的文件压缩格式,编码方法,包括文件大小、失真程度;图片数据内容的文字分布、清晰度;以及图片的元数据内容,标签描述等信息;
208 图片内容解析;根据图片等压缩格式,清晰度,文字分布情况,使用自有的图片内容解析器,针对具体图片内容组成形式,提取判别分布于图片中的有效文字和数字,生成可后续使用的中间数据;
209 文本数据;当数据来源是文本数据时,判断分析文本数据的具体文件格式;内容组成结构,包含文字排版布局的XML节点构造形式,文字组成结构分级的json形式,非扫描生成的pdf数据形式;
210 文本语义提取;根据具体文本数据格式,使用对应的文本处理分析器,对文本中的数据进行文本语义提取,剔除无用的文本标签、结构形式、元数据说明内容,保留有效的文本数据;
211 中间数据;通过网页数据提取、图片数据提取、文本数据提取流程,生成初始可用的有效数据,此阶段所提取数据已具备初步的分析研究价值;
2.中间数据处理;将数据存入数据库中。开始对数据进行实体抽取、关系抽取,建立企业关键信息链图,构建知识库,按照指定需求提取关联信息,生成系统可识别的有用数据;包括:
301 中间数据;经过原始数据爬取解析处理后的有效数据,并按照系统设计,带有特定的数据结构,包含系统可理解的数据来源、关键词、作者、数据格式内容;
302 是否统一格式;根据系统设计,判断中间数据是否严格按照预定结构生成;
303 数据清洗;对包含未知结构的数据进行清洗处理,包括正则提取,统计排序、聚类算法、相似度比较、符号级数据清理等技术工具,提炼整理有用数据,完成数据可用性的提高;
304 存储入库操作;经清洗后的数据具备进一步分析价值,为提高数据读取、存储、计算的效率,使用数据库技术将干净数据入库存储,方便后续提取处理;
305 实体提取;从数据库中选择需求数据,进行实体提取;实体表示事物、概念、情况、状态;
306 关系提取;提取实体之间的关系,具体有行业对标关系、行业上下游关系、供应链关系、股权变更历史、定增与重大资产重组的关系,多张财务报表之间的数据交叉验证,通过对多个源头、多个时期、多个企业之间的数据关系进行关联提取;
307 知识库构建;在实体提取和关系提取的基础上,进行金融业务知识库的构建与更新;业务场景包括并购、征信、融资、资管、对冲、二级市场交易,使用到的具体技术包括本体的构造和对齐,文档结构分析,篇章分割,常用词和新词发现,中文分词,本体学习,规则建立,本体映射;
308 是否新建企业信息模板;根据产品和客户需求,确定是否使用现有企业信息分析模板,或者新建关键信息抽取模板;
309 企业信息模板设计;设计企业信息抽取模板,提炼系统可表达的相关信息,包括产品分析、财务分析、管理层分析、市场与客户分析、对标分析、研发能力分析等;
310 企业信息模板;使用设计好的企业信息模板,从构建知识库中提取产品及客户所需信息,生成方便后续展示的已结构化数据;
311 结构化数据;包含报告所需指定文档结构、满足最终需求的数据内容;
3.结构数据处理;系统对结构数据进行自动分析,生成有价值的报告原始内容,提交到数据展示层;包括:
401 结构数据;经过前面步骤生成的可用数据集;
402 报告接口;所有的结构化数据需通过报告提交接口,生成最终的报告格式,提交接口内置不同的数据处理模块,会通过最后需求自动选择功能生成报告;
403 生成文件类型;系统根据最终展示的数据文件格式,选择不同的任务树路径生成报告;
404 word文档模块;定义基本的word文档组成结构信息,通过与word模板结合,完成最终报告的生成过程;
405 是否新建word模板;根据系统现有模板以及产品和客户的需求,选择判断是否新建word展示模板,展示信息包括具体的文档布局、展示方式等,提高面向最终用户的文档可读性;
406 word模板设计;结合设计与技术需求,建立新模板;
407 幻灯片;定义基本的幻灯片组成结构信息,通过与幻灯片模板结合,完成最终报告的生成过程;
408 是否新建幻灯片模板;根据系统现有模板以及产品和客户的需求,选择判断是否新建幻灯片展示模板,展示信息包括具体的文档风格、版面设计、图片布局等,提高面向最终用户的文档可读性;
409 幻灯片模板设计;结合设计与技术需求,建立新模板;
410 选择生成文档模板;根据指定的文档模块,结合生成文档模板,生成报告所需的输入数据;
411 报告生产服务器;将上述数据提交到报告生产服务器接口,服务器通过处理标准数据,自动生成文档报告;
412 报告生成,根据用户最终选择的文件格式,自动转换为所需的不同的文件格式,如:word(docx)、ppt(pptx)、pdf,不同的格式有利于用户在不同的场合使用。最终报告即是满足特定用户及产品需求,系统自动生成的有效数据集合文档,展示形式包括幻灯片、表格、常见文本文档,展示内容包含产品结构、财务指标、高管团队、资本市场情况,整个流程完成。本发明的优点及积极效果:
本发明结合金融领域知识与自然语言处理技术,通过对海量数据获取、分析、整合、提取、建库、模板、生成等多道流程,最终生成具备初级行业分析人员能力的智能金融报告,可极大改善相关工作人员的数据获取分析工作,有效提高工作效率,减少大量重复劳动,极大的节省人力重复,并能迅速应用推广到整个行业范围。
附图说明
图1是本发明的原始数据处理流程图。
图2是本发明的中间数据处理流程图。
图3是本发明的结构数据处理流程图。
具体实施方式
本发明提供了一种金融领域中,基于自然语言处理的可根据从业用户需求,自动生成企业信息报告的方法,通过大规模获取可用企业数据,通过数据清洗,加工,生成统一结构的数据,并通过标注分词处理,句子篇章信息提取,语义分析,最终生成报告的方法。
1).原始数据处理;根据产品调研及客户需求,确定初始数据来源和信息提取方式,初步对原生数据进行处理,去除原始文件无用结构,按照特定数据结构模板提取生成有效数据,包括
201 制定数据提取需求;根据产品团队及市场客户所处的细分领域,制定满足相关人员急需的关键数据需求,如公司风险、销售模式、竞争优势劣势等信息等提取,确定最终报告的应用场景;
202 分析确定数据来源;根据数据需求及系统运行工作方式,确定所需数据来源,得到具体数字版本原生数据。常见的数据形式包括网站网页信息,扫描图片,文本信息等;
203 判断是否网页数据;根据数据是否为网页的形式,判断决定后续的数据处理流程;
204 网页数据;当数据来源是网页数据时,分析网页地址的构造形式、来源,包括网页访问过程中的跳转,网页所在域名的站点;网页内容的结构组成,包括静态数据、动态数据的内容;网页数据的获取方式,包括网页文件、网站数据库、第三方提供商数据调用;
205 网页获取解析;自有开发的网页爬取解析器在分析确定网页地址及网页内容结构后,根据指定顺序及逻辑,分析判断有用数据所处位置及组成形式,摒弃无效网页结构和标签,自动提取出有效数据;
206 判断是否图片数据;当原生数据非网页数据时,判断是否为图片数据,决定后续的数据处理流程;
207 图片数据;当数据来源是图片数据时,分析图片的文件压缩格式,编码方法,包括文件大小、失真程度;图片数据内容的文字分布、清晰度;以及图片的元数据内容,标签描述等信息;
208 图片内容解析;根据图片等压缩格式,清晰度,文字分布情况,使用自有的图片内容解析器,针对具体图片内容组成形式,提取判别分布于图片中的有效文字和数字,生成可后续使用的中间数据;
209 文本数据;当数据来源是文本数据时,判断分析文本数据的具体文件格式;内容组成结构,如原始文本的字符编码形式,包含文字排版布局的XML节点构造形式,文字组成结构分级的json形式,非扫描生成的pdf数据形式等;
210 文本语义提取;根据具体文档数据格式,使用对应的文档格式处理分析器,对文档中的数据进行提取,剔除无用的文本标签、结构形式、元数据说明内容,保留有效的文本数据;
211 中间数据;通过网页数据提取、图片数据提取、文本数据提取流程,生成初始可用的有效数据,此阶段所提取数据已具备初步的分析研究价值;
图1为原始数据处理流程,描述了从制定需求到提取有用数据过程中的相关细节。
2).中间数据处理;将数据存入数据库中。开始对数据进行实体抽取、关系抽取,建立企业关键信息链图,构建知识库,按照指定需求提取关联信息,生成系统可识别的有用数据;包括:
301 中间数据;经过原始数据爬取解析处理后的有效数据,并按照系统设计,带有特定的数据结构,包含系统可理解的数据来源、关键词、作者、数据格式内容;
302 是否统一格式;根据系统设计,判断中间数据是否严格按照预定结构生成;
303 数据清洗;对包含未知结构的数据进行清洗处理,包括正则提取,中文分词,词性标注,识别纠错等技术工具,进行段落/句子级别的分析,提炼整理有用数据,完成数据可用性的提高;
304 存储入库操作;经清洗后的数据具备进一步分析价值,为提高数据读取、存储、计算的效率,使用数据库技术将干净数据入库存储,方便后续提取处理;
305 实体提取;从数据库中选择需求数据,在与金融相关的文本中,对实体进行提取;实体表示事物、概念、情况、状态等;在目前涉及的提取工作中,实体有企业,投资机构,人(高管、股东、投资人、合伙人等)、行业、产品、事件、案例、法规等,
306 关系提取;将所有的实体,以及与其相关的文本组合整理,提取实体之间的关系,如行业对标关系、行业上下游关系、供应链关系、股权变更历史、定增与重大资产重组的关系,多张财务报表之间的数据交叉验证,通过对多个源头、多个时期、多个企业之间的数据关系进行关联提取;
307 知识库构建;在实体提取和关系提取的基础上,进行金融业务知识库的构建与更新,包括所有关系的归一化对齐,如甲公司既是乙公司上游企业,也是主要供应商,则判断甲公司是乙公司上游。将所有实体进行链接,如根据某公司名,确定该公司所处的行业板块,或者行业性质。经以上过程,完成实体-关系-实体的金融知识库建立。知识库中所包含的场景包括并购、征信、融资、资管、对冲、二级市场交易等具体金融行为,使用到的技术包括本体的构造和对齐,文档结构分析,篇章分割,常用词和新词发现,中文分词,本体学习,规则建立,本体映射等;
308 是否新建企业信息模板;根据产品和客户需求,确定是否使用现有企业信息分析模板,或者新建关键信息抽取模板;
309 企业信息模板设计;设计企业信息抽取模板,提炼系统可推理表达的具体内容,包括产品分析、财务分析、管理层分析、市场与客户分析、对标分析、研发能力分析等;
310 企业信息模板;使用设计好的企业信息模板,从构建知识库中提取产品及客户所需信息,生成方便后续展示的已结构化数据;
311 结构化数据;包含报告所需指定文档结构、满足最终需求的数据内容;
图2为中间数据处理流程,描述了从原始数据到结构数据的中间数据处理流程细节。
3).结构数据处理;系统对结构数据进行自动分析,生成有价值的报告原始内容,提交到数据展示层;包括
401 结构数据;根据用户的不同需求和专业知识对结构化数据进行数据的二次加工计算和逻辑判断,生成符合接口规范的数据格式;
402 报告接口;所有的结构化数据需通过报告提交接口,生成最终的报告格式,提交接口内置不同的数据处理模块,会通过最后需求自动选择功能生成报告,数据接口用于指导报告生成服务器进行模板选择、展示顺序、展示风格和交互行为的设计;
403 生成文件类型;系统根据最终展示的数据文件格式,选择不同的任务树路径生成报告;
404 文档模块;定义基本的文档组成结构信息,通过与word模板结合,完成最终报告的生成过程;
405 是否新建文档模板;根据系统现有模板以及产品和客户的需求,选择判断是否新建展示模板,展示信息包括具体的文档布局、展示方式等,提高面向最终用户的文档可读性;
406 文档模板设计;结合设计与技术需求,建立新模板;
407 幻灯片;根据结构化数据的数据规范,通过报告页面模板路由自动搜寻最佳的展示模板,并通过预渲染对展示效果进行评估,对于需要进行分页对文字和表格,通过预渲染计算分页展示模式,对结构化数据进行预处理后再进行幻灯片的生成;
408 是否新建幻灯片模板;根据系统现有模板以及产品和客户的需求,选择判断是否新建幻灯片展示模板,展示信息包括具体的文档风格、版面设计、图片布局等,提高面向最终用户的文档可读性;
409 幻灯片模板设计;结合设计与技术需求,建立新模板;
410 选择生成文档模板;根据指定结构化数据的内容,自动搜寻最佳的展示方式和模板;
411 报告生产服务器;将上述数据提交到报告生产服务器接口,服务器通过处理标准数据,自动生成文档报告,复杂的交互逻辑和展示风格通过标签规范进行解析和展示;
412 报告生成,根据用户最终选择的文件格式,自动转换为所需的不同的文件格式,如:word(docx)、ppt(pptx)、pdf,不同的格式有利于用户在不同的场合使用。最终报告即是满足特定用户及产品需求,系统自动生成的有效数据集合文档,展示形式包括幻灯片、表格、常见文本文档,展示内容包含产品结构、财务指标、高管团队、资本市场情况。整个流程完成;
图3为结构数据处理流程。

Claims (1)

1.基于自然语言处理的金融报告自动生成方法,步骤如下:
1).原始数据处理;根据产品调研及客户需求,确定初始数据来源和信息提取方式,初步对原生数据进行处理,去除原始文件无用结构,按照特定数据结构模板提取生成有效数据,包括
201 制定数据提取需求;根据产品团队及市场客户所处的细分领域,制定满足相关人员急需的关键数据需求,确定最终报告的应用场景;
202 分析确定数据来源;根据数据需求及系统运行工作方式,确定所需数据来源,得到具体数字版本原生数据;
203 判断是否网页数据;根据数据是否为网页的形式,判断决定后续的数据处理流程;
204 网页数据;当数据来源是网页数据时,分析网页地址的构造形式、来源,包括网页访问过程中的跳转,网页所在域名的站点;网页内容的结构组成,包括静态数据、动态数据的内容;网页数据的获取方式,包括网页文件、网站数据库、第三方提供商数据调用;
205 网页获取解析;自有开发的网页爬取解析器在分析确定网页地址及网页内容结构后,根据指定顺序及逻辑,分析判断有用数据所处位置及组成形式,摒弃无效网页结构和标签,自动提取出有效数据;
206 判断是否图片数据;当原生数据非网页数据时,判断是否为图片数据,决定后续的数据处理流程;
207 图片数据;当数据来源是图片数据时,分析图片的文件压缩格式,编码方法,包括文件大小、失真程度;图片数据内容的文字分布、清晰度;以及图片的元数据内容,标签描述等信息;
208 图片内容解析;根据图片等压缩格式,清晰度,文字分布情况,使用自有的图片内容解析器,针对具体图片内容组成形式,提取判别分布于图片中的有效文字和数字,生成可后续使用的中间数据;
209 文本数据;当数据来源是文本数据时,判断分析文本数据的具体文件格式;内容组成结构,包含文字排版布局的XML节点构造形式,文字组成结构分级的json形式,非扫描生成的pdf数据形式;
210 文本语义提取;根据具体文本数据格式,使用对应的文本处理分析器,对文本中的数据进行文本语义提取,剔除无用的文本标签、结构形式、元数据说明内容,保留有效的文本数据;
211 中间数据;通过网页数据提取、图片数据提取、文本数据提取流程,生成初始可用的有效数据,此阶段所提取数据已具备初步的分析研究价值;
2).中间数据处理;将数据存入数据库中;开始对数据进行实体抽取、关系抽取,建立企业关键信息链图,构建知识库,按照指定需求提取关联信息,生成系统可识别的有用数据;包括
301 中间数据;经过原始数据爬取解析处理后的有效数据,并按照系统设计,带有特定的数据结构,包含系统可理解的数据来源、关键词、作者、数据格式内容;
302 是否统一格式;根据系统设计,判断中间数据是否严格按照预定结构生成;
303 数据清洗;对包含未知结构的数据进行清洗处理,包括正则提取,统计排序、聚类算法、相似度比较、符号级数据清理等技术工具,提炼整理有用数据,完成数据可用性的提高;
304 存储入库操作;经清洗后的数据具备进一步分析价值,为提高数据读取、存储、计算的效率,使用数据库技术将干净数据入库存储,方便后续提取处理;
305 实体提取;从数据库中选择需求数据,进行实体提取;实体表示事物、概念、情况、状态;
306 关系提取;提取实体之间的关系,具体有行业对标关系、行业上下游关系、供应链关系、股权变更历史、定增与重大资产重组的关系,多张财务报表之间的数据交叉验证,通过对多个源头、多个时期、多个企业之间的数据关系进行关联提取;
307 知识库构建;在实体提取和关系提取的基础上,进行金融业务知识库的构建与更新;业务场景包括并购、征信、融资、资管、对冲、二级市场交易,使用到的具体技术包括本体的构造和对齐,文档结构分析,篇章分割,常用词和新词发现,中文分词,本体学习,规则建立,本体映射;
308 是否新建企业信息模板;根据产品和客户需求,确定是否使用现有企业信息分析模板,或者新建关键信息抽取模板;
309 企业信息模板设计;设计企业信息抽取模板,提炼系统可表达的相关信息,包括产品分析、财务分析、管理层分析、市场与客户分析、对标分析、研发能力分析;
310 企业信息模板;使用设计好的企业信息模板,从构建知识库中提取产品及客户所需信息,生成方便后续展示的已结构化数据;
311 结构化数据;包含报告所需指定文档结构、满足最终需求的数据内容;
3).结构数据处理;系统对结构数据进行自动分析,生成有价值的报告原始内容,提交到数据展示层;包括
401 结构数据;经过前面步骤生成的可用数据集;
402 报告接口;所有的结构化数据需通过报告提交接口,生成最终的报告格式,提交接口内置不同的数据处理模块,会通过最后需求自动选择功能生成报告;
403 生成文件类型;系统根据最终展示的数据文件格式,选择不同的任务树路径生成报告;
404 word文档模块;定义基本的word文档组成结构信息,通过与word模板结合,完成最终报告的生成过程;
405 是否新建word模板;根据系统现有模板以及产品和客户的需求,选择判断是否新建word展示模板,展示信息包括具体的文档布局、展示方式等,提高面向最终用户的文档可读性;
406 word模板设计;结合设计与技术需求,建立新模板;
407 幻灯片;定义基本的幻灯片组成结构信息,通过与幻灯片模板结合,完成最终报告的生成过程;
408 是否新建幻灯片模板;根据系统现有模板以及产品和客户的需求,选择判断是否新建幻灯片展示模板,展示信息包括具体的文档风格、版面设计、图片布局等,提高面向最终用户的文档可读性;
409 幻灯片模板设计;结合设计与技术需求,建立新模板;
410 选择生成文档模板;根据指定的文档模块,结合生成文档模板,生成报告所需的输入数据;
411 报告生产服务器;将上述数据提交到报告生产服务器接口,服务器通过处理标准数据,自动生成文档报告;
412 报告生成,最终报告即是满足特定用户及产品需求,系统自动生成的有效数据集合文档,展示形式包括幻灯片、表格、常见文本文档,展示内容包含产品结构、财务指标、高管团队、资本市场情况,整个流程完成。
CN201611202408.2A 2016-12-23 2016-12-23 基于自然语言处理的金融报告自动生成方法 Pending CN106649223A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611202408.2A CN106649223A (zh) 2016-12-23 2016-12-23 基于自然语言处理的金融报告自动生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611202408.2A CN106649223A (zh) 2016-12-23 2016-12-23 基于自然语言处理的金融报告自动生成方法

Publications (1)

Publication Number Publication Date
CN106649223A true CN106649223A (zh) 2017-05-10

Family

ID=58827268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611202408.2A Pending CN106649223A (zh) 2016-12-23 2016-12-23 基于自然语言处理的金融报告自动生成方法

Country Status (1)

Country Link
CN (1) CN106649223A (zh)

Cited By (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273461A (zh) * 2017-06-02 2017-10-20 广州诚予国际市场信息研究有限公司 一种自然语言信息处理方法及系统
CN107688948A (zh) * 2017-07-24 2018-02-13 平安科技(深圳)有限公司 理赔数据处理方法、装置、计算机设备和存储介质
CN107766311A (zh) * 2017-09-27 2018-03-06 武汉达策信息技术有限公司 基于OnlineBox系统自动生成风投数据报告方法及系统
CN107977472A (zh) * 2017-12-27 2018-05-01 北京诸葛找房信息技术有限公司 房产类新闻文章自动生成的方法
CN108009715A (zh) * 2017-11-28 2018-05-08 邢加和 一种自动分析指标波动根因的方法
CN108039193A (zh) * 2017-11-17 2018-05-15 哈尔滨工大服务机器人有限公司 一种自动生成体检报告的方法及装置
CN108595398A (zh) * 2018-04-16 2018-09-28 北京航空航天大学 人工智能程序替代人书写仿真报告的方法
CN108763198A (zh) * 2018-05-11 2018-11-06 北京理工大学 一种生成式的学术论文中相关工作的自动产生方法
CN108846592A (zh) * 2018-07-11 2018-11-20 北京神州泰岳软件股份有限公司 一种基于大数据的企业评价报告生成方法及装置
TWI645357B (zh) * 2017-05-11 2018-12-21 碩網資訊股份有限公司 一種產生金融報告的系統與方法
CN109190098A (zh) * 2018-08-15 2019-01-11 上海唯识律简信息科技有限公司 一种基于自然语言处理的文档自动生成方法和系统
TWI651622B (zh) * 2017-09-21 2019-02-21 群益金鼎證券股份有限公司 智能文章摘要系統及方法
CN109508449A (zh) * 2018-08-07 2019-03-22 上海奇邑文化传播有限公司 一种宣传片文案在线生成系统及其生成方法
CN109614602A (zh) * 2018-11-26 2019-04-12 江苏科技大学 一种外形检测报告的快速生成方法
CN109634575A (zh) * 2018-12-24 2019-04-16 安徽经邦软件技术有限公司 智能生成ppt分析报告方法
CN109635252A (zh) * 2018-10-25 2019-04-16 北京中关村科金技术有限公司 一种基于pdf格式的保险产品关键信息解析方法、装置及系统
CN109657222A (zh) * 2018-12-14 2019-04-19 泰康保险集团股份有限公司 用于生成报告的方法和系统
CN109670477A (zh) * 2018-12-28 2019-04-23 上海大智慧财汇数据科技有限公司 面向pdf表格的自动识别系统和方法
CN109766563A (zh) * 2017-11-06 2019-05-17 海德堡印刷机械股份公司 具有与cad/cam数据的反向连接的cad/cam分析工具
CN109800420A (zh) * 2018-12-19 2019-05-24 福建亿榕信息技术有限公司 一种可研评审报告自动生成方法及存储介质
CN110020233A (zh) * 2017-07-28 2019-07-16 阿里巴巴集团控股有限公司 调研数据处理方法、装置及系统
CN110096257A (zh) * 2019-04-10 2019-08-06 沈阳哲航信息科技有限公司 一种基于智能识别的设计图形自动化评判系统及方法
CN110119512A (zh) * 2019-05-21 2019-08-13 杭州凡闻科技有限公司 数字剪报制作方法
CN110335072A (zh) * 2019-06-25 2019-10-15 上海有色网信息科技股份有限公司 大宗商品数据提取及报告生成的方法、系统、介质及装置
CN110377910A (zh) * 2019-07-22 2019-10-25 北京大学 一种表格描述的处理方法、装置、设备及存储介质
CN110442772A (zh) * 2019-08-13 2019-11-12 深圳司南数据服务有限公司 一种智能研报生成方法及终端
CN110619568A (zh) * 2019-09-17 2019-12-27 王文斌 风险评估报告的生成方法、装置、设备及存储介质
CN110765742A (zh) * 2019-09-10 2020-02-07 上海融盈数据科技有限公司 一种基于文本分析技术的自动写稿系统
CN110889310A (zh) * 2018-09-07 2020-03-17 上海怀若智能科技有限公司 金融文档信息智能提取系统及方法
CN110888882A (zh) * 2019-11-22 2020-03-17 成都市映潮科技股份有限公司 一种多维度数据提取与文本生成的方法、装置及存储介质
CN110909226A (zh) * 2019-11-28 2020-03-24 达而观信息科技(上海)有限公司 金融类文档信息处理方法、装置、电子设备及存储介质
CN110955801A (zh) * 2019-12-06 2020-04-03 中国建设银行股份有限公司 一种cognos报表指标的知识图谱分析方法及系统
CN110968622A (zh) * 2019-12-20 2020-04-07 上海鲲贝管理咨询有限公司 一种会计报告定制方法、平台和终端
CN111027296A (zh) * 2019-11-21 2020-04-17 深圳壹账通智能科技有限公司 基于知识库的报表生成方法及系统
CN111368515A (zh) * 2020-03-02 2020-07-03 中国农业科学院农业信息研究所 基于pdf文档碎片化的行业动态交互式报告生成方法及系统
CN111753501A (zh) * 2020-07-07 2020-10-09 江苏中威科技软件系统有限公司 Ofd文件合并展现迅捷阅读的方法
CN111950248A (zh) * 2020-08-10 2020-11-17 中国工商银行股份有限公司 基于xml的产品报告生成方法及系统
CN111966879A (zh) * 2020-08-17 2020-11-20 华南师范大学 一种疫情新闻信息提取方法及系统
WO2020233345A1 (zh) * 2019-05-21 2020-11-26 深圳壹账通智能科技有限公司 基于自然语言处理的数据图表生成方法和相关装置
CN112149391A (zh) * 2020-09-28 2020-12-29 平安证券股份有限公司 信息处理方法、信息处理装置、终端设备及存储介质
CN112149387A (zh) * 2020-09-28 2020-12-29 深圳壹账通智能科技有限公司 财务数据的可视化方法、装置、计算机设备及存储介质
CN112464668A (zh) * 2020-11-26 2021-03-09 南京数脉动力信息技术有限公司 一种提取智能家居行业动态信息的方法和系统
WO2021051869A1 (zh) * 2019-09-16 2021-03-25 平安科技(深圳)有限公司 文本数据排版方法、装置、计算机设备及存储介质
CN112883081A (zh) * 2021-02-24 2021-06-01 江西数拓科技有限公司 一种抽检数据智能分析方法及系统
CN112906367A (zh) * 2021-02-08 2021-06-04 上海宏原信息科技有限公司 消费者文本的信息提取结构,标注方法和识别方法
CN112951444A (zh) * 2019-12-11 2021-06-11 天津开心生活科技有限公司 一种文档处理方法以及系统
CN112989782A (zh) * 2021-04-22 2021-06-18 北京三维天地科技股份有限公司 一种自动化模板配置及报告生成的方法
CN113094498A (zh) * 2021-04-27 2021-07-09 中国美术学院 一种产品外观设计调研报告的生成方法和系统
CN113221516A (zh) * 2020-09-14 2021-08-06 苏州七星天专利运营管理有限责任公司 一种文档辅助编辑的方法和系统
CN113268957A (zh) * 2021-03-19 2021-08-17 广州天越电子科技有限公司 一种实现智能生成标书文档的引用方法
US11182155B2 (en) 2019-07-11 2021-11-23 International Business Machines Corporation Defect description generation for a software product
CN113962210A (zh) * 2021-11-24 2022-01-21 黄河勘测规划设计研究院有限公司 基于nlp技术的报告智能编制方法
CN114490778A (zh) * 2022-02-15 2022-05-13 北京固加数字科技有限公司 一种金融研报自动生成系统及方法
CN115358201A (zh) * 2022-08-03 2022-11-18 浙商期货有限公司 一种期货领域的投研报告处理方法和系统
CN115438142A (zh) * 2021-06-02 2022-12-06 戎易商智(北京)科技有限公司 一种对话式交互数据分析报告系统
US11574287B2 (en) 2017-10-10 2023-02-07 Text IQ, Inc. Automatic document classification
TWI818713B (zh) * 2021-12-13 2023-10-11 美商萬國商業機器公司 用於自動地將用語指派至文本文件之電腦實施方法、電腦程式產品及電腦系統
CN117172677A (zh) * 2023-06-19 2023-12-05 上海简答数据科技有限公司 一种基于自然语言处理的财务分析报告自动化处理方法、系统、装置和介质
CN117371748A (zh) * 2023-11-02 2024-01-09 广州尚捷智慧云网络科技有限公司 一种智能化产品数据管理系统及方法
CN117454864A (zh) * 2023-10-26 2024-01-26 中国人寿保险股份有限公司江苏省分公司 一种基于模板与数据融合的展示方法
CN117539875A (zh) * 2023-10-31 2024-02-09 广东北区教育科技有限公司 一种练习题库定期更新在线管理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034940A (zh) * 2012-12-07 2013-04-10 深圳市智维通达科技有限公司 一种自动生成分析报告的方法及系统
CN104899268A (zh) * 2015-05-25 2015-09-09 浪潮集团有限公司 一种分布式企业信息垂直搜索方法
CN105468744A (zh) * 2015-11-25 2016-04-06 浪潮软件集团有限公司 一种实现税务舆情分析和全文检索的大数据平台
CN106021389A (zh) * 2016-05-12 2016-10-12 新华通讯社 基于模板自动生成新闻的系统和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034940A (zh) * 2012-12-07 2013-04-10 深圳市智维通达科技有限公司 一种自动生成分析报告的方法及系统
CN104899268A (zh) * 2015-05-25 2015-09-09 浪潮集团有限公司 一种分布式企业信息垂直搜索方法
CN105468744A (zh) * 2015-11-25 2016-04-06 浪潮软件集团有限公司 一种实现税务舆情分析和全文检索的大数据平台
CN106021389A (zh) * 2016-05-12 2016-10-12 新华通讯社 基于模板自动生成新闻的系统和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
鲍捷: "知识图谱如何助力实现智能金融", 《金卡工程》 *

Cited By (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI645357B (zh) * 2017-05-11 2018-12-21 碩網資訊股份有限公司 一種產生金融報告的系統與方法
CN107273461A (zh) * 2017-06-02 2017-10-20 广州诚予国际市场信息研究有限公司 一种自然语言信息处理方法及系统
CN107688948A (zh) * 2017-07-24 2018-02-13 平安科技(深圳)有限公司 理赔数据处理方法、装置、计算机设备和存储介质
CN110020233A (zh) * 2017-07-28 2019-07-16 阿里巴巴集团控股有限公司 调研数据处理方法、装置及系统
CN110020233B (zh) * 2017-07-28 2023-06-20 阿里巴巴集团控股有限公司 调研数据处理方法、装置及系统
TWI651622B (zh) * 2017-09-21 2019-02-21 群益金鼎證券股份有限公司 智能文章摘要系統及方法
CN107766311A (zh) * 2017-09-27 2018-03-06 武汉达策信息技术有限公司 基于OnlineBox系统自动生成风投数据报告方法及系统
US11574287B2 (en) 2017-10-10 2023-02-07 Text IQ, Inc. Automatic document classification
CN109766563A (zh) * 2017-11-06 2019-05-17 海德堡印刷机械股份公司 具有与cad/cam数据的反向连接的cad/cam分析工具
CN108039193A (zh) * 2017-11-17 2018-05-15 哈尔滨工大服务机器人有限公司 一种自动生成体检报告的方法及装置
CN108009715A (zh) * 2017-11-28 2018-05-08 邢加和 一种自动分析指标波动根因的方法
CN107977472B (zh) * 2017-12-27 2021-11-05 北京诸葛找房信息技术有限公司 房产类新闻文章自动生成的方法
CN107977472A (zh) * 2017-12-27 2018-05-01 北京诸葛找房信息技术有限公司 房产类新闻文章自动生成的方法
CN108595398A (zh) * 2018-04-16 2018-09-28 北京航空航天大学 人工智能程序替代人书写仿真报告的方法
CN108763198A (zh) * 2018-05-11 2018-11-06 北京理工大学 一种生成式的学术论文中相关工作的自动产生方法
CN108763198B (zh) * 2018-05-11 2021-06-22 北京理工大学 一种生成式的学术论文中相关工作的自动产生方法
CN108846592A (zh) * 2018-07-11 2018-11-20 北京神州泰岳软件股份有限公司 一种基于大数据的企业评价报告生成方法及装置
CN109508449A (zh) * 2018-08-07 2019-03-22 上海奇邑文化传播有限公司 一种宣传片文案在线生成系统及其生成方法
CN109190098A (zh) * 2018-08-15 2019-01-11 上海唯识律简信息科技有限公司 一种基于自然语言处理的文档自动生成方法和系统
CN110889310A (zh) * 2018-09-07 2020-03-17 上海怀若智能科技有限公司 金融文档信息智能提取系统及方法
CN110889310B (zh) * 2018-09-07 2023-05-09 深圳市赢时胜信息技术股份有限公司 金融文档信息智能提取系统及方法
CN109635252A (zh) * 2018-10-25 2019-04-16 北京中关村科金技术有限公司 一种基于pdf格式的保险产品关键信息解析方法、装置及系统
CN109614602A (zh) * 2018-11-26 2019-04-12 江苏科技大学 一种外形检测报告的快速生成方法
CN109657222A (zh) * 2018-12-14 2019-04-19 泰康保险集团股份有限公司 用于生成报告的方法和系统
CN109800420A (zh) * 2018-12-19 2019-05-24 福建亿榕信息技术有限公司 一种可研评审报告自动生成方法及存储介质
CN109634575A (zh) * 2018-12-24 2019-04-16 安徽经邦软件技术有限公司 智能生成ppt分析报告方法
CN109670477A (zh) * 2018-12-28 2019-04-23 上海大智慧财汇数据科技有限公司 面向pdf表格的自动识别系统和方法
CN110096257A (zh) * 2019-04-10 2019-08-06 沈阳哲航信息科技有限公司 一种基于智能识别的设计图形自动化评判系统及方法
CN110119512A (zh) * 2019-05-21 2019-08-13 杭州凡闻科技有限公司 数字剪报制作方法
WO2020233345A1 (zh) * 2019-05-21 2020-11-26 深圳壹账通智能科技有限公司 基于自然语言处理的数据图表生成方法和相关装置
CN110335072A (zh) * 2019-06-25 2019-10-15 上海有色网信息科技股份有限公司 大宗商品数据提取及报告生成的方法、系统、介质及装置
US11182155B2 (en) 2019-07-11 2021-11-23 International Business Machines Corporation Defect description generation for a software product
CN110377910B (zh) * 2019-07-22 2024-03-05 北京大学 一种表格描述的处理方法、装置、设备及存储介质
CN110377910A (zh) * 2019-07-22 2019-10-25 北京大学 一种表格描述的处理方法、装置、设备及存储介质
CN110442772A (zh) * 2019-08-13 2019-11-12 深圳司南数据服务有限公司 一种智能研报生成方法及终端
CN110765742A (zh) * 2019-09-10 2020-02-07 上海融盈数据科技有限公司 一种基于文本分析技术的自动写稿系统
WO2021051869A1 (zh) * 2019-09-16 2021-03-25 平安科技(深圳)有限公司 文本数据排版方法、装置、计算机设备及存储介质
CN110619568A (zh) * 2019-09-17 2019-12-27 王文斌 风险评估报告的生成方法、装置、设备及存储介质
CN111027296A (zh) * 2019-11-21 2020-04-17 深圳壹账通智能科技有限公司 基于知识库的报表生成方法及系统
CN110888882A (zh) * 2019-11-22 2020-03-17 成都市映潮科技股份有限公司 一种多维度数据提取与文本生成的方法、装置及存储介质
CN110909226B (zh) * 2019-11-28 2023-06-06 达而观信息科技(上海)有限公司 金融类文档信息处理方法、装置、电子设备及存储介质
CN110909226A (zh) * 2019-11-28 2020-03-24 达而观信息科技(上海)有限公司 金融类文档信息处理方法、装置、电子设备及存储介质
CN110955801A (zh) * 2019-12-06 2020-04-03 中国建设银行股份有限公司 一种cognos报表指标的知识图谱分析方法及系统
CN110955801B (zh) * 2019-12-06 2022-10-21 中国建设银行股份有限公司 一种cognos报表指标的知识图谱分析方法及系统
CN112951444A (zh) * 2019-12-11 2021-06-11 天津开心生活科技有限公司 一种文档处理方法以及系统
CN110968622B (zh) * 2019-12-20 2024-04-02 同济大学 一种会计报告定制方法、平台和终端
CN110968622A (zh) * 2019-12-20 2020-04-07 上海鲲贝管理咨询有限公司 一种会计报告定制方法、平台和终端
CN111368515B (zh) * 2020-03-02 2021-01-26 中国农业科学院农业信息研究所 基于pdf文档碎片化的行业动态交互式报告生成方法及系统
CN111368515A (zh) * 2020-03-02 2020-07-03 中国农业科学院农业信息研究所 基于pdf文档碎片化的行业动态交互式报告生成方法及系统
CN111753501B (zh) * 2020-07-07 2021-02-26 江苏中威科技软件系统有限公司 Ofd文件合并展现迅捷阅读的方法
CN111753501A (zh) * 2020-07-07 2020-10-09 江苏中威科技软件系统有限公司 Ofd文件合并展现迅捷阅读的方法
CN111950248B (zh) * 2020-08-10 2023-10-10 中国工商银行股份有限公司 基于xml的产品报告生成方法及系统
CN111950248A (zh) * 2020-08-10 2020-11-17 中国工商银行股份有限公司 基于xml的产品报告生成方法及系统
CN111966879A (zh) * 2020-08-17 2020-11-20 华南师范大学 一种疫情新闻信息提取方法及系统
CN111966879B (zh) * 2020-08-17 2023-08-08 华南师范大学 一种疫情新闻信息提取方法及系统
CN113221516B (zh) * 2020-09-14 2021-11-30 苏州七星天专利运营管理有限责任公司 一种文档辅助编辑的方法和系统
CN113221516A (zh) * 2020-09-14 2021-08-06 苏州七星天专利运营管理有限责任公司 一种文档辅助编辑的方法和系统
CN112149391B (zh) * 2020-09-28 2023-06-09 平安证券股份有限公司 信息处理方法、信息处理装置、终端设备及存储介质
CN112149391A (zh) * 2020-09-28 2020-12-29 平安证券股份有限公司 信息处理方法、信息处理装置、终端设备及存储介质
CN112149387A (zh) * 2020-09-28 2020-12-29 深圳壹账通智能科技有限公司 财务数据的可视化方法、装置、计算机设备及存储介质
CN112464668A (zh) * 2020-11-26 2021-03-09 南京数脉动力信息技术有限公司 一种提取智能家居行业动态信息的方法和系统
CN112906367A (zh) * 2021-02-08 2021-06-04 上海宏原信息科技有限公司 消费者文本的信息提取结构,标注方法和识别方法
CN112883081A (zh) * 2021-02-24 2021-06-01 江西数拓科技有限公司 一种抽检数据智能分析方法及系统
CN113268957A (zh) * 2021-03-19 2021-08-17 广州天越电子科技有限公司 一种实现智能生成标书文档的引用方法
CN112989782A (zh) * 2021-04-22 2021-06-18 北京三维天地科技股份有限公司 一种自动化模板配置及报告生成的方法
CN112989782B (zh) * 2021-04-22 2021-08-27 北京三维天地科技股份有限公司 一种自动化模板配置及报告生成的方法
CN113094498A (zh) * 2021-04-27 2021-07-09 中国美术学院 一种产品外观设计调研报告的生成方法和系统
CN115438142A (zh) * 2021-06-02 2022-12-06 戎易商智(北京)科技有限公司 一种对话式交互数据分析报告系统
CN113962210A (zh) * 2021-11-24 2022-01-21 黄河勘测规划设计研究院有限公司 基于nlp技术的报告智能编制方法
TWI818713B (zh) * 2021-12-13 2023-10-11 美商萬國商業機器公司 用於自動地將用語指派至文本文件之電腦實施方法、電腦程式產品及電腦系統
CN114490778A (zh) * 2022-02-15 2022-05-13 北京固加数字科技有限公司 一种金融研报自动生成系统及方法
CN115358201A (zh) * 2022-08-03 2022-11-18 浙商期货有限公司 一种期货领域的投研报告处理方法和系统
CN117172677A (zh) * 2023-06-19 2023-12-05 上海简答数据科技有限公司 一种基于自然语言处理的财务分析报告自动化处理方法、系统、装置和介质
CN117454864A (zh) * 2023-10-26 2024-01-26 中国人寿保险股份有限公司江苏省分公司 一种基于模板与数据融合的展示方法
CN117539875A (zh) * 2023-10-31 2024-02-09 广东北区教育科技有限公司 一种练习题库定期更新在线管理方法
CN117371748A (zh) * 2023-11-02 2024-01-09 广州尚捷智慧云网络科技有限公司 一种智能化产品数据管理系统及方法
CN117371748B (zh) * 2023-11-02 2024-05-14 广州尚捷智慧云网络科技有限公司 一种智能化产品数据管理系统及方法

Similar Documents

Publication Publication Date Title
CN106649223A (zh) 基于自然语言处理的金融报告自动生成方法
Maia et al. Mapping the literature on credit unions: a bibliometric investigation grounded in Scopus and Web of Science
Cecchini et al. Making words work: Using financial text as a predictor of financial events
Inmon et al. Tapping into unstructured data: Integrating unstructured data and textual analytics into business intelligence
Oliveras et al. Reporting intellectual capital in Spain
Tsui et al. Knowledge-based extraction of intellectual capital-related information from unstructured data
US20200050620A1 (en) Artificially intelligent system employing modularized and taxonomy-based classifications to generated and predict compliance-related content
US20150032645A1 (en) Computer-implemented systems and methods of performing contract review
CN109933796B (zh) 一种公告文本关键信息提取方法及设备
WO2004061714A1 (ja) 技術評価装置、技術評価プログラム、技術評価方法
Chou et al. Integrating XBRL data with textual information in Chinese: A semantic web approach
CN115238217B (zh) 一种公告文本中抽取数值信息的方法及终端机
Izza et al. What Scopus Metadata Says About 32 Years of Islamic Accounting
Djumalieva et al. Classifying occupations according to their skill requirements in job advertisements
Yen et al. A two-dimensional sentiment analysis of online public opinion and future financial performance of publicly listed companies
Bruce Enacting criticality in corporate disclosure communication: The genre of the fund manager commentary
Skačkauskienė Research on management theory: A development review and bibliometric analysis
Cooper et al. Text-mining 10-K (annual) reports: a guide for B2B marketing research
Guo et al. Digital transformation tone signal and the cost of equity: Evidence from Chinese listed companies
Grant et al. EDGAR extraction system: An automated approach to analyze employee stock option disclosures
Foltas Testing investment forecast efficiency with forecasting narratives
Chakraborty et al. Automating the process of taxonomy creation and comparison of taxonomy structures
Gram et al. Design and implementation of a historical german firm-level financial database
Rajpurohit et al. Corporate governance and quality of financial reporting in emerging markets: a structured literature review
Straub et al. AI for bureaucratic productivity: Measuring the potential of AI to help automate 143 million UK government transactions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170510