CN110490333A - 基于ai撰写的专业性内容智能化生成方法 - Google Patents

基于ai撰写的专业性内容智能化生成方法 Download PDF

Info

Publication number
CN110490333A
CN110490333A CN201910788872.1A CN201910788872A CN110490333A CN 110490333 A CN110490333 A CN 110490333A CN 201910788872 A CN201910788872 A CN 201910788872A CN 110490333 A CN110490333 A CN 110490333A
Authority
CN
China
Prior art keywords
data
text
content
professional content
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910788872.1A
Other languages
English (en)
Inventor
陈刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI YANSHU COMPUTER TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI YANSHU COMPUTER TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI YANSHU COMPUTER TECHNOLOGY Co Ltd filed Critical SHANGHAI YANSHU COMPUTER TECHNOLOGY Co Ltd
Priority to CN201910788872.1A priority Critical patent/CN110490333A/zh
Publication of CN110490333A publication Critical patent/CN110490333A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Creation or modification of classes or clusters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及基于AI撰写的专业性内容智能化生成方法,包括图表数据模块和内容推荐模块,图表数据模块进行需求拆解,利用大数据资源池进行数据处理,生成图表数据和数据指标结果,内容推荐模块学习海量专业内容和机器算法,生成推荐内容,用户直接选择推荐内容,将与图表数据整合产出完整专业性内容,用户未直接采用推荐内容时,将由用户进行手工补充修改,修改后的内容一方面反馈到内容结果库中作为下一步机器学习的调参条件,另一方面与图表数据整合生成完整专业性内容。本系统的创新功能主要在于系统可以自动化学习并生成专业性内容,既包括数据类,又涵盖文本类。对于结构化数据部分可以自动化进行数据及可视化图表处理;对于文本类专业内容,在学习海量样本的基础上,进行智能化撰写推荐。

Description

基于AI撰写的专业性内容智能化生成方法
技术领域
本发明涉及基于AI撰写的专业性内容智能化生成方法,属于智能化生成方法及系统技术领域。
背景技术
目前,自动化生成图表的系统平台有很多,比较成熟的如网易有数、镝数等,这些系统平台为客户提供交互式的可视化图表以及简易的图表数字化填空式结论,如增长50%,但均不能自动化生成非制式的建议性文本结论,如需求带动规模,市场趋于成熟等。
发明内容
本发明要解决的技术问题克服现有的缺陷,提供基于AI撰写的专业性内容智能化生成方法,通过运用机器学习和大数据处理技术使得数据分析报告制作这种繁琐的业务工作能够由计算机代替人工来完成,以解放人力,提高效率。通过构建数据分析报告智能化生成系统,实现了数据的采集分析、计算处理、图表展现、结论建议等诸多方面的自动化与智能化,将数据分析链路交由机器学习算法去实现,人类只需根据系统产出结果做出相应选择,在人机耦合中最大化的降低对人的依赖,最大化地提升人机耦合的效率和价值,可以有效解决背景技术中的问题。
为了解决上述技术问题,本发明提供了如下的技术方案:
基于AI撰写的专业性内容智能化生成方法,包括图表数据模块和内容推荐模块,图表数据模块根据客户的业务需求进行需求拆解,利用大数据资源池进行数据处理,生成图表数据和数据指标结果,内容推荐模块从大数据资源池中学习海量报告,内容推荐模块学习机器算法,输入到内容结果库,利用学习到的机器算法生成推荐内容,用户直接选择推荐内容,图表数据整合产出完整专业性内容;客户未直接采用推荐内容时,将由用户进行手工补充修改,修改后的结论一方面反馈到内容结果库中作为下一步机器学习的调参条件,另一方面与图表数据整合生成完整专业性内容。完整专业性内容将与图表数据进行模块组合生成最终报告,最终报告将回流补充到大数据资源池中。
进一步而言,系统按照拆解出来的业务需求,自动获取处理数据并对其进行图表可视化分析,生成具体的量化数据指标结果,如某零售市场的交易规模和增长比率。
进一步而言,系统根据用户的业务需求,检索学习相关主题的海量报告文本结论,利用自然语言处理的文本深度学习算法,生成结论建议匹配推荐给用户,用户可直接进行选择确认或者补充修改操作。
进一步而言,该系统为一个自学习系统,是一个不断自动训练调优的系统,用户对推荐内容所进行的补充修改操作将反馈给系统,调整关键词匹配中的权重系数等系统参数。最终的数据分析报告一方面对外输出给具体用户,另一方面对内存储并反馈回到机器学习样本。
进一步而言,内容推荐模块借助结果库进行数据匹配和需求拆解,通过文本预处理、文本识别和文本分类摘要提取实现文本的提取和分类,进行权重标签完成信息重组生成推荐内容,客户未采用推荐内容将进行补充修改,通过匹配权重系数调整,重新进行文本预处理、文本识别、文本分类摘要提取、权重标签和信息重组步骤,生成其他推荐内容。
进一步而言,文本分类摘要提取的文本分类算法利用利用RCNN模型,权重标签生成采用TF-IDF算法。
本发明有益效果:本发明所涉及的基于AI撰写的专业性内容智能化生成方法,可以自动化学习并生成专业性内容,既包括数据类,又涵盖文本类。对于结构化数据部分可以自动化进行数据及可视化图表处理;对于文本类专业内容,在学习海量样本的基础上,进行智能化撰写推荐,本系统根据报告主题和数据统计分析结果,在机器对海量数据分析报告结论的学习基础上,通过文本识别、摘要提取和文本分类算法(神经网络模型),对海量结论文本进行提取和分类,并利用词语权重算法(TF-IDF算法)添加权重标签,结合有效近义词典库,根据数据结果自动抽取调用生成多条推荐性结论,若用户直接选择某条建议,则直接产出最终数据分析报告;若用户未选择推荐建议或在推荐建议上进行了修改,则将用户补充修正后的结论建议反馈给系统,使得系统能够自动调整算法参数,从而强化系统的自我学习优化功能。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1是本发明基于AI撰写的专业性内容智能化生成方法流程图。
图2是本发明基于AI撰写的专业性内容智能化生成方法中内容推荐模块流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
如图1-图2所示,具体实施例一,基于AI撰写的专业性内容智能化生成方法,包括图表数据模块和内容推荐模块,图表数据模块根据客户的业务需求进行需求拆解,利用大数据资源池进行数据处理,生成图表数据和数据指标结果,内容推荐模块从大数据资源池中学习海量报告,内容推荐模块学习机器算法,输入到内容结果库,利用学习到的机器算法生成推荐内容,保证实现Al撰写,用户直接选择推荐内容,图表数据整合产出完整专业性内容;客户未直接采用推荐内容时,将由用户进行手工补充修改,修改后的结论一方面反馈到内容结果库中作为下一步机器学习的调参条件,另一方面与图表数据整合生成完整专业性内容,更好地满足客户要求,完整专业性内容将与图表数据进行模块组合生成最终报告,最终报告将回流补充到大数据资源池中,为机器学习算法提供学习和分析的资源。
具体实施例二,结合实施例一,系统按照拆解出来的业务需求,自动获取处理数据并对其进行图表可视化分析,生成具体的量化数据指标结果,如某零售市场的交易规模和增长比率,系统根据用户的业务需求,检索学习相关主题的海量报告文本结论,利用自然语言处理的文本深度学习算法,生成结论建议匹配推荐给用户,用户可直接进行选择确认或者补充修改操作,该系统为一个自学习系统,更好地实现Al结论撰写,是一个不断自动训练调优的系统,用户对推荐内容所进行的补充修改操作将反馈给系统,调整关键词匹配中的权重系数等系统参数,更改关键词的重要程度。最终的数据分析报告一方面对外输出给具体用户,直接交由客户进行选择或提出意见,另一方面对内存储并反馈回到机器学习样本,给机器进行学习,提高系统的自学能力,内容推荐模块借助结果库进行数据匹配和需求拆解,通过文本预处理、文本识别和文本分类摘要提取实现文本的提取和分类,进行权重标签完成信息重组生成推荐内容,客户未采用推荐内容将进行补充修改,通过匹配权重系数调整,调整权重的方式,重新进行文本预处理、文本识别、文本分类摘要提取、权重标签和信息重组步骤,可推荐出不同于上一次的建议和结论,生成其他推荐内容,文本分类摘要提取的文本分类算法利用RCNN模型,更好地提取文本关键词,权重标签生成采用TF-IDF算法,很好地完成权重工作。
工作原理:客户向系统反映需要,系统根据客户业务需求对需求进行拆解分析,并借助大量资源数据进行分析处理,做出数据图表和一些数据指标和结论建议,等待进一步分析整合,同时,机器学习算法也进行大量资源数据分析,并针对客户实际提交需求建议更进一步的分析客户需求,并做出一些推荐和建议,供客户进行选择参考,客户选择某条建议,系统将推荐内容与图表数据整合,直接产出最终数据报告;若客户提出异议,客户自行修改补充,系统将修改后的建议与图表数据整合,并产出最终数据报告,另一方面,则根据客户的修改建议重新分析客户需求,再产出新的推荐和建议,更易于推荐出满足客户需求的建议。
以上为本发明较佳的实施方式,本发明所属领域的技术人员还能够对上述实施方式进行变更和修改,因此,本发明并不局限于上述的具体实施方式,凡是本领域技术人员在本发明的基础上所作的任何显而易见的改进、替换或变型均属于本发明的保护范围。

Claims (8)

1.基于AI撰写的专业性内容智能化生成方法,包括图表数据模块和内容推荐模块,其特征在于:图表数据模块根据客户的业务需求进行需求拆解,利用大数据资源池进行数据处理,生成图表数据和数据指标结果,内容推荐模块从大数据资源池中学习海量报告,内容推荐模块学习机器算法,输入到内容结果库,利用学习到的机器算法生成推荐内容,用户直接选择推荐内容,将与图表数据整合产出完整专业性内容,客户未直接采用推荐内容时,将由用户进行手工补充修改,修改后的结论一方面反馈到内容结果库中作为下一步机器学习的调参条件,另一方面与图表数据整合生成完整专业性内容。
2.完整专业性内容将与图表数据进行模块组合生成最终报告,最终报告将回流补充到大数据资源池中。
3.根据权利要求1所述的基于AI撰写的专业性内容智能化生成方法,其特征在于:系统按照拆解出来的业务需求,自动获取处理数据并对其进行图表可视化分析,生成具体的量化数据指标结果,如某零售市场的交易规模和增长比率。
4.根据权利要求1所述的基于AI撰写的专业性内容智能化生成方法,其特征在于:系统根据用户的业务需求,检索学习相关主题的海量报告文本结论,利用自然语言处理的文本深度学习算法,生成结论建议匹配推荐给用户,用户可直接进行选择确认或者补充修改操作。
5.根据权利要求1所述的基于AI撰写的专业性内容智能化生成方法,其特征在于:该系统为一个自学习系统,是一个不断自动训练调优的系统,用户对推荐内容所进行的补充修改操作将反馈给系统,调整关键词匹配中的权重系数等系统参数。
6.最终的数据分析报告一方面对外输出给具体用户,另一方面对内存储并反馈回到机器学习样本。
7.根据权利要求1所述的基于AI撰写的专业性内容智能化生成方法,其特征在于:内容推荐模块借助结果库进行数据匹配和需求拆解,通过文本预处理、文本识别和文本分类摘要提取实现文本的提取和分类,进行权重标签完成信息重组生成推荐内容,客户未采用推荐内容将进行补充修改,通过匹配权重系数调整,重新进行文本预处理、文本识别、文本分类摘要提取、权重标签和信息重组步骤,生成其他推荐内容。
8.根据权利要求5所述的基于AI撰写的专业性内容智能化生成方法,其特征在于:文本分类摘要提取的文本分类算法利用RCNN模型,权重标签生成采用TF-IDF算法。
CN201910788872.1A 2019-08-26 2019-08-26 基于ai撰写的专业性内容智能化生成方法 Pending CN110490333A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910788872.1A CN110490333A (zh) 2019-08-26 2019-08-26 基于ai撰写的专业性内容智能化生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910788872.1A CN110490333A (zh) 2019-08-26 2019-08-26 基于ai撰写的专业性内容智能化生成方法

Publications (1)

Publication Number Publication Date
CN110490333A true CN110490333A (zh) 2019-11-22

Family

ID=68554002

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910788872.1A Pending CN110490333A (zh) 2019-08-26 2019-08-26 基于ai撰写的专业性内容智能化生成方法

Country Status (1)

Country Link
CN (1) CN110490333A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112395416A (zh) * 2020-11-11 2021-02-23 湖南正宇软件技术开发有限公司 提案处理方法、装置、计算机设备和存储介质
CN112818651A (zh) * 2021-01-21 2021-05-18 北京明略软件系统有限公司 基于企业微信的智能推荐撰写方法及系统
CN112883168A (zh) * 2021-03-19 2021-06-01 数预智能科技(上海)有限公司 一种基于数据的智能解读方法
CN117763160A (zh) * 2023-12-11 2024-03-26 江苏思行达信息技术有限公司 一种基于知识图谱的电力营销政策文件分析方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101345691A (zh) * 2007-07-10 2009-01-14 朱东华 数据分析报告智能化生成并通过无线有线技术收发的方法
US20090112832A1 (en) * 2007-10-30 2009-04-30 International Business Machines Corporation Intelligent content assistance
CN109117485A (zh) * 2018-09-06 2019-01-01 北京京东尚科信息技术有限公司 祝福语文本生成方法和装置、计算机可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101345691A (zh) * 2007-07-10 2009-01-14 朱东华 数据分析报告智能化生成并通过无线有线技术收发的方法
US20090112832A1 (en) * 2007-10-30 2009-04-30 International Business Machines Corporation Intelligent content assistance
CN109117485A (zh) * 2018-09-06 2019-01-01 北京京东尚科信息技术有限公司 祝福语文本生成方法和装置、计算机可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112395416A (zh) * 2020-11-11 2021-02-23 湖南正宇软件技术开发有限公司 提案处理方法、装置、计算机设备和存储介质
CN112818651A (zh) * 2021-01-21 2021-05-18 北京明略软件系统有限公司 基于企业微信的智能推荐撰写方法及系统
CN112883168A (zh) * 2021-03-19 2021-06-01 数预智能科技(上海)有限公司 一种基于数据的智能解读方法
CN117763160A (zh) * 2023-12-11 2024-03-26 江苏思行达信息技术有限公司 一种基于知识图谱的电力营销政策文件分析方法

Similar Documents

Publication Publication Date Title
US11500818B2 (en) Method and system for large scale data curation
CN106716416B (zh) 数据检索装置及记录介质
CN110490333A (zh) 基于ai撰写的专业性内容智能化生成方法
JPH0877010A (ja) データ分析方法および装置
CN112001166B (zh) 面向政务咨询服务的智能问答句子对语义匹配方法和装置
CN110489749B (zh) 一种智能办公自动化系统的业务流程优化方法
CN112506921B (zh) 一种基于数据中台的多源异构指标多维自助分析方法
CN115547466B (zh) 基于大数据的医疗机构登记评审系统及其方法
WO2005065392A2 (en) System and method for adaptive decision making analysis and assessment
CN109376219A (zh) 文本属性字段的匹配方法、装置、电子设备及存储介质
Bhatia et al. Machine Learning with R Cookbook: Analyze data and build predictive models
CN113515699B (zh) 信息推荐方法及装置、计算机可读存储介质、处理器
CN113722443A (zh) 一种融合文本相似度和协同过滤的标签推荐方法和系统
CN109766368A (zh) 一种基于Hive的数据查询多类型视图产出系统及方法
CN118227106A (zh) 代码补全方法、装置、电子设备和介质
CN117876104B (zh) 一种基于ai语言模型的智能信贷管控方法及系统
CN118245022B (zh) 基于低代码平台的半自动需求建模方法及系统
JP7185888B1 (ja) 情報処理システム、情報処理方法及び情報処理プログラム
CN118152430B (zh) 一种基于大语言模型的养殖场数据指标分析方法、装置以及设备
CN117350526B (zh) 一种自助服务事项智能排序方法、装置、设备及存储介质
US20240232937A1 (en) System and methods utilizing generative ai for optimizing tv ads, online videos, augmented reality & virtual reality marketing, and other audiovisual content
CN118780895A (zh) 基于LLaVA大模型跨模态特征融合的农产品推荐方法
Serrato-Fonseca et al. ACAS: A comprehensive framework for automatic ab-stract screening in systematic literature reviews
CN116384830A (zh) 人力资源评价方法、装置、电子设备和介质
CN117519702A (zh) 基于低代码配置化的搜索页面设计方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191122

RJ01 Rejection of invention patent application after publication