CN115686303A - 一种结构化文档生成方法、系统、计算机设备及介质 - Google Patents
一种结构化文档生成方法、系统、计算机设备及介质 Download PDFInfo
- Publication number
- CN115686303A CN115686303A CN202211091233.8A CN202211091233A CN115686303A CN 115686303 A CN115686303 A CN 115686303A CN 202211091233 A CN202211091233 A CN 202211091233A CN 115686303 A CN115686303 A CN 115686303A
- Authority
- CN
- China
- Prior art keywords
- file
- files
- function
- target
- structured document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 230000010354 integration Effects 0.000 claims abstract description 165
- 230000006870 function Effects 0.000 claims description 176
- 239000013598 vector Substances 0.000 claims description 50
- 239000011159 matrix material Substances 0.000 claims description 15
- 230000011218 segmentation Effects 0.000 claims description 15
- 239000003086 colorant Substances 0.000 claims description 14
- 238000009434 installation Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种结构化文档生成方法、系统、计算机设备及介质,方法包括:当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单;接收针对功能选择菜单的选择指令,并根据选择指令确定目标功能标识符;当目标功能标识符为多文件整合策略的功能标识符时,根据多文件整合策略将多个文件进行整合,生成目标结构化文档。由于本申请在用户选中多个文件时会自动提供一个预先安装的文件数据整合程序对应的功能选择菜单,当用户在该功能选择菜单中选择多文件整合策略时,可基于该策略快速将用户选中的多个文件整合为一个结构化文档,从而大大降低了文件整合时间,进而提升了文件整合效率。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种结构化文档生成方法、系统、计算机设备及介质。
背景技术
随着智能终端的不断发展,用户更热衷于采用智能终端进行办公,例如采用智能终端记录会议内容、课程内容以及工作上的工作内容。随着时间的不断推移,在记录过程中可能会建立大量文件。当用户想在记录的大量文件中查阅内容时,需要花费大量的时间逐一打开文件进行阅览,因此如何避免频繁手动逐一打开文件成了亟需解决的问题。
在现有技术中,为了避免手动逐一打开文件进行预览,用户通过新建一个内容为空的文档,然后用户需要手动将大量文件中每个文件的内容逐一复制到新建的文档中,最后用户为每次复制的内容添加标题以生成整个文档。由于现有技术中需要用户手动逐一复制每个文件的内容到新建的文档中,该过程需要花费大量的精力,浪费大量时间,从而降低了文件数据整合效率。
发明内容
基于此,有必要针对文件数据整合效率低的问题,提供一种结构化文档生成方法、系统、计算机设备及介质。
一种结构化文档生成方法,方法包括:当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单;接收针对功能选择菜单的选择指令,并根据选择指令确定目标功能标识符;当目标功能标识符为多文件整合策略的功能标识符时,根据多文件整合策略将多个文件进行整合,生成目标结构化文档。
在其中一个实施例中,展示预先安装的文件数据整合程序对应的功能选择菜单,包括:对选中的多个文件填充预设颜色参数,得到填充色彩的多个文件;获取预先安装的文件数据整合程序的功能菜单树;根据功能菜单树中的各功能节点信息和预设图形状构建功能选择菜单;将功能选择菜单置于填充色彩的多个文件中目标文件的顶层,并实时计算鼠标光标与功能选择菜单之间的目标距离;根据目标距离修改功能选择菜单的可见度,并基于修改后的可见度将功能选择菜单进行展示。
在其中一个实施例中,根据多文件整合策略将多个文件进行整合,生成目标结构化文档,包括:确定文件信息整合模板;获取多个文件中每个文件的文件类型,并根据每个文件的文件类型确定每个文件的文件内容读取策略;基于每个文件的文件内容读取策略读取每个文件的文件内容;获取多个文件中每个文件的优先级;基于优先级的高低顺序依次将每个文件的文件内容填充至文件信息整合模板中,生成目标结构化文档。
在其中一个实施例中,获取多个文件中每个文件的优先级,包括:获取多个文件中每个文件的创建时间;基于每个文件的创建时间确定每个文件的优先级;或者,计算多个文件中每个文件的业务权重值;基于每个文件的业务权重值确定每个文件的优先级。
在其中一个实施例中,计算多个文件中每个文件的业务权重值,包括:对每个文件的文件内容进行分词处理,得到每个文件的分词结果;采用关键词抽取算法在每个文件的分词结果中抽取预设业务信息对应的关键词,得到每个文件的关键词集合;将每个文件的关键词集合输入预先训练的词向量模型中,输出每个文件的词向量序列;根据每个文件的词向量序列构建词向量矩阵,得到每个文件的词向量矩阵;创建每个文件的词向量矩阵中第一个元素与最后一个元素的第一线段,并计算第一线段上所有元素的第一均值向量,并创建与第一线段相交且垂直的第二线段,并计算第二线段上所有元素的第二均值向量;将第一均值向量与第二均值向量进行加权求和取平均值,得到每个文件的业务权重值。
在其中一个实施例中,确定文件信息整合模板,包括:展示多个文件信息整合模板界面;接收针对多个文件信息整合模板界面的选择指令,根据选择指令生成模板标识符;根据模板标识符在预设文件信息整合模板数据库中映射出目标文件信息整合模板。
在其中一个实施例中,在接收针对多个文件的选中指令之前,还包括:获取文件数据整合程序安装包;接收针对文件数据整合程序安装包的安装指令;基于安装指令将文件数据整合程序安装包进行自动安装,得到预先安装的文件数据整合程序。
一种结构化文档生成系统,系统包括:功能选择菜单展示模块,用于当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单;目标功能标识符确定模块,用于接收针对功能选择菜单的选择指令,并根据选择指令确定目标功能标识符;目标结构化文档生成模块,用于当目标功能标识符为多文件整合策略的功能标识符时,根据多文件整合策略将多个文件进行整合,生成目标结构化文档。
一种计算机设备,包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述结构化文档生成方法的步骤。
一种存储有计算机可读指令的介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述结构化文档生成方法的步骤。
上述结构化文档生成方法、系统、设备和介质,结构化文档生成系统首先当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单,然后接收针对功能选择菜单的选择指令,并根据选择指令确定目标功能标识符,最后当目标功能标识符为多文件整合策略的功能标识符时,根据多文件整合策略将多个文件进行整合,生成目标结构化文档。由于本申请在用户选中多个文件时会自动提供一个预先安装的文件数据整合程序对应的功能选择菜单,当用户在该功能选择菜单中选择多文件整合策略时,可基于该策略快速将用户选中的多个文件整合为一个结构化文档,从而大大降低了文件整合时间,进而提升了文件整合效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1为本申请一个实施例中提供的结构化文档生成方法的实施环境图;
图2为本申请一个实施例中计算机设备的内部结构示意图;
图3为本申请一个实施例中提供的结构化文档生成方法的方法示意图;
图4为本申请一个实施例中提供的用户交互界面示意图;
图5为本申请一个实施例中提供的另一个用户交互界面示意图;
图6为本申请一个实施例中提供的将多个文件进行整合的过程示意框图;
图7为本申请一个实施例中提供的另一个用户交互界面示意图;
图8是本申请另一个实施例中提供的结构化文档生成方法的方法示意图;
图9是本申请实施例提供的一种结构化文档生成系统的系统结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。
图1为一个实施例中提供的结构化文档生成方法的实施环境图,如图1所示,在该实施环境中,包括服务端110以及客户端120。
服务端110可以为服务器,该服务器具体可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,例如为运行结构化文档生成的服务器设备。服务端110运行预先安装的文件数据整合程序,客户端120连接服务端110,客户端120当接收到针对多个文件的选中指令时,客户端120展示预先安装的文件数据整合程序对应的功能选择菜单,客户端120接收针对功能选择菜单的选择指令,并根据选择指令确定目标功能标识符,当目标功能标识符为多文件整合策略的功能标识符时,客户端120根据多文件整合策略将多个文件进行整合,生成目标结构化文档。
需要说明的是,客户端120可为智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。服务端110以及客户端120可以通过蓝牙、USB(Universal Serial Bus,通用串行总线)或者其他通讯连接方式进行连接,本发明在此不做限制。
图2为一个实施例中计算机设备的内部结构示意图。如图2所示,该计算机设备包括通过系统总线连接的处理器、介质、存储器和网络接口。其中,该计算机设备的介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种结构化文档生成方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种结构化文档生成方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。其中,介质为一种可读的存储介质。
下面将结合附图3-8,对本申请实施例提供的结构化文档生成方法进行详细介绍。该方法可依赖于计算机程序实现,可运行于基于冯诺依曼体系的结构化文档生成系统上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大文件数据整合技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
请参见图3,为本申请实施例提供了一种结构化文档生成方法的流程示意图。如图3所示,本申请实施例的方法可以包括以下步骤:
S101,当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单;
其中,多个文件为待整合的多个零散文件,多个零散文件是提前生成并保存的,该文件可以是提前在本地终端生成保存的,也可以是从云端或线上下载保存的。多个文件可以全部是文档类型,也可以是文档和图片混合类型,还可以是其他类型的文件。选中指令是用户通过鼠标光标生成的。预先安装的文件数据整合程序是对多个零散文件进行操作的应用程序,该应用程序包括多文件整合策略、多文件复制策略、多文件发送策略等。功能选择菜单是多个策略对应的功能描述文本组成的策略列表。
在本申请实施例中,在接收到针对多个文件的选中指令之前,还需要安装文件数据整合程序。首先获取文件数据整合程序安装包,然后接收针对文件数据整合程序安装包的安装指令,最后基于安装指令将文件数据整合程序安装包进行自动安装,得到预先安装的文件数据整合程序。
例如,用户下载并获取到文件数据整合程序安装包,然后点击安装包进行自动安装,安装完成后可得到文件数据整合程序,该程序安装成功后文件名称可以为one-key2word.exe,one-key为一键的意思,具体可以是一键操作。而2word是“to word”的缩写形式,组合起来one-key2word可以理解为“一键转换为word”,即需要把一堆选中的文件一键转成word文档。
在一种可能的实现方式中,在接收到针对多个文件的选中指令时,首先对选中的多个文件填充预设颜色参数,得到填充色彩的多个文件,再获取预先安装的文件数据整合程序的功能菜单树,然后根据功能菜单树中的各功能节点信息和预设图形状构建功能选择菜单,再将功能选择菜单置于填充色彩的多个文件中目标文件的顶层,并实时计算鼠标光标与功能选择菜单之间的目标距离,最后根据目标距离修改功能选择菜单的可见度,并基于修改后的可见度将功能选择菜单进行展示。
具体的,目标文件可以是多个文件中的任意一个文件,也可以是距离光标最近的一个文件,还可以是按照文件的顺序进行编号后的最大编号文件或最小编号文件。
例如图4所示,用户通过鼠标光标对终端界面上显示的“文件1、文件2以及文件3”进行选中后,“文件1、文件2以及文件3”可填充灰度颜色,实际场景中颜色可以是其他颜色参数。用户进行选中时,可逐一对每个文件进行点击,也可以通过框选方式实现快速选中,颜色填充完毕后,终端构建功能选择菜单,并将功能选择菜单置于填充色彩的多个文件中目标文件的顶层,例如图5所示。
需要说明的是,功能选择菜单的可见度是随着鼠标光标的变化而呈现颜色由浅到深进行变化的,即鼠标光标离功能选择菜单越近,功能选择菜单的可见度越清晰,鼠标光标离功能选择菜单越远,功能选择菜单的可见度越模糊。
S102,接收针对功能选择菜单的选择指令,并根据选择指令确定目标功能标识符;
其中,选择指令是用户对图5中展示的功能选择菜单中功能描述文本选择后生成的。功能描述文本例如“转发”、“收藏”、“多选”以及“一键转换”等,每个功能描述文本对应一个功能标识符。
在本申请实施例中,用户终端接收针对功能选择菜单的选择指令,然后根据选择指令确定目标功能标识符。
在一种可能的实现方式中,用户通过鼠标光标点击功能描述文本为“一键转换”,点击后触发脚本程序执行以提交用户选择请求数据,用户终端在请求数据中获取功能标识符作为目标功能标识符,此时的目标功能标识符为“一键转换”的功能标识符。
进一步地,“一键转换”的功能标识符对应多文件整合策略的标识符,多文件整合策略是需要将多个文件整合为目标结构化文档。
S103,当目标功能标识符为多文件整合策略的功能标识符时,根据多文件整合策略将多个文件进行整合,生成目标结构化文档。
其中,目标结构化文档是将多个文件的内容保存在一个文档中并进行结构化处理后生成的。结构化处理是按照预先设定的布局参数和排版参数,并结合预设结构化服务函数进行数据结构化的过程。
在本申请实施例中,在根据多文件整合策略将多个文件进行整合,生成目标结构化文档时,首先确定文件信息整合模板,然后获取多个文件中每个文件的文件类型,并根据每个文件的文件类型确定每个文件的文件内容读取策略,其次基于每个文件的文件内容读取策略读取每个文件的文件内容,再获取多个文件中每个文件的优先级,最后基于优先级的高低顺序依次将每个文件的文件内容填充至文件信息整合模板中,生成目标结构化文档。
在一种可能的实现方式中,例如图6所示,图6是将多个文件进行整合的过程示意框图,多个文件进行整合的过程是基于首先步骤S101中one-key2word.exe程序进行的,首先确定一个文件信息整合模板,并获取鼠标选中的文件列表,然后识别文件列表中每个文档类型,根据不同的文档类型获取每个文档的文档内容读取策略,其中文档内容读取策略如下:如果是txt类型,则直接读取txt的内容;如图是docx类型的,则利用市场上的poi工具读取内容;如果是png类型的,则直接把图片拷贝至word中;如果是jpeg类型的,则直接把图片拷贝至word中;其次获取多个文件中每个文件的优先级,最后基于优先级的高低顺序依次将每个文件的文件内容填充至文件信息整合模板中,最后生成目标结构化文档进行保存。
具体的,例如图7所示,在确定文件信息整合模板时,首先展示多个文件信息整合模板界面,然后接收针对多个文件信息整合模板界面的选择指令,根据选择指令生成模板标识符,最后根据模板标识符在预设文件信息整合模板数据库中映射出目标文件信息整合模板。
具体的,目标文件信息整合模板是预设文件信息整合模板库中存在与模板标识符所相同标识的模板。
具体的,在获取多个文件中每个文件的优先级时,首先获取多个文件中每个文件的创建时间,然后基于每个文件的创建时间确定每个文件的优先级。或者首先计算多个文件中每个文件的业务权重值,然后基于每个文件的业务权重值确定每个文件的优先级。
具体的,在计算多个文件中每个文件的业务权重值时,首先对每个文件的文件内容进行分词处理,得到每个文件的分词结果,然后采用关键词抽取算法在每个文件的分词结果中抽取预设业务信息对应的关键词,得到每个文件的关键词集合,再将每个文件的关键词集合输入预先训练的词向量模型中,输出每个文件的词向量序列,其次根据每个文件的词向量序列构建词向量矩阵,得到每个文件的词向量矩阵,再创建每个文件的词向量矩阵中第一个元素与最后一个元素的第一线段,并计算第一线段上所有元素的第一均值向量,并创建与第一线段相交且垂直的第二线段,并计算第二线段上所有元素的第二均值向量,最后将第一均值向量与第二均值向量进行加权求和取平均值,得到每个文件的业务权重值。
例如,用户通过鼠标光标将所有文件全部选中,在当所有文件全部选中后用户在弹出的功能选择菜单中可以看到“一键转换”的描述文本按钮,然后接着鼠标左键点击一下“一键转换”按钮,即可迅速转出一个word文档。
在本申请实施例中,结构化文档生成系统首先当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单,然后接收针对功能选择菜单的选择指令,并根据选择指令确定目标功能标识符,最后当目标功能标识符为多文件整合策略的功能标识符时,根据多文件整合策略将多个文件进行整合,生成目标结构化文档。由于本申请在用户选中多个文件时会自动提供一个预先安装的文件数据整合程序对应的功能选择菜单,当用户在该功能选择菜单中选择多文件整合策略时,可基于该策略快速将用户选中的多个文件整合为一个结构化文档,从而大大降低了文件整合时间,进而提升了文件整合效率。
请参见图8,为本申请实施例提供了一种结构化文档生成方法的流程示意图。如图8所示,本申请实施例的方法可以包括以下步骤:
S201,当接收到针对多个文件的选中指令时,对选中的多个文件填充预设颜色参数,得到填充色彩的多个文件;
S202,获取预先安装的文件数据整合程序的功能菜单树;
S203,根据功能菜单树中的各功能节点信息和预设图形状构建功能选择菜单;
S204,将功能选择菜单置于填充色彩的多个文件中目标文件的顶层,并实时计算鼠标光标与功能选择菜单之间的目标距离;
S205,根据目标距离修改功能选择菜单的可见度,并基于修改后的可见度将功能选择菜单进行展示;
S206,接收针对功能选择菜单的选择指令,并根据选择指令确定目标功能标识符;
S207,确定文件信息整合模板,获取多个文件中每个文件的文件类型,并根据每个文件的文件类型确定每个文件的文件内容读取策略;
S208,基于每个文件的文件内容读取策略读取每个文件的文件内容,获取多个文件中每个文件的优先级;
S209,基于优先级的高低顺序依次将每个文件的文件内容填充至文件信息整合模板中,生成目标结构化文档。
在本申请实施例中,结构化文档生成系统首先当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单,然后接收针对功能选择菜单的选择指令,并根据选择指令确定目标功能标识符,最后当目标功能标识符为多文件整合策略的功能标识符时,根据多文件整合策略将多个文件进行整合,生成目标结构化文档。由于本申请在用户选中多个文件时会自动提供一个预先安装的文件数据整合程序对应的功能选择菜单,当用户在该功能选择菜单中选择多文件整合策略时,可基于该策略快速将用户选中的多个文件整合为一个结构化文档,从而大大降低了文件整合时间,进而提升了文件整合效率。
下述为本发明系统实施例,可以用于执行本发明方法实施例。对于本发明系统实施例中未披露的细节,请参照本发明方法实施例。
请参见图9,其示出了本发明一个示例性实施例提供的结构化文档生成系统的结构示意图。该结构化文档生成系统可以通过软件、硬件或者两者的结合实现成为设备的全部或一部分。该系统1包括功能选择菜单展示模块10、目标功能标识符确定模块20、目标结构化文档生成模块30。
功能选择菜单展示模块10,用于当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单;
目标功能标识符确定模块20,用于接收针对功能选择菜单的选择指令,并根据选择指令确定目标功能标识符;
目标结构化文档生成模块30,用于当目标功能标识符为多文件整合策略的功能标识符时,根据多文件整合策略将多个文件进行整合,生成目标结构化文档。
需要说明的是,上述实施例提供的结构化文档生成系统在执行结构化文档生成方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的结构化文档生成系统与结构化文档生成方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请实施例中,结构化文档生成系统首先当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单,然后接收针对功能选择菜单的选择指令,并根据选择指令确定目标功能标识符,最后当目标功能标识符为多文件整合策略的功能标识符时,根据多文件整合策略将多个文件进行整合,生成目标结构化文档。由于本申请在用户选中多个文件时会自动提供一个预先安装的文件数据整合程序对应的功能选择菜单,当用户在该功能选择菜单中选择多文件整合策略时,可基于该策略快速将用户选中的多个文件整合为一个结构化文档,从而大大降低了文件整合时间,进而提升了文件整合效率。
在一个实施例中,提出了一种计算机设备,设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单;
接收针对所述功能选择菜单的选择指令,并根据所述选择指令确定目标功能标识符;
当所述目标功能标识符为多文件整合策略的功能标识符时,根据所述多文件整合策略将所述多个文件进行整合,生成目标结构化文档。
在一个实施例中,处理器执行展示预先安装的文件数据整合程序对应的功能选择菜单时,具体执行以下操作:
对选中的多个文件填充预设颜色参数,得到填充色彩的多个文件;
获取预先安装的文件数据整合程序的功能菜单树;
根据所述功能菜单树中的各功能节点信息和预设图形状构建功能选择菜单;
将所述功能选择菜单置于所述填充色彩的多个文件中目标文件的顶层,并实时计算鼠标光标与所述功能选择菜单之间的目标距离;
根据所述目标距离修改所述功能选择菜单的可见度,并基于修改后的可见度将所述功能选择菜单进行展示。
在一个实施例中,处理器执行根据所述多文件整合策略将所述多个文件进行整合,生成目标结构化文档时,具体执行以下操作:
确定文件信息整合模板;
获取所述多个文件中每个文件的文件类型,并根据所述每个文件的文件类型确定所述每个文件的文件内容读取策略;
基于所述每个文件的文件内容读取策略读取所述每个文件的文件内容;
获取所述多个文件中每个文件的优先级;
基于所述优先级的高低顺序依次将所述每个文件的文件内容填充至所述文件信息整合模板中,生成目标结构化文档。
在一个实施例中,处理器执行获取所述多个文件中每个文件的优先级时,具体执行以下操作:
获取所述多个文件中每个文件的创建时间;
基于所述每个文件的创建时间确定所述每个文件的优先级;
或者,
计算所述多个文件中每个文件的业务权重值;
基于所述每个文件的业务权重值确定所述每个文件的优先级。
在一个实施例中,处理器在执行计算所述多个文件中每个文件的业务权重值时,具体执行以下操作:
对所述每个文件的文件内容进行分词处理,得到每个文件的分词结果;
采用关键词抽取算法在每个文件的分词结果中抽取预设业务信息对应的关键词,得到每个文件的关键词集合;
将每个文件的关键词集合输入预先训练的词向量模型中,输出所述每个文件的词向量序列;
根据所述每个文件的词向量序列构建词向量矩阵,得到每个文件的词向量矩阵;
创建每个文件的词向量矩阵中第一个元素与最后一个元素的第一线段,并计算所述第一线段上所有元素的第一均值向量,并创建与所述第一线段相交且垂直的第二线段,并计算所述第二线段上所有元素的第二均值向量;
将所述第一均值向量与所述第二均值向量进行加权求和取平均值,得到每个文件的业务权重值。
在一个实施例中,处理器执行确定文件信息整合模板时,具体执行以下操作:
展示多个文件信息整合模板界面;
接收针对所述多个文件信息整合模板界面的选择指令,根据所述选择指令生成模板标识符;
根据所述模板标识符在预设文件信息整合模板数据库中映射出目标文件信息整合模板。
在一个实施例中,处理器还执行以下操作:
获取文件数据整合程序安装包;
接收针对所述文件数据整合程序安装包的安装指令;
基于所述安装指令将所述文件数据整合程序安装包进行自动安装,得到预先安装的文件数据整合程序。
在本申请实施例中,结构化文档生成系统首先当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单,然后接收针对功能选择菜单的选择指令,并根据选择指令确定目标功能标识符,最后当目标功能标识符为多文件整合策略的功能标识符时,根据多文件整合策略将多个文件进行整合,生成目标结构化文档。由于本申请在用户选中多个文件时会自动提供一个预先安装的文件数据整合程序对应的功能选择菜单,当用户在该功能选择菜单中选择多文件整合策略时,可基于该策略快速将用户选中的多个文件整合为一个结构化文档,从而大大降低了文件整合时间,进而提升了文件整合效率。
在一个实施例中,提出了一种存储有计算机可读指令的介质,该计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行以下步骤:
当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单;
接收针对所述功能选择菜单的选择指令,并根据所述选择指令确定目标功能标识符;
当所述目标功能标识符为多文件整合策略的功能标识符时,根据所述多文件整合策略将所述多个文件进行整合,生成目标结构化文档。
在一个实施例中,处理器执行展示预先安装的文件数据整合程序对应的功能选择菜单时,具体执行以下操作:
对选中的多个文件填充预设颜色参数,得到填充色彩的多个文件;
获取预先安装的文件数据整合程序的功能菜单树;
根据所述功能菜单树中的各功能节点信息和预设图形状构建功能选择菜单;
将所述功能选择菜单置于所述填充色彩的多个文件中目标文件的顶层,并实时计算鼠标光标与所述功能选择菜单之间的目标距离;
根据所述目标距离修改所述功能选择菜单的可见度,并基于修改后的可见度将所述功能选择菜单进行展示。
在一个实施例中,处理器执行根据所述多文件整合策略将所述多个文件进行整合,生成目标结构化文档时,具体执行以下操作:
确定文件信息整合模板;
获取所述多个文件中每个文件的文件类型,并根据所述每个文件的文件类型确定所述每个文件的文件内容读取策略;
基于所述每个文件的文件内容读取策略读取所述每个文件的文件内容;
获取所述多个文件中每个文件的优先级;
基于所述优先级的高低顺序依次将所述每个文件的文件内容填充至所述文件信息整合模板中,生成目标结构化文档。
在一个实施例中,处理器执行获取所述多个文件中每个文件的优先级时,具体执行以下操作:
获取所述多个文件中每个文件的创建时间;
基于所述每个文件的创建时间确定所述每个文件的优先级;
或者,
计算所述多个文件中每个文件的业务权重值;
基于所述每个文件的业务权重值确定所述每个文件的优先级。
在一个实施例中,处理器在执行计算所述多个文件中每个文件的业务权重值时,具体执行以下操作:
对所述每个文件的文件内容进行分词处理,得到每个文件的分词结果;
采用关键词抽取算法在每个文件的分词结果中抽取预设业务信息对应的关键词,得到每个文件的关键词集合;
将每个文件的关键词集合输入预先训练的词向量模型中,输出所述每个文件的词向量序列;
根据所述每个文件的词向量序列构建词向量矩阵,得到每个文件的词向量矩阵;
创建每个文件的词向量矩阵中第一个元素与最后一个元素的第一线段,并计算所述第一线段上所有元素的第一均值向量,并创建与所述第一线段相交且垂直的第二线段,并计算所述第二线段上所有元素的第二均值向量;
将所述第一均值向量与所述第二均值向量进行加权求和取平均值,得到每个文件的业务权重值。
在一个实施例中,处理器执行确定文件信息整合模板时,具体执行以下操作:
展示多个文件信息整合模板界面;
接收针对所述多个文件信息整合模板界面的选择指令,根据所述选择指令生成模板标识符;
根据所述模板标识符在预设文件信息整合模板数据库中映射出目标文件信息整合模板。
在一个实施例中,处理器还执行以下操作:
获取文件数据整合程序安装包;
接收针对所述文件数据整合程序安装包的安装指令;
基于所述安装指令将所述文件数据整合程序安装包进行自动安装,得到预先安装的文件数据整合程序。
在本申请实施例中,结构化文档生成系统首先当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单,然后接收针对功能选择菜单的选择指令,并根据选择指令确定目标功能标识符,最后当目标功能标识符为多文件整合策略的功能标识符时,根据多文件整合策略将多个文件进行整合,生成目标结构化文档。由于本申请在用户选中多个文件时会自动提供一个预先安装的文件数据整合程序对应的功能选择菜单,当用户在该功能选择菜单中选择多文件整合策略时,可基于该策略快速将用户选中的多个文件整合为一个结构化文档,从而大大降低了文件整合时间,进而提升了文件整合效率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性介质,或随机存储记忆体(RandomAccess Memory,RAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种结构化文档生成方法,其特征在于,所述方法包括:
当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单;
接收针对所述功能选择菜单的选择指令,并根据所述选择指令确定目标功能标识符;
当所述目标功能标识符为多文件整合策略的功能标识符时,根据所述多文件整合策略将所述多个文件进行整合,生成目标结构化文档。
2.根据权利要求1所述的方法,其特征在于,所述展示预先安装的文件数据整合程序对应的功能选择菜单,包括:
对选中的多个文件填充预设颜色参数,得到填充色彩的多个文件;
获取预先安装的文件数据整合程序的功能菜单树;
根据所述功能菜单树中的各功能节点信息和预设图形状构建功能选择菜单;
将所述功能选择菜单置于所述填充色彩的多个文件中目标文件的顶层,并实时计算鼠标光标与所述功能选择菜单之间的目标距离;
根据所述目标距离修改所述功能选择菜单的可见度,并基于修改后的可见度将所述功能选择菜单进行展示。
3.根据权利要求1所述的方法,其特征在于,所述根据所述多文件整合策略将所述多个文件进行整合,生成目标结构化文档,包括:
确定文件信息整合模板;
获取所述多个文件中每个文件的文件类型,并根据所述每个文件的文件类型确定所述每个文件的文件内容读取策略;
基于所述每个文件的文件内容读取策略读取所述每个文件的文件内容;
获取所述多个文件中每个文件的优先级;
基于所述优先级的高低顺序依次将所述每个文件的文件内容填充至所述文件信息整合模板中,生成目标结构化文档。
4.根据权利要求3所述的方法,其特征在于,所述获取所述多个文件中每个文件的优先级,包括:
获取所述多个文件中每个文件的创建时间;
基于所述每个文件的创建时间确定所述每个文件的优先级;
或者,
计算所述多个文件中每个文件的业务权重值;
基于所述每个文件的业务权重值确定所述每个文件的优先级。
5.根据权利要求4所述的方法,其特征在于,所述计算所述多个文件中每个文件的业务权重值,包括:
对所述每个文件的文件内容进行分词处理,得到每个文件的分词结果;
采用关键词抽取算法在每个文件的分词结果中抽取预设业务信息对应的关键词,得到每个文件的关键词集合;
将每个文件的关键词集合输入预先训练的词向量模型中,输出所述每个文件的词向量序列;
根据所述每个文件的词向量序列构建词向量矩阵,得到每个文件的词向量矩阵;
创建每个文件的词向量矩阵中第一个元素与最后一个元素的第一线段,并计算所述第一线段上所有元素的第一均值向量,并创建与所述第一线段相交且垂直的第二线段,并计算所述第二线段上所有元素的第二均值向量;
将所述第一均值向量与所述第二均值向量进行加权求和取平均值,得到每个文件的业务权重值。
6.根据权利要求3所述的方法,其特征在于,所述确定文件信息整合模板,包括:
展示多个文件信息整合模板界面;
接收针对所述多个文件信息整合模板界面的选择指令,根据所述选择指令生成模板标识符;
根据所述模板标识符在预设文件信息整合模板数据库中映射出目标文件信息整合模板。
7.根据权利要求1所述的方法,其特征在于,在接收针对多个文件的选中指令之前,还包括:
获取文件数据整合程序安装包;
接收针对所述文件数据整合程序安装包的安装指令;
基于所述安装指令将所述文件数据整合程序安装包进行自动安装,得到预先安装的文件数据整合程序。
8.一种结构化文档生成系统,其特征在于,所述系统包括:
功能选择菜单展示模块,用于当接收到针对多个文件的选中指令时,展示预先安装的文件数据整合程序对应的功能选择菜单;
目标功能标识符确定模块,用于接收针对所述功能选择菜单的选择指令,并根据所述选择指令确定目标功能标识符;
目标结构化文档生成模块,用于当所述目标功能标识符为多文件整合策略的功能标识符时,根据所述多文件整合策略将所述多个文件进行整合,生成目标结构化文档。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述结构化文档生成方法的步骤。
10.一种存储有计算机可读指令的介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述结构化文档生成的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211091233.8A CN115686303A (zh) | 2022-09-07 | 2022-09-07 | 一种结构化文档生成方法、系统、计算机设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211091233.8A CN115686303A (zh) | 2022-09-07 | 2022-09-07 | 一种结构化文档生成方法、系统、计算机设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115686303A true CN115686303A (zh) | 2023-02-03 |
Family
ID=85062544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211091233.8A Pending CN115686303A (zh) | 2022-09-07 | 2022-09-07 | 一种结构化文档生成方法、系统、计算机设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115686303A (zh) |
-
2022
- 2022-09-07 CN CN202211091233.8A patent/CN115686303A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8225193B1 (en) | Methods and systems for providing workspace navigation with a tag cloud | |
KR101528853B1 (ko) | Api 서비스 방법과 api 매쉬업 생성 방법, 장치 및기록매체 | |
CN102027504B (zh) | 轻量级三维显示 | |
US20220342645A1 (en) | Automated generation of software applications using analysis of submitted content items | |
US20090254611A1 (en) | System and Method for Platform and Language-Independent Development and Delivery of Page-Based Content | |
US9361135B2 (en) | System and method for outputting and selecting processed content information | |
CN111563220A (zh) | 业务网站项目构建方法、装置、计算机设备和存储介质 | |
US20090327226A1 (en) | Library description of the user interface for federated search results | |
CN112287144B (zh) | 图片检索方法、设备及存储介质 | |
CN114611041A (zh) | 一种前端页面构建方法、装置、计算机设备及介质 | |
EP2924565A1 (en) | Web-application-launch application programming interface | |
CN110362341A (zh) | 基于微服务架构的业务管理方法、装置、设备和存储介质 | |
CN115098437A (zh) | 镜像管理方法、装置及服务器 | |
CN117909840A (zh) | 一种模型训练方法、装置、存储介质及电子设备 | |
CN116644250A (zh) | 页面检测方法、装置、计算机设备和存储介质 | |
CN115686303A (zh) | 一种结构化文档生成方法、系统、计算机设备及介质 | |
CN116028048A (zh) | 一种脚本的生成方法、装置、电子设备及存储介质 | |
CN116226850A (zh) | 应用程序的病毒检测方法、装置、设备、介质及程序产品 | |
CN112486461B (zh) | 一种基于springboot框架的信息处理系统 | |
CN115390835A (zh) | 一种小程序标签化搜索框的构建方法及设备 | |
Rattanarungrot et al. | Development of service oriented mobile AR applications for museum learning activities | |
CN114443022A (zh) | 生成页面搭建区块的方法及电子设备 | |
EP2544108A1 (fr) | Dispositif électronique pour l'annotation de document | |
CN112308074A (zh) | 用于生成缩略图的方法和装置 | |
CN118093010B (zh) | 一种应用包生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |