CN107832272A - 基于国产cpu的多格式文件自动转换嵌入流式文件方法 - Google Patents

基于国产cpu的多格式文件自动转换嵌入流式文件方法 Download PDF

Info

Publication number
CN107832272A
CN107832272A CN201711064393.2A CN201711064393A CN107832272A CN 107832272 A CN107832272 A CN 107832272A CN 201711064393 A CN201711064393 A CN 201711064393A CN 107832272 A CN107832272 A CN 107832272A
Authority
CN
China
Prior art keywords
file
stream
format
oriented
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711064393.2A
Other languages
English (en)
Inventor
朱宪
李春龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Inspur Cloud Service Information Technology Co Ltd
Original Assignee
Shandong Inspur Cloud Service Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Inspur Cloud Service Information Technology Co Ltd filed Critical Shandong Inspur Cloud Service Information Technology Co Ltd
Priority to CN201711064393.2A priority Critical patent/CN107832272A/zh
Publication of CN107832272A publication Critical patent/CN107832272A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了基于国产CPU的多格式文件自动转换嵌入流式文件方法,所述方法针对不同格式的电子文件,进行不同的处理,将文件转换成能够嵌入到流式文件的格式文件,然后针对转换后的格式文件,调用不同的接口将转换后的文件嵌入到指定流式文件中。本发明方法实现了将文本文件、流式文件、OFD文件、PDF文件、图片文件等格式文件进行自动格式转换并嵌入到指定流式文件的功能,通过不同的接口来实现不同文件格式的转换功能的,并且提供了扩展接口,所以对于目前未考虑到的文件格式,扩展起来非常方便。

Description

基于国产CPU的多格式文件自动转换嵌入流式文件方法
技术领域
本发明涉及多格式文件技术领域,具体涉及一种基于国产CPU的多格式文件自动转换嵌入流式文件方法。
背景技术
在国家的大力扶持下,具有自主知识产权的全国产软硬件有了较快的发展,尤其是近年来我国涌现了众多具有自主知识产权的基础软硬件产品。龙芯、飞腾、申威等具有自主知识产权的高端通用芯片蓬勃发展,技术水平达到了同类产品的世界先进水平。
同时国产基础软件产品的发展也欣欣向荣,中标麒麟操作系统、神通数据库、金仓数据库、达梦数据库、东方通中间件、金蝶中间件、中标普华办公软件、金山办公软件、福昕版式办公套件、数科版式办公套件、中安源电子签章、信安电子签章等国产基础软件产品不断涌现出来。这些基础软硬件产品在性能、易用性等方面达到或接近世界先进水平。
随着国产基础软硬件的蓬勃的发展,给国产基础软硬件的推广和使用带来了前所未有的机遇。另外基于国产软硬件的安全可靠性,在政府、军工等重要领域,更换国产软硬件,已经势在必行。
目前存在无法将OFD、PDF格式的电子文件内容自动嵌入到国产文字处理软件的流式文件中,嵌入查看其他格式的电子文件也缺乏统一的方式,对不同格式的文件,需要人工通过不同的操作才能实现嵌入查看,例如文本文件、流式文件的电子文件需要通过复制粘贴文件内容的方式实现;图片格式的文件需要通过图片嵌入的方式实现,操作复杂,效率低下,还可能出现失误。
发明内容
本发明要解决的技术问题是:本发明针对以上问题,提供一种基于国产CPU的多格式文件自动转换嵌入流式文件方法,以实现应用中多个电子文件内容统一到流式文件中的需求。
本发明所采用的技术方案为:
基于国产CPU的多格式文件自动转换嵌入流式文件方法,所述方法针对不同格式的电子文件,进行不同的处理,将文件转换成能够嵌入到流式文件的格式文件,然后针对转换后的格式文件,调用不同的接口将转换后的文件嵌入到指定流式文件中。
所述方法对于文本文件、流式文件的电子文件,提取文件内容,转换为字符串格式文件。
所述方法对于OFD、PDF格式的电子文件,截取文件的版心内容,并将版心内容转换成图片格式文件。
所述方法对于转换后是字符串格式文件的,调用字符串插入接口嵌入到指定流式文件中。
所述方法对于转换后是图片格式的文件,调用图片插入的接口嵌入到指定流式文件中。
所述方法对于图片格式的电子文件,调用图片插入的接口嵌入到指定流式文件中。
所述方法实现包括内容如下:
首先识别电子文件的格式,针对不同格式的文件,进行不同的处理方式将文件转换成可以嵌入到流式文件的格式文件:
对于文本文件、流式文件的电子文件,获取文件内容并将内容转为字符串格式;
对于OFD、PDF格式的电子文件,获取文件的版心内容,并将版心内容转换成图片格式;
然后针对转换后的文件格式,调用不同的接口将转换后的文件嵌入到指定流式文件中:
对于转换后是字符串格式的,调用字符串插入接口嵌入到指定流式文件中;
对于转换后是图片格式的文件,调用图片插入的接口嵌入到指定流式文件中。
所述方法实施内容包括:
(1)、上传电子文件到服务器
对于选中的需要嵌入到流式文件中的电子文件,识别其文件格式,并对其进行过滤:
若选中的文件格式为支持的嵌入文件格式,则将文件上传到服务器;则提示用户该文件格式不支持嵌入流式文件,请重新选择文件;
(2)、文件格式自动转换
对上传到服务器的电子文件,识别该文件的文件格式,针对不同的文件格式采用不同的处理策略:
对能够直接嵌入流式文件的图片文件格式,不做处理;
对文本文件、流式文件、OFD、PDF等需要转换格式后才能嵌入流式文件的文件格式进行格式转换;
针对需要进行格式转换的电子文件:
首先采取多线程、文件流缓存机制,获取文件的文件流;
然后按照文件类别自动采取不同的处理方式将电子文件转换为能嵌入到流式文件的格式文件:
对于文本文件、流式文件的电子文件,将文件流转换为字符串格式内容;
对于OFD、PDF格式的电子文件,根据OFD、PDF文件格式语法,从文件流中依次获取每页的版心内容,并将获取到的版心内容转换成图片格式;
(3)、嵌入转换后的文件到指定流式文件中
打开指定的流式文件,调用相应的接口,将转换后的文件嵌入到该流式文件中:
对于源文件是图片格式的电子文件,调用图片插入流式文件的接口,将源文件插入到流式文件中;
对于源文件是文本文件、流式文件的电子文件,获取转换后的字符串内容,调用字符串插入流式文件的接口,将字符串插入该流式文件中;
对于源文件是OFD、PDF格式的电子文件,获取转换后的图片格式文件,然后调用图片插入流式文件的接口,将转换后的图片文件插入到该流式文件中。
本发明的有益效果为:
本发明方法实现了将文本文件、流式文件、OFD文件、PDF文件、图片文件等格式文件进行自动格式转换并嵌入到指定流式文件的功能,通过不同的接口来实现不同文件格式的转换功能的,并且提供了扩展接口,所以对于目前未考虑到的文件格式,扩展起来非常方便。
在读取需要格式转换的文件和保存转换后的文件到服务器的时候,通过采取多线程、文件流缓存等机制,提高了文件的读取速度和保存速度。
附图说明
图1为本发明方法实现流程图。
具体实施方式
下面根据说明书附图,结合具体实施方式对本发明进一步说明:
基于国产CPU的多格式文件自动转换嵌入流式文件方法,所述方法针对不同格式的电子文件,进行不同的处理,将文件转换成能够嵌入到流式文件的格式文件,然后针对转换后的格式文件,调用不同的接口将转换后的文件嵌入到指定流式文件中。
所述方法对于文本文件、流式文件的电子文件,提取文件内容,转换为字符串格式文件。
所述方法对于OFD、PDF格式的电子文件,截取文件的版心内容,并将版心内容转换成图片格式文件。
所述方法对于转换后是字符串格式文件的,调用字符串插入接口嵌入到指定流式文件中。
所述方法对于转换后是图片格式的文件,调用图片插入的接口嵌入到指定流式文件中。
所述方法对于图片格式的电子文件,调用图片插入的接口嵌入到指定流式文件中。
所述方法实现包括内容如下:
首先识别电子文件的格式,针对不同格式的文件,进行不同的处理方式将文件转换成可以嵌入到流式文件的格式文件:
对于文本文件、流式文件的电子文件,获取文件内容并将内容转为字符串格式;
对于OFD、PDF格式的电子文件,获取文件的版心内容,并将版心内容转换成图片格式;
然后针对转换后的文件格式,调用不同的接口将转换后的文件嵌入到指定流式文件中:
对于转换后是字符串格式的,调用字符串插入接口嵌入到指定流式文件中;
对于转换后是图片格式的文件,调用图片插入的接口嵌入到指定流式文件中。
如图1所示,所述方法实施内容包括:
(1)、上传电子文件到服务器
对于选中的需要嵌入到流式文件中的电子文件,识别其文件格式,并对其进行过滤:
若选中的文件格式为支持的嵌入文件格式,则将文件上传到服务器;则提示用户该文件格式不支持嵌入流式文件,请重新选择文件;
(2)、文件格式自动转换
对上传到服务器的电子文件,识别该文件的文件格式,针对不同的文件格式采用不同的处理策略:
对能够直接嵌入流式文件的图片文件格式,不做处理;
对文本文件、流式文件、OFD、PDF等需要转换格式后才能嵌入流式文件的文件格式进行格式转换;
针对需要进行格式转换的电子文件:
首先采取多线程、文件流缓存机制,获取文件的文件流;
然后按照文件类别自动采取不同的处理方式将电子文件转换为能嵌入到流式文件的格式文件:
对于文本文件、流式文件的电子文件,将文件流转换为字符串格式内容;
对于OFD、PDF格式的电子文件,根据OFD、PDF文件格式语法,从文件流中依次获取每页的版心内容,并将获取到的版心内容转换成图片格式;
(3)、嵌入转换后的文件到指定流式文件中
打开指定的流式文件,调用相应的接口,将转换后的文件嵌入到该流式文件中:
对于源文件是图片格式的电子文件,调用图片插入流式文件的接口,将源文件插入到流式文件中;
对于源文件是文本文件、流式文件的电子文件,获取转换后的字符串内容,调用字符串插入流式文件的接口,将字符串插入该流式文件中;
对于源文件是OFD、PDF格式的电子文件,获取转换后的图片格式文件,然后调用图片插入流式文件的接口,将转换后的图片文件插入到该流式文件中。
实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (8)

1.基于国产CPU的多格式文件自动转换嵌入流式文件方法,其特征在于,所述方法针对不同格式的电子文件,进行不同的处理,将文件转换成能够嵌入到流式文件的格式文件,然后针对转换后的格式文件,调用不同的接口将转换后的文件嵌入到指定流式文件中。
2.根据权利要求1所述的基于国产CPU的多格式文件自动转换嵌入流式文件方法,其特征在于,所述方法对于文本文件、流式文件的电子文件,提取文件内容,转换为字符串格式文件。
3.根据权利要求1所述的基于国产CPU的多格式文件自动转换嵌入流式文件方法,其特征在于,所述方法对于OFD、PDF格式的电子文件,截取文件的版心内容,并将版心内容转换成图片格式文件。
4.根据权利要求2所述的基于国产CPU的多格式文件自动转换嵌入流式文件方法,其特征在于,所述方法对于转换后是字符串格式文件的,调用字符串插入接口嵌入到指定流式文件中。
5.根据权利要求3所述的基于国产CPU的多格式文件自动转换嵌入流式文件方法,其特征在于,所述方法对于转换后是图片格式的文件,调用图片插入的接口嵌入到指定流式文件中。
6.根据权利要求1所述的基于国产CPU的多格式文件自动转换嵌入流式文件方法,其特征在于,所述方法对于图片格式的电子文件,调用图片插入的接口嵌入到指定流式文件中。
7.根据权利要求1-5任一所述的基于国产CPU的多格式文件自动转换嵌入流式文件方法,其特征在于,所述方法实现包括内容如下:
首先识别电子文件的格式,针对不同格式的文件,进行不同的处理方式将文件转换成能够嵌入到流式文件的格式文件:
对于文本文件、流式文件的电子文件,获取文件内容并将内容转为字符串格式;
对于OFD、PDF格式的电子文件,获取文件的版心内容,并将版心内容转换成图片格式;
然后针对转换后的文件格式,调用不同的接口将转换后的文件嵌入到指定流式文件中:
对于转换后是字符串格式的,调用字符串插入接口嵌入到指定流式文件中;
对于转换后是图片格式的文件,调用图片插入的接口嵌入到指定流式文件中。
8.根据权利要求1-6任一所述的基于国产CPU的多格式文件自动转换嵌入流式文件方法,其特征在于,所述方法实施内容包括:
(1)、上传电子文件到服务器
对于选中的需要嵌入到流式文件中的电子文件,识别其文件格式,并对其进行过滤:
若选中的文件格式为支持的嵌入文件格式,则将文件上传到服务器;则提示用户该文件格式不支持嵌入流式文件,请重新选择文件;
(2)、文件格式自动转换
对上传到服务器的电子文件,识别该文件的文件格式,针对不同的文件格式采用不同的处理策略:
对能够直接嵌入流式文件的图片文件格式,不做处理;
对需要转换格式后才能嵌入流式文件的文件格式进行格式转换;
针对需要进行格式转换的电子文件:
首先采取多线程、文件流缓存机制,获取文件的文件流;
然后按照文件类别自动采取不同的处理方式将电子文件转换为能嵌入到流式文件的格式文件:
对于文本文件、流式文件的电子文件,将文件流转换为字符串格式内容;
对于OFD、PDF格式的电子文件,根据OFD、PDF文件格式语法,从文件流中依次获取每页的版心内容,并将获取到的版心内容转换成图片格式;
(3)、嵌入转换后的文件到指定流式文件中
打开指定的流式文件,调用相应的接口,将转换后的文件嵌入到该流式文件中:
对于源文件是图片格式的电子文件,调用图片插入流式文件的接口,将源文件插入到流式文件中;
对于源文件是文本文件、流式文件的电子文件,获取转换后的字符串内容,调用字符串插入流式文件的接口,将字符串插入该流式文件中;
对于源文件是OFD、PDF格式的电子文件,获取转换后的图片格式文件,然后调用图片插入流式文件的接口,将转换后的图片文件插入到该流式文件中。
CN201711064393.2A 2017-11-02 2017-11-02 基于国产cpu的多格式文件自动转换嵌入流式文件方法 Pending CN107832272A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711064393.2A CN107832272A (zh) 2017-11-02 2017-11-02 基于国产cpu的多格式文件自动转换嵌入流式文件方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711064393.2A CN107832272A (zh) 2017-11-02 2017-11-02 基于国产cpu的多格式文件自动转换嵌入流式文件方法

Publications (1)

Publication Number Publication Date
CN107832272A true CN107832272A (zh) 2018-03-23

Family

ID=61650426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711064393.2A Pending CN107832272A (zh) 2017-11-02 2017-11-02 基于国产cpu的多格式文件自动转换嵌入流式文件方法

Country Status (1)

Country Link
CN (1) CN107832272A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110162991A (zh) * 2019-05-29 2019-08-23 华南师范大学 基于大数据插入和异构类型的信息隐藏方法和机器人系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101453462A (zh) * 2007-12-05 2009-06-10 英属处女岛优比特思有限公司 文件转换系统及其方法
CN101599011A (zh) * 2008-06-05 2009-12-09 北京书生国际信息技术有限公司 文档处理系统和方法
CN102521218A (zh) * 2011-12-15 2012-06-27 方正国际软件有限公司 文件合成方法及装置
CN103177015A (zh) * 2011-12-22 2013-06-26 腾讯科技(深圳)有限公司 网页图像展示方法和系统
CN104035937A (zh) * 2013-03-07 2014-09-10 方正国际软件(北京)有限公司 一种可扩展的在线浏览电子文件的系统及方法
CN104182394A (zh) * 2013-05-21 2014-12-03 北大方正集团有限公司 服务器、终端和版式文件显示方法
CN104346322A (zh) * 2013-08-08 2015-02-11 北大方正集团有限公司 文档格式处理装置和文档格式处理方法
CN104462522A (zh) * 2014-12-23 2015-03-25 深圳供电局有限公司 一种文件在线预览的方法和移动终端、服务器
CN104714787A (zh) * 2013-12-12 2015-06-17 北汽福田汽车股份有限公司 Mdf格式文件的生成方法及装置
CN106021343A (zh) * 2016-05-09 2016-10-12 杭州施强教育科技有限公司 一种应用于移动终端的ppt文件处理方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101453462A (zh) * 2007-12-05 2009-06-10 英属处女岛优比特思有限公司 文件转换系统及其方法
CN101599011A (zh) * 2008-06-05 2009-12-09 北京书生国际信息技术有限公司 文档处理系统和方法
CN102521218A (zh) * 2011-12-15 2012-06-27 方正国际软件有限公司 文件合成方法及装置
CN103177015A (zh) * 2011-12-22 2013-06-26 腾讯科技(深圳)有限公司 网页图像展示方法和系统
CN104035937A (zh) * 2013-03-07 2014-09-10 方正国际软件(北京)有限公司 一种可扩展的在线浏览电子文件的系统及方法
CN104182394A (zh) * 2013-05-21 2014-12-03 北大方正集团有限公司 服务器、终端和版式文件显示方法
CN104346322A (zh) * 2013-08-08 2015-02-11 北大方正集团有限公司 文档格式处理装置和文档格式处理方法
CN104714787A (zh) * 2013-12-12 2015-06-17 北汽福田汽车股份有限公司 Mdf格式文件的生成方法及装置
CN104462522A (zh) * 2014-12-23 2015-03-25 深圳供电局有限公司 一种文件在线预览的方法和移动终端、服务器
CN106021343A (zh) * 2016-05-09 2016-10-12 杭州施强教育科技有限公司 一种应用于移动终端的ppt文件处理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110162991A (zh) * 2019-05-29 2019-08-23 华南师范大学 基于大数据插入和异构类型的信息隐藏方法和机器人系统
CN110162991B (zh) * 2019-05-29 2023-01-03 华南师范大学 基于大数据插入和异构类型的信息隐藏方法和机器人系统

Similar Documents

Publication Publication Date Title
CN101558405B (zh) 将主机系统数据库转换为开放系统数据库的转换装置和方法
WO2006014846A3 (en) Ontology based system for data capture and knowledge representation
CN103678694A (zh) 视频资源的倒排索引文件建立方法及其系统
CN105975446A (zh) 手机端分模块显示word文档内容的方法及系统
CN105824788A (zh) 一种将演示文稿文件转换为word文件的方法和系统
MXPA05003913A (es) Metodo y dispositivo para manejo de metadatos.
CN107832272A (zh) 基于国产cpu的多格式文件自动转换嵌入流式文件方法
Bonnarel et al. IVOA server-side operations for data access Version 1.0
CN102289497A (zh) 文档预览图生成系统及方法
CN109165225A (zh) 一种基于字节流格式的kudu数据导入系统及方法
CN102591878A (zh) 技术标准的数字化处理方法
CN103838774A (zh) 网页查询系统及其查询方法
CN110362624A (zh) 一种基于安全隔离网闸系统的异构数据库同步方法
CN102455996A (zh) 多文档格式至swf批量自动转换系统
CN103297329B (zh) 一种异构系统间消息的准实时双向同步方法
CN102209279A (zh) 基于xml的多语言支持方法
CN102375809A (zh) 以输入的第一语言即时输出第二语言的系统及其方法
CN116401316A (zh) 一种实现Oracle数据库中文数据同步的方法及系统
YANG et al. Diet of non-pollinating wasps and their impact on the stability of fig-pollinator wasp mutualism
Thanikachalam et al. Media item relighting technique
Ndzana et al. Fountain codes for the Slepian-Wolf problem
Shen et al. An approach to efficient compression transmission schema of GML
Pérez-Medinaa et al. Journal of Visual Language and Computing
Peng et al. A Method for Visual Saliency Extraction Based on Feature Point Detection and Information Gain
Bugila ?????????????????????????????(Scarabaeida: Coleoptera) Eusericamurzka (Ram, Mas)??????????????(Fabales: Fabaceae) Medicago sativa??????????????(?????)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180323

RJ01 Rejection of invention patent application after publication