CN113704214A - 电子卷宗文件类型转换方法、装置及计算机设备 - Google Patents
电子卷宗文件类型转换方法、装置及计算机设备 Download PDFInfo
- Publication number
- CN113704214A CN113704214A CN202110995930.5A CN202110995930A CN113704214A CN 113704214 A CN113704214 A CN 113704214A CN 202110995930 A CN202110995930 A CN 202110995930A CN 113704214 A CN113704214 A CN 113704214A
- Authority
- CN
- China
- Prior art keywords
- file
- type
- picture
- information
- format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000006243 chemical reaction Methods 0.000 title claims description 30
- 230000009467 reduction Effects 0.000 claims abstract description 18
- 238000005516 engineering process Methods 0.000 claims abstract description 12
- 239000010410 layer Substances 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 239000002355 dual-layer Substances 0.000 claims description 2
- 239000000463 material Substances 0.000 abstract description 8
- 238000012015 optical character recognition Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 229910002056 binary alloy Inorganic materials 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005202 decontamination Methods 0.000 description 1
- 230000003588 decontaminative effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/178—Techniques for file synchronisation in file systems
- G06F16/1794—Details of file format conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种电子卷宗文件类型转换方法、装置及计算机设备,包括获取卷宗文件信息并将卷宗文件读入,获取卷宗文件的真实文件类型;判断获取到的所述卷宗文件类型是否是图片格式;将JPG类型转换为BMP类型;将图片信息转换为文本信息;运用文本格式还原技术将图片格式的所述卷宗文件版面进行分析形成DOC文件;根据所述图片信息和所述文本信息生成双层PDF文件;一方面解决了电子卷宗材料实际应用中存在的多文件类型不统一,实际应用中不便于查阅的问题;另一方面,形成了完整的一套电子卷宗文件,可方便的供其它系统直接调用,进一步提高了电子卷宗文件的可读性与利用率。
Description
技术领域
本发明涉及卷宗文件类型转换技术领域,具体涉及一种电子卷宗文件类型转换方法、装置及计算机设备。
背景技术
为建成以阳光化、网络化、智能化为特征的智慧法院,进一步提升人民法院审判执行信息化水平,深化司法公开力度,促进审判流程再造,破解人民法院“案多人少”和调卷难等难题。电子卷宗随案同步生成和深度应用是推进“智慧法院”建设的必然要求、是服务法官办案和提升司法质效的有效途径、是扩大司法公开和提升司法公信的迫切需要、是强化司法管理和实现科学决策的重要抓手,推进电子卷宗在立案、庭审、阅卷、文书辅助等方面的智能化应用,为法官提供更加智能、高效的办公服务,尽可能将其从事务性负担中解放出来,提高审判工作效率;回应群众司法需求,不断扩大信息公开范围,完善信息平台功能,努力提供更加优质、便捷的司法服务;重构诉讼材料收发流程,实现对电子卷宗随案同步生成与管理,并运用互联互通方式,实现对纸质材料流转的电子跟踪、全程留痕,进一步提高司法管理精细化水平,全面推进电子卷宗随案同步生成和深度应用,进一步提升“智慧法院”建设及信息化应用水平,促进公正司法,提升司法公信力,有助于实现审判体系和审判能力现代化。
而整个“智慧法院”项目的根基是电子卷宗材料的电子化、卷宗材料文件类型的统一化、从而形成一套完整的电子卷宗文件是重中之重,为法院办案无纸化奠定了夯实基础。但是目前社会上暂时没有一种方法可将电子卷宗文件统一生成“智慧法院”业务系统所需要的同时具备JPG、BMP、TXT、DOC、 PDF文件类型的方法,各系统生成的文件存储混乱,以造成卷宗电子文件使用率低,法官阅卷率低,无纸化程度不高等问题。
发明内容
为此,本发明实施例提供一种电子卷宗文件类型转换方法、装置及计算机设备,以解决现有技术存在的无法将电子卷宗文件统一生成“智慧法院”业务系统所需要的同时具备JPG、BMP、TXT、DOC、PDF文件类型的问题。
为了实现上述目的,本发明实施例提供如下技术方案:
第一方面,一种电子卷宗文件类型转换方法,包括:
获取卷宗文件信息并将所述卷宗文件读入,获取所述卷宗文件的真实文件类型;
判断获取到的所述卷宗文件类型是否是图片格式;
若所述卷宗文件类型是图片格式,则将JPG类型转换为BMP类型;若所述卷宗文件类型是DOC文档格式,则将DOC文档格式转化为图片格式,再将JPG类型转换为BMP类型;
将图片信息转换为文本信息;
运用文本格式还原技术将图片格式的所述卷宗文件版面进行分析形成 DOC文件;
根据所述图片信息和所述文本信息生成双层PDF文件。
作为优选,运用文本格式还原技术将图片格式的所述卷宗文件版面进行分析形成DOC文件时,具体包括:
区分图片中的某一块区域的内容属性;
分别对于不同内容进行处理;
运用版面还原技术将识别后的文字按照原始的文档图片排列顺序输出到文档,形成DOC文件。
作为优选,所述卷宗文件信息的获取和读入都是通过二进制方式来获取和读入的。
作为优选,所述图片信息转换为文本信息时是通过OCR识别技术来转化的。
作为优选,所述文本格式还原技术为神经网络技术。
作为优选,将JPG类型转换为BMP类型时是根据图片exif信息结合图片 byte数组中的头尾标识来进行转化的。
作为优选,若所述卷宗文件类型是DOC文档格式,则通过文件二进制将 DOC文档格式转化为图片格式。
作为优选,所述双层PDF是一种具有多层结构的PDF格式文件。
第二方面,一种电子卷宗文件类型转换装置,包括:
读取模块,用于接收电子卷宗文件,读取卷宗文件的二进制信息及文件的类型信息数据;
判断模块,用于根据图片的二进制信息及文件类型信息判断当前文件的类型并将判断结果输出到转换模块;
转换模块,用于接收判断模块传入的卷宗文件信息并将卷宗文件类型从 JPG类型转换为BMP类型;
处理模块,用于对卷宗文件进行OCR识别并根据识别后的文本进行文本格式还原,生成DOC文件或PDF文件;
输出模块,用于将转换模块及处理模块产生的电子卷宗文件输出供其它应用系统使用。
第三方面,一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现电子卷宗文件类型转换方法的步骤。
本发明至少具有以下有益效果:本发明提供了一种电子卷宗文件类型转换方法、装置及计算机设备,包括获取卷宗文件信息并将卷宗文件读入,获取卷宗文件的真实文件类型;判断获取到的所述卷宗文件类型是否是图片格式;将 JPG类型转换为BMP类型;将图片信息转换为文本信息;运用文本格式还原技术将图片格式的所述卷宗文件版面进行分析形成DOC文件;根据所述图片信息和所述文本信息生成双层PDF文件;一方面解决了电子卷宗材料实际应用中存在的多文件类型不统一,实际应用中不便于查阅的问题;另一方面,形成了完整的一套电子卷宗文件,可方便的供其它系统直接调用,进一步提高了电子卷宗文件的可读性与利用率。
附图说明
为了更清楚地说明现有技术以及本发明,下面将对现有技术以及本发明实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引申获得其它的附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。
图1为本发明实施例提供的电子卷宗文件类型转换方法流程图;
图2为本发明实施例提供的电子卷宗文件类型转换装置结构示意图;
图3为本发明实施例提供的计算机设备的结构示意图。
附图标记说明:
201-读取模块;202-判断模块;203-转换模块;204-处理模块;205-输出模块;1000-存储器;2000-处理器。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)旨在区别指代的对象。对于具有时序流程的方案,这种术语表述方式不必理解为描述特定的顺序或先后次序,对于装置结构的方案,这种术语表述方式也不存在对重要程度、位置关系的区分等。
此外,术语“包括”、“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包括了一系列步骤或单元的过程、方法、系统、产品或设备不必限于已明确列出的那些步骤或单元,而是还可包含虽然并未明确列出的但对于这些过程、方法、产品或设备固有的其它步骤或单元,或者基于本发明构思进一步的优化方案所增加的步骤或单元。
请参阅图1,本发明实施例提供一种电子卷宗文件类型转换方法,包括:
S1:获取卷宗文件二进制信息,将卷宗文件以二进制方式读入,获取卷宗文件的真实文件类型;
S2:判断获取到的卷宗文件类型是否是图片格式;
S3:若卷宗文件类型是图片格式,则根据图片exif信息结合图片byte数组中的头尾标识,将JPG类型与BMP类型进行转换;若卷宗文件类型不是图片格式,是DOC文档格式,则通过文件二进制将DOC文档先转化为图片格式,再根据图片exif信息结合图片byte数组中的头尾标识,将JPG类型与BMP 类型进行转换。
S4:得到图片信息后将图片信息转换为文本信息;
具体的,得到图片信息后,通过对JPG文件进行OCR(Optical CharacterRecognition,光学字符识别)识别,将图片信息转换为文本信息,文本信息包含文本内容及文本在图片上相对应的坐标位置信息等。
S5:运用神经网络技术对电子卷宗图片文件进行版式还原。
具体的,版式还原经过如下步骤:
S501:区分图片中的某一块区域的内容属性;
具体的,比如页眉页脚、自然段、表格、图表等。
S502:分别对于不同内容进行处理;
具体的,比如页眉页脚是否需要在识别后的文章内显示、自然段的换行合并、表格的单元格文字填充或合并。
S503:运用版面还原技术将识别后的文字按照原始的文档图片排列顺序输出到文档;
具体的,版面还原技术将识别后的文字按照原始文档图片的排列、段落、位置和顺序不变地输出到Word文档、PDF文档等。版式还原后的文本在后续深度应用中不会因为段落格式使得词语被切断,完全满足深度应用的需求。
S6:根据图片和OCR识别的文本信息生成双层PDF文件。
双层PDF格式文件是一种具有多层结构的PDF格式文件,是PDF文件衍生的一种文件,其特点是:文件既可以是文本型的(比如由word生成的文件),也可以是图像型的,且其位置上下一一对应。制作过程中,资料通过扫描仪快速录入后,经过去污、纠偏和OCR识别,上层是原始图像,下层是识别结果,然后可以直接生成可以检索的PDF文件,既可以100%保留原始版面效果,又便于建立索引数据库,进行科学的管理。
本发明实施例提供一种电子卷宗文件类型转换方法,实现了卷宗文件从 JPG到BMP、JPG到DOC、JPG到PDF、PDF到JPG、JPG到TXT等卷宗文件类型的转换,最终形成具有JPG、BMP、TXT、DOC、双层PDF文件类型的一套卷宗文件,一方面解决了电子卷宗材料实际应用中存在的多文件类型不统一,实际应用中不便于查阅的问题;另一方面,形成了完整的一套电子卷宗文件,可方便的供其它系统直接调用,进一步提高了电子卷宗文件的可读性与利用率,方便供其它应用系统直接使用。
请参阅图2,本发明实施例提供一种电子卷宗文件类型转换装置,包括:
读取模块201,用于接收到电子卷宗文件,读取文件的二进制信息及文件的类型信息数据;
判断模块202,用于根据图片的二进制信息及文件类型信息判断当前文件的类型,以及将判断结果输出给转换模块;
转换模块203,用于接收判断模块传入的卷宗文件信息,进行卷宗文件JPG 到BMP图文件类型的转换;
处理模块204,用于对卷宗文件进行OCR识别,根据识别后的文本进行文本格式还原,生成DOC文件与PDF文件;
输出模块205,用于将转换模块及处理模块产生的电子卷宗文件输出供其它应用系统使用;
请参阅图3,本发明实施例提供一种计算机设备,包括存储器1000、处理器2000及存储在该存储器1000上并可在该处理器2000上运行的计算机程序,其中,处理器2000执行计算机程序时实现电子卷宗文件类型转换方法步骤。
具体地,存储器1000和处理器2000能够为通用的存储器和处理器,这里不做具体限定,当处理器2000运行存储器1000存储的计算机程序时,能够执行电子卷宗文件类型转换方法,从而能够基于本发明快速准确的实现对卷宗文件类型的转换。
本发明实施例所提供的电子卷宗文件类型转换方法、装置及计算机设备,计算机程序产品包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面实施例中的电子卷宗文件类型转换方法,具体实现可参见方法实施例,在此不再赘述。
以上实施例的各技术特征可以进行任意的组合(只要这些技术特征的组合不存在矛盾),为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述;这些未明确写出的实施例,也都应当认为是本说明书记载的范围。
上文中通过一般性说明及具体实施例对本发明作了较为具体和详细的描述。应当指出的是,在不脱离本发明构思的前提下,显然还可以对这些具体实施例作出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种电子卷宗文件类型转换方法,其特征在于,包括:
获取卷宗文件信息并将所述卷宗文件读入,获取所述卷宗文件的真实文件类型;
判断获取到的所述卷宗文件类型是否是图片格式;
若所述卷宗文件类型是图片格式,则将JPG类型转换为BMP类型;若所述卷宗文件类型是DOC文档格式,则将DOC文档格式转化为图片格式,再将JPG类型转换为BMP类型;
将图片信息转换为文本信息;
运用文本格式还原技术将图片格式的所述卷宗文件版面进行分析形成DOC文件;
根据所述图片信息和所述文本信息生成双层PDF文件。
2.根据权利要求1所述的电子卷宗文件类型转换方法,其特征在于,运用文本格式还原技术将图片格式的所述卷宗文件版面进行分析形成DOC文件时,具体包括:
区分图片中的某一块区域的内容属性;
分别对于不同内容进行处理;
运用版面还原技术将识别后的文字按照原始的文档图片排列顺序输出到文档,形成DOC文件。
3.根据权利要求1所述的电子卷宗文件类型转换方法,其特征在于,所述卷宗文件信息的获取和读入都是通过二进制方式来获取和读入的。
4.根据权利要求1所述的电子卷宗文件类型转换方法,其特征在于,所述图片信息转换为文本信息时是通过OCR识别技术来转化的。
5.根据权利要求1所述的电子卷宗文件类型转换方法,其特征在于,所述文本格式还原技术为神经网络技术。
6.根据权利要求1所述的电子卷宗文件类型转换方法,其特征在于,将JPG类型转换为BMP类型时是根据图片exif信息结合图片byte数组中的头尾标识来进行转化的。
7.根据权利要求1所述的电子卷宗文件类型转换方法,其特征在于,若所述卷宗文件类型是DOC文档格式,则通过文件二进制将DOC文档格式转化为图片格式。
8.根据权利要求1所述的电子卷宗文件类型转换方法,其特征在于,所述双层PDF是一种具有多层结构的PDF格式文件。
9.一种电子卷宗文件类型转换装置,其特征在于,包括:
读取模块,用于接收电子卷宗文件,读取卷宗文件的二进制信息及文件的类型信息数据;
判断模块,用于根据图片的二进制信息及文件类型信息判断当前文件的类型并将判断结果输出到转换模块;
转换模块,用于接收判断模块传入的卷宗文件信息并将卷宗文件类型从JPG类型转换为BMP类型;
处理模块,用于对卷宗文件进行OCR识别并根据识别后的文本进行文本格式还原,生成DOC文件或PDF文件;
输出模块,用于将转换模块及处理模块产生的电子卷宗文件输出供其它应用系统使用。
10.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110995930.5A CN113704214A (zh) | 2021-08-27 | 2021-08-27 | 电子卷宗文件类型转换方法、装置及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110995930.5A CN113704214A (zh) | 2021-08-27 | 2021-08-27 | 电子卷宗文件类型转换方法、装置及计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113704214A true CN113704214A (zh) | 2021-11-26 |
Family
ID=78656037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110995930.5A Pending CN113704214A (zh) | 2021-08-27 | 2021-08-27 | 电子卷宗文件类型转换方法、装置及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113704214A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115392160A (zh) * | 2022-06-10 | 2022-11-25 | 无锡芯光互连技术研究院有限公司 | 一种电路图描述文件的格式转换方法 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095160A (zh) * | 2015-07-31 | 2015-11-25 | 河南大学 | 一种文档转换阅读方法与系统 |
CN105224510A (zh) * | 2015-09-21 | 2016-01-06 | 杭州施强网络科技有限公司 | 一种文档格式文件的转换方法 |
CN107038232A (zh) * | 2017-04-13 | 2017-08-11 | 福建中金在线信息科技有限公司 | 一种多媒体文件的格式转换方法及装置 |
CN107315839A (zh) * | 2017-07-17 | 2017-11-03 | 广东交通职业技术学院 | 一种教育资源数据采集方法 |
KR20180093449A (ko) * | 2017-02-13 | 2018-08-22 | 주식회사 우암코퍼레이션 | 문서변환장치 및 문서변환방법 |
CN108647305A (zh) * | 2018-05-09 | 2018-10-12 | 天津字节跳动科技有限公司 | 文档格式转换方法和装置 |
CN108920612A (zh) * | 2018-06-28 | 2018-11-30 | 山东中孚安全技术有限公司 | 解析doc二进制格式并提取文档中图片的方法及系统 |
CN109522284A (zh) * | 2018-11-26 | 2019-03-26 | 天津渤化工程有限公司 | 文件批量转换方法及装置 |
CN109948137A (zh) * | 2017-12-21 | 2019-06-28 | 江苏奥博洋信息技术有限公司 | 双层pdf批量统一大小的方法 |
CN110188328A (zh) * | 2019-06-04 | 2019-08-30 | 北京市律典通科技有限公司 | 卷宗结构化处理方法和装置 |
CN110362793A (zh) * | 2019-07-18 | 2019-10-22 | 江苏中威科技软件系统有限公司 | 一种用于版式文件转换并展示的方法 |
CN110390000A (zh) * | 2019-07-30 | 2019-10-29 | 同方赛威讯信息技术有限公司 | 一种法律文书自动识别、生成系统及其方法 |
CN110413864A (zh) * | 2019-08-06 | 2019-11-05 | 南方电网科学研究院有限责任公司 | 一种网络安全情报采集方法、装置、设备及存储介质 |
CN111931096A (zh) * | 2020-09-02 | 2020-11-13 | 平安国际智慧城市科技股份有限公司 | 移动终端文件预览的方法、装置、计算机设备及存储介质 |
CN112115111A (zh) * | 2019-06-20 | 2020-12-22 | 上海怀若智能科技有限公司 | 一种基于ocr的文档版本管理方法和系统 |
CN112507666A (zh) * | 2020-12-21 | 2021-03-16 | 北京百度网讯科技有限公司 | 文档转换方法、装置、电子设备及存储介质 |
CN113221711A (zh) * | 2021-04-30 | 2021-08-06 | 北京金山数字娱乐科技有限公司 | 一种信息提取方法及装置 |
-
2021
- 2021-08-27 CN CN202110995930.5A patent/CN113704214A/zh active Pending
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095160A (zh) * | 2015-07-31 | 2015-11-25 | 河南大学 | 一种文档转换阅读方法与系统 |
CN105224510A (zh) * | 2015-09-21 | 2016-01-06 | 杭州施强网络科技有限公司 | 一种文档格式文件的转换方法 |
KR20180093449A (ko) * | 2017-02-13 | 2018-08-22 | 주식회사 우암코퍼레이션 | 문서변환장치 및 문서변환방법 |
CN107038232A (zh) * | 2017-04-13 | 2017-08-11 | 福建中金在线信息科技有限公司 | 一种多媒体文件的格式转换方法及装置 |
CN107315839A (zh) * | 2017-07-17 | 2017-11-03 | 广东交通职业技术学院 | 一种教育资源数据采集方法 |
CN109948137A (zh) * | 2017-12-21 | 2019-06-28 | 江苏奥博洋信息技术有限公司 | 双层pdf批量统一大小的方法 |
CN108647305A (zh) * | 2018-05-09 | 2018-10-12 | 天津字节跳动科技有限公司 | 文档格式转换方法和装置 |
CN108920612A (zh) * | 2018-06-28 | 2018-11-30 | 山东中孚安全技术有限公司 | 解析doc二进制格式并提取文档中图片的方法及系统 |
CN109522284A (zh) * | 2018-11-26 | 2019-03-26 | 天津渤化工程有限公司 | 文件批量转换方法及装置 |
CN110188328A (zh) * | 2019-06-04 | 2019-08-30 | 北京市律典通科技有限公司 | 卷宗结构化处理方法和装置 |
CN112115111A (zh) * | 2019-06-20 | 2020-12-22 | 上海怀若智能科技有限公司 | 一种基于ocr的文档版本管理方法和系统 |
CN110362793A (zh) * | 2019-07-18 | 2019-10-22 | 江苏中威科技软件系统有限公司 | 一种用于版式文件转换并展示的方法 |
CN110390000A (zh) * | 2019-07-30 | 2019-10-29 | 同方赛威讯信息技术有限公司 | 一种法律文书自动识别、生成系统及其方法 |
CN110413864A (zh) * | 2019-08-06 | 2019-11-05 | 南方电网科学研究院有限责任公司 | 一种网络安全情报采集方法、装置、设备及存储介质 |
CN111931096A (zh) * | 2020-09-02 | 2020-11-13 | 平安国际智慧城市科技股份有限公司 | 移动终端文件预览的方法、装置、计算机设备及存储介质 |
CN112507666A (zh) * | 2020-12-21 | 2021-03-16 | 北京百度网讯科技有限公司 | 文档转换方法、装置、电子设备及存储介质 |
CN113221711A (zh) * | 2021-04-30 | 2021-08-06 | 北京金山数字娱乐科技有限公司 | 一种信息提取方法及装置 |
Non-Patent Citations (1)
Title |
---|
徐清宇: "智慧审判苏州模式的实践探索", 《人民法院报》, pages 1 - 3 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115392160A (zh) * | 2022-06-10 | 2022-11-25 | 无锡芯光互连技术研究院有限公司 | 一种电路图描述文件的格式转换方法 |
CN115392160B (zh) * | 2022-06-10 | 2024-04-09 | 无锡芯光互连技术研究院有限公司 | 一种电路图描述文件的格式转换方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11036808B2 (en) | System and method for indexing electronic discovery data | |
US20190236102A1 (en) | System and method for differential document analysis and storage | |
US20080114782A1 (en) | Integrating Analog Markups with Electronic Documents | |
CN110083805A (zh) | 一种将Word文件转换为EPUB文件的方法及系统 | |
RU2579899C1 (ru) | Обработка документа с использованием нескольких потоков обработки | |
CN112380825B (zh) | Pdf文档跨页表格合并方法、装置、电子设备及存储介质 | |
AU2012367116A1 (en) | Formula detection engine | |
US20120284250A1 (en) | Enhanced search engine | |
CN115424282A (zh) | 一种非结构化文本表格识别方法和系统 | |
CN102566945A (zh) | 一种实现图书自动组稿按需印刷的方法和系统 | |
CN112364618B (zh) | 报告文件生成方法、装置、电子设备和存储介质 | |
CN113704214A (zh) | 电子卷宗文件类型转换方法、装置及计算机设备 | |
CN112434168A (zh) | 基于图书馆的知识图谱构建方法、碎片化知识生成方法 | |
CN115757596A (zh) | 一种通用电力非结构化数据转结构化数据方法 | |
CN108038441A (zh) | 一种基于图像识别的系统与方法 | |
CN111898433A (zh) | 一种纸质票据数字化方法和装置 | |
CN103177105A (zh) | 一种图像检索方法及装置 | |
CN113033165A (zh) | 电子表格文件解析方法、装置和计算机可读存储介质 | |
CN114022891A (zh) | 扫描文本的关键信息提取方法、装置、设备及存储介质 | |
US10949604B1 (en) | Identifying artifacts in digital documents | |
Sergeyev et al. | Deterministic global optimization | |
CN112446373B (zh) | 识别转换图像文件的方法、系统、计算机设备及存储介质 | |
CN103853849A (zh) | 高压缩可回流文件的建立和绘制方法 | |
CN115146583A (zh) | 一种术语自主结构化提取及关联方法、装置及存储介质 | |
US8566366B2 (en) | Format conversion apparatus and file search apparatus capable of searching for a file as based on an attribute provided prior to conversion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211126 |
|
RJ01 | Rejection of invention patent application after publication |