CN104090920A - 一种实现数字内容跨终端出版的系统 - Google Patents

一种实现数字内容跨终端出版的系统 Download PDF

Info

Publication number
CN104090920A
CN104090920A CN201410270214.0A CN201410270214A CN104090920A CN 104090920 A CN104090920 A CN 104090920A CN 201410270214 A CN201410270214 A CN 201410270214A CN 104090920 A CN104090920 A CN 104090920A
Authority
CN
China
Prior art keywords
pdf
terminal
information
digital content
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410270214.0A
Other languages
English (en)
Inventor
吴雷
阮怀伟
昌磊
虞勇勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ANHUI EDUCATION NETWORK PUBLISHING Co Ltd
Original Assignee
ANHUI EDUCATION NETWORK PUBLISHING Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ANHUI EDUCATION NETWORK PUBLISHING Co Ltd filed Critical ANHUI EDUCATION NETWORK PUBLISHING Co Ltd
Priority to CN201410270214.0A priority Critical patent/CN104090920A/zh
Publication of CN104090920A publication Critical patent/CN104090920A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种实现数字内容跨终端出版的系统。包括PDF处理子系统,PDF版面分析与信息抽取子系统,跨终端自适应重组子系统。PDF处理子系统主要任务就是接受用户提交的PDF文档,经过PDF处理引擎,输出结构良好的XML文档。PDF版面分析与信息抽取子系统接受结构良好的XML文档,根据用户界面分析得到的版面分析和信息抽取得到的结果输出具有自描述性的XML文档,即具有语义信息的XML文档。实际上是把抽取规则中的语义项与数据项特征的映射关系转换为语义项与数据项的映射关系。跨终端自适应重组子系统则是实现不同终端的设备特点,实现数字内容在不同终端的展现。本发明可以实现不同终端的自适应的数字内容出版。

Description

一种实现数字内容跨终端出版的系统
技术领域
本发明涉及计算机和人工智能应用领域,具体是一种实现数字内容跨终端出版的系统。
背景技术
国内外学者对数字内容跨终端出版的研究做了大量有价值的工作。比如,亚马逊Kindle阅读器的专有格式,提供一种可以识别原生PDF,使用E-ink技术,使阅读如同纸张一般,且通过与出版集团的合作提供教科书。微软等IT公司于出版商、出版物经销商等联合主导研发的开放格式Epub,该格式的国际影响力不断加强,且渐渐成为国际电子书格式的通用标准。国内方面,方正主导的面向移动终端研发的XEB电子书格式体系成为国内该领域的事实标准,并推出了一种独立于软件、硬件、操作系统、打印设备的CEBX文档格式规范,其能够保留原文件的字符、字体、版式和色彩等重要信息。
跨终端出版,需要出版者同时将传输相同内容到不同媒体上以满足受众的不同需求的过程。即需要将传统的出版内容进行知识化、碎片化,根据终端的不同需求进行内容的自适应重组,以实现一次创建、多次出版的需要。但是国内外跨终端数字出版的研究,所建立的终端电子书格式都具有自身的知识产权,不愿意对外公开自己的格式标准。而开放格式Epub虽然具有版面结构信息和文档逻辑语义信息,对阅读呈现效果的规范性存在不足,而且由于传统的出版物版式制作主要为了印刷,较少考虑数字出版,因此有传统的排版技术转化成Epub存在着很多困难,特别是版面中数学公式、表格、图形等复杂对象,在移动终端上无法高质量地呈现。
发明内容    本发明的目的是提供一种实现数字内容跨终端出版的系统,以解决现有技术存在的问题。
为了达到上述目的,本发明所采用的技术方案为:
一种实现数字内容跨终端出版的系统,其特征在于:包括PDF处理子系统、PDF版面分析与信息抽取子系统、跨终端自适应重组子系统、日志管理子系统、以及具有版式信息的XML文档库,其中:
所述的PDF处理子系统从用户获得PDF文档,然后根据PDF固有的物理结构和逻辑结构,经过PDF处理子系统自带的PDF处理引擎将PDF内容流输出,形成结构良好的XML文档;
所述的PDF版面分析与信息抽取子系统,对结构良好的XML文档进行进一步的处理,分析PDF的版面信息,将抽取规则中的语义项与数据项特征的映射关系转换为语义项与数据项的映射关系,利用PDF源码中的版式数据中存在的版式信息,辅以语义分析,提取版式数据的逻辑结构,将无序、无结构的数据组织成有序、有机构的数据,从而提取必要的文字和版式信息,自动判定排版方向、合并正文块,自动还原正文阅读顺序,自动关联文章标题和正文,并进行附图与图说、文章与附图之间的自动关联,自动进行版心定位、页眉页脚和页码处理;
所述的跨终端自适应重组子系统,由服务器端根据客户端的请求生成合适阅读终端的页面,下载到移动阅读终端并在终端上进行显示,服务器端负责数字内容的绘制工作,对于PC或者具有较大屏幕的移动阅读终端,服务器端生成原始版面终端,供终端客户端或者通用浏览器实现下载阅读,对于小屏幕的移动阅读终端,服务器端会根据移动阅读终端的具体的设备信息,将存储的流式和结构化数据的XML文档快速重新绘制成客户端页面;
所述的日志管理子系统包括日志分析器和用户行为日志数据库,通过检索器建立用户接口,方便用户查询检索信息,将用户的行为记录在用户行为日志数据库中,作为日志分析器的依据,日志管理子系统记录用户在各个子系统中的行为情况,并且将日志情况汇集到日志管理子系统中,用于数据的查询和分析。
所述的一种实现数字内容跨终端出版的方法,其特征在于:跨终端自适应重组子系统的自适应过程如下:
将XML文档进行格式化处理:分析如何利用工具将XML文档转化为XML树;
终端设备信息的获取:分析如何获取终端设备的信息以及提取终端设备信息,并为终端建立数据库,记录终端设备信息参数;
图片资源的下载和适配:分析如何将从PDF中抽取得到的图片进行处理,并利用终端设备信息库对图片进行相应的格式转换和大小自适应改变;
文本资源的适配:分析如何利用建立的终端设备信息库对文本设置进行自适应重组,并添加新的版式风格。
所述的一种实现数字内容跨终端出版的方法,其特征在于:所述的具有版式信息的XML文档库包括数据库、文本库、图片库、版式信息库,其中版式信息库是经过标引形成的PDF版式信息库。
所述的一种实现数字内容跨终端出版的方法,其特征在于:所述的PDF引擎,可以解析不同版本的PDF文档,可以对PDF文档进行内容提取和结构分析。
所述的一种实现数字内容跨终端出版的方法,其特征在于:所述的PDF版面分析与信息抽取,提供用户PDF编辑视图,提供自定义语义标引操作,能够满足用户自主进行版面分析操作和信息抽取,形成具有语义、版式、文本、图片等PDF文档信息库。
所述的一种实现数字内容跨终端出版的方法,其特征在于:所述的终端自适应重组,能够根据终端设备的具体设备信息,进行终端自适应重组算法处理,将具有版式信息的XML文档进行自适应重组,完成跨终端的数字内容出版。
所述的一种实现数字内容跨终端出版的方法,其特征在于:所述的日志管理,能够采集用户在系统中操作过程中的行为操作,且能够根据日志分析器分析用户行为操作。
本发明的有益效果是:
现有技术中的对PDF转化为XML的描述,无法做到对PDF内容和版式的完全解析,无法对PDF页面信息准确的附加语义,无法根据用户自主标引PDF页面语义。而在跨终端自适应方面,也仅仅局限于将版式的出版文档转化为流式文档,没有添加相应版式信息,无法满足跨终端出版的多样化需求。
本发明方法中:用户通过用户接口,利用PDF处理引擎将PDF文档转化为结构良好的XML文档,同时将用户的行为记录在用户行为日志数据库中,作为日志分析器的依据。转化成结构良好的XML文档经过PDF版面分析与信息抽取引擎,以PDF视图的形式呈现在用户的客户端,根据用户自定义的语义描述转化为具有语义信息的XML文档,并存入数字内容管理的XML库,并建立具有版式信息的XML文档库。XML文档库记录了版式数据中存在的版式信息,包括:位置、字体、字号、颜色、辅助信息、版式风格等。终端使用者通过终端设备可以通过网络访问具有版式信息的XML文档库,并由服务器根据终端设备信息,查询设备库信息,将具有版式信息的XML文档进行终端自适应重组,重新加上版式渲染,显示在终端设备上 。
本发明对出版社进行数字化内容跨终端的出版将有更加迫切的需求。目前国内数字内容跨终端出版还处于技术突破的前沿,因此实现数字内容跨终端出版的方法为我国蓬勃发展的数字出版、语义出版提供跨终端的个性化服务。有效的缓解数字出版过程的关键技术问题,对促进数字内容的跨终端出版起着关键作用。同时,改方法对建立其它格式的跨终端出版具有指导性意义。
附图说明
图1本发明的数字内容跨终端出版平台示意图。
图2实现数字内容跨终端出版方法实施方框图。
图3实现数字内容跨终端出版方法的流程图。
具体实施方式
一种实现数字内容跨终端出版的系统,其特征在于:包括PDF处理子系统、PDF版面分析与信息抽取子系统、跨终端自适应重组子系统、日志管理子系统、以及具有版式信息的XML文档库,其中:
所述的PDF处理子系统从用户获得PDF文档,然后根据PDF固有的物理结构和逻辑结构,经过PDF处理子系统自带的PDF处理引擎将PDF内容流输出,形成结构良好的XML文档;
所述的PDF版面分析与信息抽取子系统,对结构良好的XML文档进行进一步的处理,分析PDF的版面信息,将抽取规则中的语义项与数据项特征的映射关系转换为语义项与数据项的映射关系,利用PDF源码中的版式数据中存在的版式信息,辅以语义分析,提取版式数据的逻辑结构,将无序、无结构的数据组织成有序、有机构的数据,从而提取必要的文字和版式信息,自动判定排版方向、合并正文块,自动还原正文阅读顺序,自动关联文章标题和正文,并进行附图与图说、文章与附图之间的自动关联,自动进行版心定位、页眉页脚和页码处理;
所述的跨终端自适应重组子系统,由服务器端根据客户端的请求生成合适阅读终端的页面,下载到移动阅读终端并在终端上进行显示,服务器端负责数字内容的绘制工作,对于PC或者具有较大屏幕的移动阅读终端,服务器端生成原始版面终端,供终端客户端或者通用浏览器实现下载阅读,对于小屏幕的移动阅读终端,服务器端会根据移动阅读终端的具体的设备信息,将存储的流式和结构化数据的XML文档快速重新绘制成客户端页面;
所述的日志管理子系统包括日志分析器和用户行为日志数据库,通过检索器建立用户接口,方便用户查询检索信息,将用户的行为记录在用户行为日志数据库中,作为日志分析器的依据,日志管理子系统记录用户在各个子系统中的行为情况,并且将日志情况汇集到日志管理子系统中,用于数据的查询和分析。
跨终端自适应重组子系统的自适应过程如下:
将XML文档进行格式化处理:分析如何利用工具将XML文档转化为XML树;
终端设备信息的获取:分析如何获取终端设备的信息以及提取终端设备信息,并为终端建立数据库,记录终端设备信息参数;
图片资源的下载和适配:分析如何将从PDF中抽取得到的图片进行处理,并利用终端设备信息库对图片进行相应的格式转换和大小自适应改变;
文本资源的适配:分析如何利用建立的终端设备信息库对文本设置进行自适应重组,并添加新的版式风格。
具有版式信息的XML文档库包括数据库、文本库、图片库、版式信息库,其中版式信息库是经过标引形成的PDF版式信息库。
PDF引擎,可以解析不同版本的PDF文档,可以对PDF文档进行内容提取和结构分析。
PDF版面分析与信息抽取,提供用户PDF编辑视图,提供自定义语义标引操作,能够满足用户自主进行版面分析操作和信息抽取,形成具有语义、版式、文本、图片等PDF文档信息库。
终端自适应重组,能够根据终端设备的具体设备信息,进行终端自适应重组算法处理,将具有版式信息的XML文档进行自适应重组,完成跨终端的数字内容出版。
日志管理,能够采集用户在系统中操作过程中的行为操作,且能够根据日志分析器分析用户行为操作。
图1是本发明的数字内容跨终端出版平台示意图。在图1中:
PDF处理模块,PDF版面分析与信息抽取模块,跨终端自适应重组模块作为平台的三个重要的主体模块。
PDF处理模块,负责接收用户提交的PDF文档,根据PDF处理引擎,将PDF内容解析并生成结构良好的XML文档。
PDF版面分析与信息抽取模块,对结构良好的XML文档进行处理,并根据PDF版式和用户版面分析的结果形成具有版式信息的XML文档。
跨终端自适应重组模块,则是跨终端出版的具体实现模块,根据终端设备的设备信息,结合平台自身建立的终端设备信息,将具有版式信息的XML文档库在服务器上进行自适应重组并发送给终端设备上。
平台建立的结构良好的XML文档库属于中间过渡文档库,保存初步解析的PDF文档,主要保存PDF内容及其对应的坐标信息等。
具有版式信息的XML文档库则保存了PDF具体的版式信息和用户自定义的语义信息,可以用于具体的语义查询。也是作为数字内容跨终端出版的重要信息依据。
终端设备库则记录了终端设备信息,包括屏幕大小、型号等,作为自适应重组的主要依据。
图2是实现数字内容跨终端出版方法实施方框图。
从功能模块上划分,用于实现数字内容跨终端出版系统由PDF处理子系统,PDF版面分析与信息抽取子系统,跨终端自适应重组子系统,日志管理子系统构成。
PDF处理子系统经过系统控制器,将PDF文档转化处理进入结构良好的XML文档库。
系统控制由DTD文档定义、PDF处理引擎。其中DTD文档定义负责XML描述,根据用户的具体需求,提供XML描述的DTD文档定义,PDF处理引擎则负责原始PDF文档的解析,对PDF文档的内容和结构进行描述。
PDF版面分析与信息抽取子系统包括PDF视图、PDF版面分析、PDF信息抽取。PDF视图将PDF文档转化为用户可以交互操作视图模式,并将PDF文档进行简单的版面划分;PDF版面分析提供用户交互操作,根据用户划分PDF的版面结构进行标引,并能够自定义编辑PDF版面;PDF信息抽取根据用户标引的版面结构,进行PDF的信息抽取并生成具有版式信息的XML文档。
终端自适应重组子系统,服务器根据用户客户端的终端设备信息,查询设备库的终端设备信息,从XML文档库中取出相应的文档,在服务器上进行自适应重组,将文档发送到用户的客户端。
日志管理子系统包括用户行为日志数据库和日志分析器。用户行为日志数据库记录用户在整体系统中的行为操作。日志分析器则负责分析整体系统的用户行为数据。
图3是实现数字内容跨终端出版方法的流程图。
PDF处理引擎开始初始化,用户提交PDF文档,开始进行PDF文档引擎的处理,对PDF文档进行内容和结构解析,将解析的结果保存到XML文档库,对PDF文档进行版面分析额信息抽取,建立具有版式信息的XML文档库,如果有新的PDF转化任务需要处理,则继续进行PDF的转化,获取终端设备信息,查询设备库设备信息,在服务器上进行自适应重组,最终实现终端出版。

Claims (7)

1.一种实现数字内容跨终端出版的系统,其特征在于:包括PDF处理子系统、PDF版面分析与信息抽取子系统、跨终端自适应重组子系统、日志管理子系统、以及具有版式信息的XML文档库,其中:
所述的PDF处理子系统从用户获得PDF文档,然后根据PDF固有的物理结构和逻辑结构,经过PDF处理子系统自带的PDF处理引擎将PDF内容流输出,形成结构良好的XML文档;
所述的PDF版面分析与信息抽取子系统,对结构良好的XML文档进行进一步的处理,分析PDF的版面信息,将抽取规则中的语义项与数据项特征的映射关系转换为语义项与数据项的映射关系,利用PDF源码中的版式数据中存在的版式信息,辅以语义分析,提取版式数据的逻辑结构,将无序、无结构的数据组织成有序、有机构的数据,从而提取必要的文字和版式信息,自动判定排版方向、合并正文块,自动还原正文阅读顺序,自动关联文章标题和正文,并进行附图与图说、文章与附图之间的自动关联,自动进行版心定位、页眉页脚和页码处理;
所述的跨终端自适应重组子系统,由服务器端根据客户端的请求生成合适阅读终端的页面,下载到移动阅读终端并在终端上进行显示,服务器端负责数字内容的绘制工作,对于PC或者具有较大屏幕的移动阅读终端,服务器端生成原始版面终端,供终端客户端或者通用浏览器实现下载阅读,对于小屏幕的移动阅读终端,服务器端会根据移动阅读终端的具体的设备信息,将存储的流式和结构化数据的XML文档快速重新绘制成客户端页面;
所述的日志管理子系统包括日志分析器和用户行为日志数据库,通过检索器建立用户接口,方便用户查询检索信息,将用户的行为记录在用户行为日志数据库中,作为日志分析器的依据,日志管理子系统记录用户在各个子系统中的行为情况,并且将日志情况汇集到日志管理子系统中,用于数据的查询和分析。
2.根据权利要求1所述的一种实现数字内容跨终端出版的方法,其特征在于:跨终端自适应重组子系统的自适应过程如下:
将XML文档进行格式化处理:分析如何利用工具将XML文档转化为XML树;
终端设备信息的获取:分析如何获取终端设备的信息以及提取终端设备信息,并为终端建立数据库,记录终端设备信息参数;
图片资源的下载和适配:分析如何将从PDF中抽取得到的图片进行处理,并利用终端设备信息库对图片进行相应的格式转换和大小自适应改变;
文本资源的适配:分析如何利用建立的终端设备信息库对文本设置进行自适应重组,并添加新的版式风格。
3.根据权利要求1所述的一种实现数字内容跨终端出版的方法,其特征在于:所述的具有版式信息的XML文档库包括数据库、文本库、图片库、版式信息库,其中版式信息库是经过标引形成的PDF版式信息库。
4.根据权利要求1所述的一种实现数字内容跨终端出版的方法,其特征在于:所述的PDF引擎,可以解析不同版本的PDF文档,可以对PDF文档进行内容提取和结构分析。
5.根据权利要求1所述的一种实现数字内容跨终端出版的方法,其特征在于:所述的PDF版面分析与信息抽取,提供用户PDF编辑视图,提供自定义语义标引操作,能够满足用户自主进行版面分析操作和信息抽取,形成具有语义、版式、文本、图片等PDF文档信息库。
6.根据权利要求1所述的一种实现数字内容跨终端出版的方法,其特征在于:所述的终端自适应重组,能够根据终端设备的具体设备信息,进行终端自适应重组算法处理,将具有版式信息的XML文档进行自适应重组,完成跨终端的数字内容出版。
7.根据权利要求1所述的一种实现数字内容跨终端出版的方法,其特征在于:所述的日志管理,能够采集用户在系统中操作过程中的行为操作,且能够根据日志分析器分析用户行为操作。
CN201410270214.0A 2014-06-17 2014-06-17 一种实现数字内容跨终端出版的系统 Pending CN104090920A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410270214.0A CN104090920A (zh) 2014-06-17 2014-06-17 一种实现数字内容跨终端出版的系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410270214.0A CN104090920A (zh) 2014-06-17 2014-06-17 一种实现数字内容跨终端出版的系统

Publications (1)

Publication Number Publication Date
CN104090920A true CN104090920A (zh) 2014-10-08

Family

ID=51638636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410270214.0A Pending CN104090920A (zh) 2014-06-17 2014-06-17 一种实现数字内容跨终端出版的系统

Country Status (1)

Country Link
CN (1) CN104090920A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701073A (zh) * 2015-12-31 2016-06-22 北京中科江南信息技术股份有限公司 版式文件的生成方法及装置
CN107122627A (zh) * 2017-03-28 2017-09-01 镇江睿泰资产管理有限公司 基于云计算的数字出版系统
CN107977346A (zh) * 2017-11-23 2018-05-01 万兴科技股份有限公司 一种pdf文档编辑方法及终端设备
CN108563621A (zh) * 2018-04-28 2018-09-21 江苏国泰新点软件有限公司 一种pdf报表生成方法、装置、设备及存储介质
CN108984676A (zh) * 2018-07-02 2018-12-11 四川长虹电器股份有限公司 一种基于xml的电子书跨终端自适应显示系统及方法
CN109002425A (zh) * 2018-06-19 2018-12-14 平安科技(深圳)有限公司 企业上下游关系的获取方法、终端设备及介质
CN117236282A (zh) * 2023-10-24 2023-12-15 雅昌文化(集团)有限公司 基于xml数据的智能排版方法、装置、终端及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271463A (zh) * 2007-06-22 2008-09-24 北大方正集团有限公司 版式文件逻辑结构信息的表示方法和系统
CN102855243A (zh) * 2011-06-28 2013-01-02 北大方正集团有限公司 用于提取文档结构的方法和装置
CN103399857A (zh) * 2013-07-01 2013-11-20 北京航空航天大学 一种通用文档结构信息抽取方法
CN103744983A (zh) * 2014-01-15 2014-04-23 北京理工大学 一种电子文档的元信息提取方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271463A (zh) * 2007-06-22 2008-09-24 北大方正集团有限公司 版式文件逻辑结构信息的表示方法和系统
CN102855243A (zh) * 2011-06-28 2013-01-02 北大方正集团有限公司 用于提取文档结构的方法和装置
CN103399857A (zh) * 2013-07-01 2013-11-20 北京航空航天大学 一种通用文档结构信息抽取方法
CN103744983A (zh) * 2014-01-15 2014-04-23 北京理工大学 一种电子文档的元信息提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
昌磊等: ""PDF文档的跨终端发布技术"", 《计算机工程与应用》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701073A (zh) * 2015-12-31 2016-06-22 北京中科江南信息技术股份有限公司 版式文件的生成方法及装置
CN107122627A (zh) * 2017-03-28 2017-09-01 镇江睿泰资产管理有限公司 基于云计算的数字出版系统
CN107977346A (zh) * 2017-11-23 2018-05-01 万兴科技股份有限公司 一种pdf文档编辑方法及终端设备
CN107977346B (zh) * 2017-11-23 2021-06-15 深圳市亿图软件有限公司 一种pdf文档编辑方法及终端设备
CN108563621A (zh) * 2018-04-28 2018-09-21 江苏国泰新点软件有限公司 一种pdf报表生成方法、装置、设备及存储介质
CN109002425A (zh) * 2018-06-19 2018-12-14 平安科技(深圳)有限公司 企业上下游关系的获取方法、终端设备及介质
WO2019242125A1 (zh) * 2018-06-19 2019-12-26 平安科技(深圳)有限公司 企业上下游关系的获取方法、装置、终端设备及介质
CN109002425B (zh) * 2018-06-19 2022-03-22 平安科技(深圳)有限公司 企业上下游关系的获取方法、终端设备及介质
CN108984676A (zh) * 2018-07-02 2018-12-11 四川长虹电器股份有限公司 一种基于xml的电子书跨终端自适应显示系统及方法
CN108984676B (zh) * 2018-07-02 2021-01-26 四川长虹电器股份有限公司 一种基于xml的电子书跨终端自适应显示系统及方法
CN117236282A (zh) * 2023-10-24 2023-12-15 雅昌文化(集团)有限公司 基于xml数据的智能排版方法、装置、终端及介质

Similar Documents

Publication Publication Date Title
CN104090920A (zh) 一种实现数字内容跨终端出版的系统
US8181106B2 (en) Use of overriding templates associated with customizable elements when editing a web page
CN109408783A (zh) 电子文档在线编辑方法及系统
CN109582647B (zh) 一种面向非结构化证据文件的分析方法及系统
CN111125598A (zh) 数据智能查询方法、装置、设备及存储介质
WO2009000141A1 (fr) Procédé, système et dispositif de représentation d'informations de structure logique de fichier de mise en page
CN107423265A (zh) 启动字体子集
CN102662997A (zh) 一种存储xml数据到关系数据库的方法
CN102855244B (zh) 文档目录处理方法和装置
CN101714133A (zh) 一种基于web的数学公式编辑系统及方法
CN105224544A (zh) 一种数据库的数据编辑方法及装置
CN102289497A (zh) 文档预览图生成系统及方法
CN102880683A (zh) 一种可行性研究报告的自动网络生成系统及其生成方法
CN113836235B (zh) 基于数据中台的数据处理方法及其相关设备
JP2023010805A (ja) ドキュメント情報抽出モデルのトレーニングおよびドキュメント情報の抽出のための方法、装置、電子機器、記憶媒体並びにコンピュータプログラム
CN103593277A (zh) 日志处理方法及系统
Nadee et al. Towards data extraction of dynamic content from JavaScript Web applications
CN108170409A (zh) Web前端控件的开发方法和系统
WO2007081017A1 (ja) 文書処理装置
CN109471957B (zh) 一种基于统一标签的元数据转换方法及装置
CN107562936A (zh) 一种基于Jsoup的网页新闻列表的抓取及保存方法
Chen et al. A Structured Information Extraction Algorithm for Scientific Papers based on Feature Rules Learning.
CN103218354A (zh) 一种在线翻译记忆交换方法和系统
CN111859886B (zh) 一种基于产品原型界面的文档生成方法和装置
KR100762712B1 (ko) 규칙기반의 전자문서 변환방법 및 그 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20141008