CN113065316A - 将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法 - Google Patents

将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法 Download PDF

Info

Publication number
CN113065316A
CN113065316A CN202110330785.9A CN202110330785A CN113065316A CN 113065316 A CN113065316 A CN 113065316A CN 202110330785 A CN202110330785 A CN 202110330785A CN 113065316 A CN113065316 A CN 113065316A
Authority
CN
China
Prior art keywords
square
html
file
item
thumbnail file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110330785.9A
Other languages
English (en)
Inventor
王蒙恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Luoyang Shengangtong Network Technology Co ltd
Original Assignee
Luoyang Shengangtong Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Luoyang Shengangtong Network Technology Co ltd filed Critical Luoyang Shengangtong Network Technology Co ltd
Priority to CN202110330785.9A priority Critical patent/CN113065316A/zh
Publication of CN113065316A publication Critical patent/CN113065316A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/154Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/189Automatic justification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法,包括上传文件、将方正小样文件及资源包结构化处理、进一步处理形成新的小样文件、将新的小样文件导入方正书版进行二次排版设计。本发明解决的技术问题在于提供一种将方正小样文件处理转换成HTML并录入题库的方法,随着题库的积累和丰富,就能协助编辑从题库中快速选题组稿,同时可以将对应的方正书版排版命令的原数据组合形成新的小样文件,提升整个编辑排版的效率。

Description

将方正小样文件动态转换成html并录入题库、从题库选题组 稿并生成小样文件的方法
技术领域
本发明涉及方正书版排版技术和计算机编程开发技术领域,更具体地说是一种将方正小样文件动态转换成html并录入题库,从题库选题组稿并生成小样文件的方法、装置及系统。
背景技术
方正书版是专业中文处理领域应用最为广泛的一款排版软件之一。在书刊制作、办公文印编排、电子图书制作等领域有广泛应用。方正书版批处理的模式非常适宜排版长文字,以及对于版式内容要求严格的文档,在编排效率和规范性上具备显著的优势。传统的出版物编写后通过方正书版进行设计排版,整体流程复杂、效率低,小样文件模板的修改花费大量人力物力,小样文件的生成效率较低。目前大部分教辅用书上的试题如果要录入题库,是通过将方正书版导出的pdf的每道试题进行截图,然后录入题库,效率很低。
出版物编写人员通常将一个定稿文件给方正排版人员进行设计排版;排版人员往往需要很大的工作量,才能完成一个方正书版小样文件的制作;目前尚未有一项技术能利用题库选题组稿并自动将稿件转换换成方正书版小样格式文件,从而达到快速组稿排版的目的。
发明内容
本发明解决的技术问题在于提供一种将方正小样文件处理转换成HTML并录入题库的方法,同时客户端通过题库选题组稿之后,可以将对应的方正书版排版命令的原数据组合形成新的小样文件。
为实现上述目的,本发明提供如下技术方案:
一种将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法,包括以下步骤:
S1.用户端采集用户上传的方正书版小样文件以及方正书版小样文件所关联的文件压缩包;压缩包主要包括以tif、tiff、eps等格式的图片文件。文件来自题库,字段包括但不限于:阶段、科目、版本、年级、书名、章节。
S2.web服务器对需要识别的小样内容进行结果获取和数据匹配,通过预先定义的转换规将获得的元素、图片、表格、公式、大小、位置等参数进行转义、优化、层次区分和CSS样式转存和注释标记;所述预先定义的转换规则包括去除方正小样文件中无用的标签和注释,提取方正书版命令文本及文本属性,提取表格标签,提取字体标签,提取数学、化学公式标签,提取插入图片命令标签,提取特殊的字符,提取答案、解析等方正书版命令及其属性并转换成相应的css样式;
S3.web服务器将上传的方正书版小样所关联的文件压缩包解压,通过程序将tif、eps、mps等格式的图片(此类图片无法在网页中正常显示)转换成png、jpg、jpeg格式图片,使得图片可以在网页中正常显示;
S4.对方正小样内容进行预处理,在不同的科目中匹配不同的处理规则,对不同科目的源文件进行相应的匹配、拆分、处理,根据匹配类型将方正小样内容转换成标准HTML标签及对应属性和事件,调用内置库中网页形式的可编辑模板;加载转义后的HTML数据并发送给用户端,返回对应的HTML可编辑模板,可以对转义后的html文档进行二次编辑修改,客户端用户审查之后提交web服务端处理;
S5.web服务器将提交的数据进行拆分处理,将方正小样文件及资源包进行结构化处理,拆分成每道小题并转换成相应的HTML。将拆分后的每个小题进行处理、匹配相应的属性并录入题库,同时将对应的方正书版小样文件所对应的原数据一并存入数据库。所述拆分处理规则包括通过注释标记从内容中获取大题号、小题号、题目类型(选择题、填空题、判断题、应用题等)、分值、答案、解析、来源、难易度等。
S6.客户端可以通过题库进行选题、组稿,形成新的组合的稿件,同时也可以将对应的方正书版排版命令原数据组合形成新的小样文件。
S7.将新的小样文件导入方正书版进行二次排版设计。
本发明的技术效果和优点:
本发明解决的技术问题在于提供一种将方正小样文件处理转换成HTML并录入题库的方法,随着题库的积累和丰富,就能协助编辑从题库中快速选题组稿,同时可以将对应的方正书版排版命令的原数据组合形成新的小样文件,提升整个编辑排版的效率。
附图说明
图1为本发明方法框图;
图2为后台系统界面示意图;
图3为查看导入的内容的界面示意图;
图4为前台系统界面示意图;
图5为前台系统另一界面示意图;
图6为将小样文件导入方正书版进行二次排版设计的示意图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
如图1所示的一种将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法,包括以下步骤,
S1.用户端采集用户上传的方正书版小样文件以及方正书版小样文件所关联的文件压缩包;压缩包主要包括以tif、tiff、eps等格式的图片文件。文件来自题库,字段包括但不限于:阶段、科目、版本、年级、书名、章节。
S2.web服务器对需要识别的小样内容进行结果获取和数据匹配,通过预先定义的转换规将获得的元素、图片、表格、公式、大小、位置等参数进行转义、优化、层次区分和CSS样式转存和注释标记;所述预先定义的转换规则包括去除方正小样文件中无用的标签和注释,提取方正书版命令文本及文本属性,提取表格标签,提取字体标签,提取数学、化学公式标签,提取插入图片命令标签,提取特殊的字符,提取答案、解析等方正书版命令及其属性并转换成相应的css样式;
S3.web服务器将上传的方正书版小样所关联的文件压缩包解压,通过程序将tif、eps、mps等格式的图片(此类图片无法在网页中正常显示)转换成png、jpg、jpeg格式图片,使得图片可以在网页中正常显示;
S4.对方正小样内容进行预处理,在不同的科目中匹配不同的处理规则,对不同科目的源文件进行相应的匹配、拆分、处理,根据匹配类型将方正小样内容转换成标准HTML标签及对应属性和事件,调用内置库中网页形式的可编辑模板;加载转义后的HTML数据并发送给用户端,返回对应的HTML可编辑模板,可以对转义后的html文档进行二次编辑修改,客户端用户审查之后提交web服务端处理;
S5.web服务器将提交的数据进行拆分处理,将方正小样文件及资源包进行结构化处理,拆分成每道小题并转换成相应的HTML。将拆分后的每个小题进行处理、匹配相应的属性并录入题库,同时将对应的方正书版小样文件所对应的原数据一并存入数据库。所述拆分处理规则包括通过注释标记从内容中获取大题号、小题号、题目类型(选择题、填空题、判断题、应用题等)、分值、答案、解析、来源、难易度等。
S6.客户端可以通过题库进行选题、组稿,形成新的组合的稿件,同时也可以将对应的方正书版排版命令原数据组合形成新的小样文件。
S7.将新的小样文件导入方正书版进行二次排版设计。
实施例二
1.如图2所示的后台系统:依次选择阶段(小学/初中/高中/大学)、科目(语文/数学/英语等)、版本(人教版/苏教版/西师版等)、年级、书名(章节)。
2.把本书(或本章节)所对应的方正小样及其关联的图片文件上传。
3.点击处理,将方正小样文件处理转换成HTML并录入题库。
4.如图3所示,可以查看导入的内容。
实施例三
1.如图4所示前台系统,根据版本、年级、知识点、题型、难易度、来源、题类进行筛选,并把需要的试题加入试题篮;
2.如图5所示,组卷之后可以对题目进行排版和替换,点击保存试卷即可下载小样文件;
3.如图6所示,将小样文件导入方正书版进行二次排版设计。
最后应说明的几点是:首先,在本申请的描述中,需要说明的是,除非另有规定和限定,术语“安装”、“相连”、“连接”应做广义理解,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变,则相对位置关系可能发生改变;
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法,其特征在于:包括以下步骤:
S1.用户端采集用户上传的方正书版小样文件以及方正书版小样文件所关联的文件压缩包;
S2.web服务器对需要识别的小样内容进行结果获取和数据匹配,通过预先定义的转换规则将获得的参数进行转义、优化、层次区分和CSS样式转存和注释标记;
S3.web服务器将上传的方正书版小样所关联的文件压缩包解压,通过程序将无法在网页中正常显示的图片转换成png、jpg、jpeg格式图片,使得图片可以在网页中正常显示;
S4.对方正小样内容进行预处理,在不同的科目中匹配不同的处理规则,对不同科目的源文件进行相应的匹配、拆分、处理,根据匹配类型将方正小样内容转换成标准HTML标签及对应属性和事件,调用内置库中网页形式的可编辑模板;加载转义后的HTML数据并发送给用户端,返回对应的HTML可编辑模板,可以对转义后的html文档进行二次编辑修改,客户端用户审查之后提交web服务端处理;
S5.web服务器将提交的数据进行拆分处理,将方正小样文件及资源包进行结构化处理,拆分成每道小题并转换成相应的HTML;将拆分后的每个小题进行处理、匹配相应的属性并录入题库,同时将对应的方正书版小样文件所对应的原数据一并存入数据库;
S6.客户端可以通过题库进行选题、组稿,形成新的组合的稿件,同时也可以将对应的方正书版排版命令原数据组合形成新的小样文件;
S7.将新的小样文件导入方正书版进行二次排版设计。
2.根据权利要求1所述的一种将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法,其特征在于:所述步骤S1中,小样文件所关联的文件压缩包包括但不限定于tif、tiff、eps格式的图片文件。
3.根据权利要求1所述的一种将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法,其特征在于:所述步骤S1中,用户上传的文件与题库结构关联,字段包括但不限于:阶段、科目、版本、年级、书名、章节。
4.根据权利要求1所述的一种将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法,其特征在于:所述步骤2中的参数包括但不限于元素、图片、表格、公式、大小、位置。
5.根据权利要求1所述的一种将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法,其特征在于:步骤2中,所述预先定义的转换规则包括去除方正小样文件中无用的标签和注释,提取方正书版命令文本及文本属性,提取表格标签,提取字体标签,提取数学、化学公式标签,提取插入图片命令标签,提取特殊的字符,提取答案、解析等方正书版命令及其属性并转换成相应的css样式。
6.根据权利要求1所述的一种将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法,其特征在于:所述步骤是S5中,拆分处理规则包括但不限于通过注释标记从内容中获取大题号、小题号、题目类型、分值、答案、解析、来源、难易度。
7.根据权利要求1所述的一种将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法,其特征在于:所述无法在网页中正常显示的图片包括但不限于tif、eps、mps格式的图片。
CN202110330785.9A 2021-03-26 2021-03-26 将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法 Pending CN113065316A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110330785.9A CN113065316A (zh) 2021-03-26 2021-03-26 将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110330785.9A CN113065316A (zh) 2021-03-26 2021-03-26 将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法

Publications (1)

Publication Number Publication Date
CN113065316A true CN113065316A (zh) 2021-07-02

Family

ID=76563983

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110330785.9A Pending CN113065316A (zh) 2021-03-26 2021-03-26 将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法

Country Status (1)

Country Link
CN (1) CN113065316A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722153A (zh) * 2021-09-01 2021-11-30 珠海华发金融科技研究院有限公司 文本图片备份方法、装置、设备及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004126999A (ja) * 2002-10-03 2004-04-22 Ntt Comware Corp 書籍出版作業支援システムおよび書籍出版作業支援プログラム
CN104199871A (zh) * 2014-08-19 2014-12-10 南京富士通南大软件技术有限公司 一种用于智慧教学的高速化试题导入方法
CN106874240A (zh) * 2016-12-22 2017-06-20 华南师范大学 数字出版方法及系统
CN107644019A (zh) * 2016-07-20 2018-01-30 江苏云媒数字科技有限公司 一种超媒体电子书内容制作系统
CN107644027A (zh) * 2016-07-20 2018-01-30 江苏云媒数字科技有限公司 一种超媒体元数据合成与转换系统
CN111209728A (zh) * 2020-01-13 2020-05-29 深圳市企鹅网络科技有限公司 一种试题自动标注录入方法
CN111651963A (zh) * 2020-05-14 2020-09-11 上海卓越睿新数码科技有限公司 一种用word导入题库生成试卷的技术

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004126999A (ja) * 2002-10-03 2004-04-22 Ntt Comware Corp 書籍出版作業支援システムおよび書籍出版作業支援プログラム
CN104199871A (zh) * 2014-08-19 2014-12-10 南京富士通南大软件技术有限公司 一种用于智慧教学的高速化试题导入方法
CN107644019A (zh) * 2016-07-20 2018-01-30 江苏云媒数字科技有限公司 一种超媒体电子书内容制作系统
CN107644027A (zh) * 2016-07-20 2018-01-30 江苏云媒数字科技有限公司 一种超媒体元数据合成与转换系统
CN106874240A (zh) * 2016-12-22 2017-06-20 华南师范大学 数字出版方法及系统
CN111209728A (zh) * 2020-01-13 2020-05-29 深圳市企鹅网络科技有限公司 一种试题自动标注录入方法
CN111651963A (zh) * 2020-05-14 2020-09-11 上海卓越睿新数码科技有限公司 一种用word导入题库生成试卷的技术

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
丁革建, 钱华斌: "方正小样文件转换成HTML文件", 电脑编程技巧与维护, no. 11, pages 56 - 58 *
徐晓峰, 张大力: "中文科技期刊自动上网系统", 清华大学学报(自然科学版), no. 09, pages 122 - 125 *
杨海亮: "提取方正排版文件广义元数据并生成全文HTML的探索", 中国科技期刊研究, vol. 27, no. 2, pages 202 - 206 *
武芒,马惠敏,刘志镜: "基于Web的远程教育平台的系统设计与实现", 电子科技, no. 01, pages 18 - 20 *
胡能发: "基于方正书版的通用试题库设计", 长江大学学报(自然科学版), vol. 8, no. 4, pages 71 - 73 *
郭俊仓;杨琦;靖稳峰;: "方正小样向超文本转换的实现", 中国科技期刊研究, vol. 14, no. 02, pages 183 - 185 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722153A (zh) * 2021-09-01 2021-11-30 珠海华发金融科技研究院有限公司 文本图片备份方法、装置、设备及系统

Similar Documents

Publication Publication Date Title
CN110334346B (zh) 一种pdf文件的信息抽取方法和装置
US6353840B2 (en) User-defined search template for extracting information from documents
US20090110288A1 (en) Document processing apparatus and document processing method
US20190171708A1 (en) Assistive technology for the impaired
US20050235202A1 (en) Automatic graphical layout printing system utilizing parsing and merging of data
JP2008234658A (ja) テキスト検索エンジンにより検索されたページ番号付き文書全体を通してのコースツーファイン・ナビゲーション
US20120265759A1 (en) File processing of native file formats
CN108197119A (zh) 基于知识图谱的纸质档案数字化方法
CN116090560B (zh) 基于教材的知识图谱建立方法、装置及系统
CN115828874A (zh) 基于图像识别技术的行业表格数字化处理方法
JP2009110500A (ja) ドキュメント処理装置、ドキュメント処理方法、ドキュメント処理装置のプログラム
US20080270879A1 (en) Computer-readable medium, document processing apparatus and document processing system
CN113065316A (zh) 将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法
WO2022038821A1 (ja) 表構造認識装置及び方法
US20230046344A1 (en) Systems, Methods, and Devices for a Form Converter
US9195661B2 (en) Method and system for click-thru capability in electronic media
CN111241955B (zh) 一种票据信息提取方法及系统
US10606928B2 (en) Assistive technology for the impaired
Alzuru et al. Cooperative human-machine data extraction from biological collections
JP7430219B2 (ja) 文書情報構造化装置、文書情報構造化方法およびプログラム
Gribomont OCR with Google Vision API and Tesseract
Hast et al. TexT-Text Extractor Tool for Handwritten Document Transcription and Annotation
JP4013748B2 (ja) 文書生成装置
JP5085147B2 (ja) レイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体
Gribomont Programming Historian

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination