CN111079385A - 一种科学公式格式转换的方法和装置 - Google Patents

一种科学公式格式转换的方法和装置 Download PDF

Info

Publication number
CN111079385A
CN111079385A CN201911358665.9A CN201911358665A CN111079385A CN 111079385 A CN111079385 A CN 111079385A CN 201911358665 A CN201911358665 A CN 201911358665A CN 111079385 A CN111079385 A CN 111079385A
Authority
CN
China
Prior art keywords
format
data format
conversion
data
formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911358665.9A
Other languages
English (en)
Inventor
高超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaochuanchuhai Education Technology Beijing Co ltd
Original Assignee
Xiaochuanchuhai Education Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaochuanchuhai Education Technology Beijing Co ltd filed Critical Xiaochuanchuhai Education Technology Beijing Co ltd
Priority to CN201911358665.9A priority Critical patent/CN111079385A/zh
Publication of CN111079385A publication Critical patent/CN111079385A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明提供了一种科学公式格式转换的方法,即:获取待转换的科学公式的初始数据格式和目标数据格式,对公式进行解析,验证内容的合法性并结构化公式数据;根据目标数据格式,进行格式转换;对转换后的公式数据进行格式化,生产统一标准的数据。本发明以MathML格式的数据为核心,解决了在不能直接转换的两种科学公式格式之间转换的问题,同时提供了一种包含解析模块,转换模块和格式化模块的科学公式转换装置,对转换完成的文件进行了规范。

Description

一种科学公式格式转换的方法和装置
技术领域
本发明属于公式转换领域,尤其涉及一种科学公式格式转换的方法和装置。
背景技术
当用户需要在文档中使用科学公式时,在不同的场景下,根据软件和运行软件平台的不同,会有不同的最佳组合。如,在Web网页端为了制作或审校文档而显示科学公式时,使用SVG格式或MathML格式的科学公式能够达到较好的效果;在排版印刷场景下,由于Tex印刷系统功能强大,因此Latex格式的科学公式数据更好;在文字处理场景下,Windows平台下的OMML格式或MathType格式的科学公式数据与Word软件兼容性更好。为满足在不同场景下使用同一科学公式的需求,需要对科学公式数据进行格式转换。
由于现有的主流文字处理软件如Office Word,主流科学公式编辑软件如MathType,主流排版印刷软件如Tex彼此均相互不兼容;同时,MathType官方SDK对Latex中的中文进行转换后中文变为乱码,且对于很多Latex命令无法支持,故,对于用户而言,含有科学公式的电子文档格式转换,尤其是对承载有科学公式的数据进行任意、迅速的格式转换难度增大,为了使公式可以在不同场景中展示和编辑,公式格式的转换就成为了必须解决的问题。
现有的科学公式转换解决方案受到操作系统平台等因素的制约,具有下列缺点:
1、对于公式的格式转换,网络上也有一些解决方案,但是解决是由单一的一种格式转换为另一种格式,且对于公式的内容生产,需要针对每种格式生产多套内容,且不同格式间没有关联无法进行任意格式的转换。
2、网上现有的解决方案,转换出的格式内容不统一,极易造成数据的冗余与混乱。
发明内容
鉴于上述原因,本发明的目的是提供一种科学公式格式转换的方法和装置。本发明可以实现不同格式公式之间的相互转换。
为实现上述目的,本发明采用以下技术方案:一种科学公式格式转换的方法,其特征在于,它包括如下步骤:
获取待转换科学公式的初始数据格式和目标数据格式,对待转换公式进行解析,验证内容的合法性;
根据目标数据格式,进行格式转换;
对转换后的公式数据进行格式化,生产统一标准的数据。
进一步地,所述“对待转换公式数据进行解析,验证内容的合法性”包括:检验待转换科学公式中是否存在非法字符,如存在非法字符,则则对非法字符进行处理,直至待转换科学公式符合设置的合法标准。
进一步地,所述“根据目标数据格式,进行格式转换”前还包括,设置转换关系匹配表;
在转换关系匹配表中对初始数据格式和目标数据格式进行匹配,如查找到匹配项,则按照转换关系匹配表中设置的转换关系进行科学公式的格式转换。
进一步地,所述转换关系匹配表中的数据格式至少包括:SVG数据格式,LaTex数据格式,MathML数据格式,OMML数据格式和MathType数据格式;
所述关系匹配表中至少设置有两种数据格式之间的转换匹配关系。
进一步地,所述转换关系匹配表中设置的转换关系为:
MathML数据格式和Latex数据格式分别单向转换为SVG数据格式;
MathML数据格式与Latex数据格式相互转换;
MathML数据格式与OMML数据格式相互转换;
MathML数据格式与MathType数据格式相互转换。
进一步地,当初始数据格式为:Latex、OMML、MathType时,进行格式转换之前还包括:结构化公式数据,
所述“结构化公式数据”包括:将待转换科学公式转化为MathML数据格式的公式结构,通过MathML数据格式转换为目标数据格式。
进一步地,所述“对转换后的公式数据进行格式化”包括:
对完成格式转换的科学公式数据进行整理,检验是否存在非法字符和/或不支持字符,如存在非法字符,则删除非法字符后重新整理,直至完成格式转换的科学公式中不存在非法字符,如存在不支持字符,则替换不支持字符后重新整理,直至不存在不支持字符;
进一步地,所述非法字符至少包括:计算机中的控制字符;所述不支持字符包括:目标格式中不支持的Unicode码。
本发明还提供了一种科学公式格式转换的装置,它依次包括内容解析模块、转换模块和格式化模块;
所述内容解析模块:获取待转换的科学公式的初始数据格式和目标数据格式,对公式进行解析,验证内容的合法性;
所述转换模块:设置有转换关系匹配表,依据科学公式转换关系匹配表,结构化公式数据,将初始格式的科学公式数据转换为目标格式;
所述格式化模块:用于格式化公式数据,生产统一标准的数据。
进一步地,所述转换模块根据所述转换关系匹配表对LaTex,SVG,MathML,OMML和MathType的数据格式中至少两种数据格式进行转换;
进一步地,所述转换模块包括多个子模块:
第一子模块,所述第一转换模块将MathML数据格式单向转换为SVG数据格式;
第二子模块,所述第二转换模块将Latex数据格式单向转换为SVG数据格式;
第三子模块,所述第三转换模块将MathML数据格式与Latex数据格式相互转换;
第四子模块,所述第四转换模块将MathML数据格式与OMML数据格式相互转换;
第五子模块,所述第五转换模块将MathML数据格式与MathType数据格式相互转换;
进一步地,所述转换模块还包括:结构化模块,当初始数据格式为:Latex、OMML、MathType时,进行格式转换之前,结构化模块将待转换科学公式转化为MathML数据格式的公式结构,先转换为MathML数据格式再转换为目标数据格式。
进一步地,所述内容解析模块中设置合法性验证模块,所述合法性验证模块检验待转换科学公式中是否存在非法字符,如存在非法字符,则对非法字符进行处理,使待转换科学公式符合设置的合法标准;
进一步地,所述格式化模块对完成格式转换的科学公式数据进行整理,检验是否存在非法字符和不支持字符,如存在非法字符,则删除非法字符后重新整理,使其符合设置的格式化标准。
附图说明
图1为本发明科学公式格式转换方法流程图;
图2为本发明科学公式格式转换方法流程图
图3为本发明科学公式格式转换数据流图;
图4为本发明科学公式格式转换装置模块构成图;
图5为本发明转换关系匹配表中的各格式间转换逻辑图。
具体实施方式
下面结合附图对本发明做进一步的详细说明:
本发明开的一方面提供一种科学公式格式转换的方法,本实施例所述的方法可部分的、全部的部署在操作端、或服务器端;作为优选,本实施例部署在服务器端对公式进行转换。
参考图1,在转换时:
第一步,先获取待转换科学公式的初始数据格式和目标数据格式,对待转换公式进行解析,验证内容的合法性;
在一个实施例中,所述获取待转换科学公式的初始数据格式包括:通过提取文档中的公式内容,或通过提供一个公式录入编辑器录入,或利用编程方式操作*.tex文件来实现获取公式。*.tex文件的内容为纯文本,其中公式的latex码会使用$符号进行包裹,程序只需要提取文档内容中使用$符号包裹的内容作为公式的latex码即可。
所述“对待转换公式数据进行解析,验证内容的合法性”包括:检验待转换科学公式中是否存在非法字符,如存在非法字符,则对非法字符进行处理,使待转换科学公式符合设置的合法标准。在一个实施例中,所述的非法字符是指计算机中的控制字符。在一个实施例中,所述设置的合法标准包括:直至待转换科学公式中不存在非法字符,如不存在非法字符,则进行格式转换;在其他实施例中,合法标准也可以是允许部分公式内非实质性内容的非法字符存在,这些非实质性内容并不影响公式表达的内容。
第二步,根据目标数据格式,进行格式转换;在本步骤之前还包括,设置转换关系匹配表;在转换关系匹配表中对初始数据格式和目标数据格式进行匹配,如查找到匹配项,则按照转换关系匹配表中设置的转换关系进行科学公式的格式转换。
所述转换关系匹配表中的数据格式至少包括:SVG数据格式,LaTex数据格式,MathML数据格式,OMML数据格式和MathType数据格式;所述关系匹配表中至少设置有两种数据格式之间的转换匹配关系。
参考图5,在一个实施例中,所述转换关系匹配表中设置的转换关系为:
MathML数据格式和Latex数据格式分别单向转换为SVG数据格式;
MathML数据格式与Latex数据格式相互转换;
MathML数据格式与OMML数据格式相互转换;
MathML数据格式与MathType数据格式相互转换。
在一个实施例中,匹配了5种格式之间的相互转换,至少包括了以下多种转换情况:
1、Latex=>MathML,在一个实施例中,可使用MathJax进行格式的转换;
2、Latex、MathML=>SVG:在一个实施例中,可使用MathJax进行格式的转换;
3、MathML=>Latex:在一个实施例中,可使用自定义的XSLT将MathML转换为Latex;
4、
Figure BDA0002336626580000041
在一个实施例中,可使用word定义好的OMML2MML.xslt进行转换;
5、
Figure BDA0002336626580000042
在一个实施例中,可使用MathType官方SDK进行转换;
6、OMML、Latex转MathType:
a)将Latex、OMML先转换为MathML
b)在一个实施例中,可使用MathType SDK将MathML转换为MathType
7、MathType=>MathML:在一个实施例中,可使用MathType SDK进行转换;
8、MathType=>Latex、OMML:
a)在一个实施例中,可使用MathType SDK转换为MathML;
b)再将MathML转换为Latex、OMML。
同时,本实施例根据各数据格式的特性,还存在以下有益效果:
a)将web端生产的较大的MathML数据,转换为简短的latex码进行数据存储,减少存储空间,方便数据维护。
b)将数据存储的latex转换为可供web端直接展示及编辑的SVG或MathML格式。
在一个实施例中,当初始数据格式为:Latex、OMML、MathType时,进行格式转换之前还包括:结构化公式数据,
所述“结构化公式数据”包括:将待转换科学公式转化为MathML数据格式的公式结构,通过MathML数据格式转换为目标数据格式。由于MathML格式的公式数据对于公式的样式及结构描述的完整清晰,因此会将初始格式优先转换为MathML格式的公式数据,再由MathML格式的数据转换到目标格式,以实现了Latex、OMML、MathType和MathML之间的相互转换,Latex、OMML、MathType和MathML与SVG的相互转换,以及Latex、MathML与SVG的单向转换,达到了公式在web网页操作端、word文档编辑端以及排版印刷端多端之间的、多格式之间的互相转换。
另外,由于MathType官方SDK对latex中存在中文的转换后中文为乱码,且对于很多latex命令无法支持,但是MathML由于标记型语言的特殊性,对于公式的结构描述清晰且中文字符采用Unicode码的形式存储,MathType SDK对于MathML格式的转换效果很好,因此其他公式格式在转换到MathType公式时,都会先将公式格式统一转换为MathML格式后再使用MathtType SDK进行转换。此方法解决了MathType对latex支持有限的问题。
第三步,对转换后的公式数据进行格式化,生产统一标准的数据。所述“对转换后的公式数据进行格式化”包括:
对完成格式转换的科学公式数据进行整理,检验是否存在非法字符和/或不支持字符,如存在非法字符,则删除非法字符后重新整理,使其符合设置的格式化标准;
在一个实施例中,所述格式化标准可以设置为:直至完成格式转换的科学公式中不存在非法字符,如存在不支持字符,则替换不支持字符后重新整理,直至不存在不支持字符。在其他实施例中,也可以根据需要设置其他标准。
在一个实施例中,所述非法字符至少包括:计算机中的控制字符;所述不支持字符包括:目标格式中不支持的Unicode码。每种格式的数据支持的Unicode码的字符集不完全相同,同一种公式符号的Unicode码会有多种,公式转换会将目标格式中不支持的Unicode码替换为对应的可以支持的Unicode码。
本发明的另一方面提供一种科学公式格式转换的装置,内部部署了本公共提供的前述的转换方法,在一个实施例中,它包括内容解析模块、转换模块和格式化模块;
所述内容解析模块:获取待转换的科学公式的初始数据格式和目标数据格式,对公式进行解析,验证内容的合法性;
所述转换模块:设置有转换关系匹配表,依据科学公式转换关系匹配表,结构化公式数据,将初始格式的科学公式数据转换为目标格式;
所述格式化模块:用于格式化公式数据,生产统一标准的数据。
所述转换模块根据所述转换关系匹配表对LaTex,SVG,MathML,OMML和MathType的数据格式中至少两种数据格式进行转换;
进一步地,所述转换模块包括多个子模块:
第一子模块,所述第一转换模块将MathML数据格式单向转换为SVG数据格式;
第二子模块,所述第二转换模块将Latex数据格式单向转换为SVG数据格式;
第三子模块,所述第三转换模块将MathML数据格式与Latex数据格式相互转换;
第四子模块,所述第四转换模块将MathML数据格式与OMML数据格式相互转换;
第五子模块,所述第五转换模块将MathML数据格式与MathType数据格式相互转换;
进一步地,所述转换模块还包括:结构化模块,当初始数据格式为:LaTex、OMML、MathType时,进行格式转换之前,结构化模块将待转换科学公式转化为MathML数据格式的公式结构,先转换为MathML数据格式再转换为目标数据格式。
所述解析模块中设置合法性验证模块,所述合法性验证模块检验待转换科学公式中是否存在非法字符,如存在非法字符,则对非法字符进行处理,使待转换科学公式符合设置的合法标准;
所述格式化模块对完成格式转换的科学公式数据进行整理,检验是否存在非法字符和不支持字符,如存在非法字符,则删除非法字符后重新整理,使其符合设置的格式化标准。
具体地,还提供了以下几个实施例:
实施例1:在线公式编辑器
当出版物或教学教案内容在Web端制作和审校时,其中的科学公式格式为MathML格式或SVG格式。按照用户习惯,会使用Office Word软件来进行文字编辑,在Windows平台下,OMML格式和MathType格式的科学公式数据对Office软件的兼容性比较好。在印刷场景下,用户大多使用Tex系统进行排版印刷;同时,为了对旧版书籍进行编辑后再版,也需要将Tex系统下Latex格式的科学数据转换为OMML、MathType格式进行处理,或转换成MathML或SVG格式进行展示。
当用户在Web端利用可视化界面编辑科学公式时,所生成的科学公式数据格式为MathML格式,对完成编辑的科学公式,也可以将公式渲染为SVG格式进行展示。当用户需要将完成编辑的科学公式进行保存时,出于节约存储空间等考虑,选择将科学公式的数据保存为Latex格式。
参考图2-图4所示,当用户在Web端完成对科学公式的编辑后,内容解析模块获取待转换的科学公式的初始数据格式和目标数据格式,对公式进行解析,检测待转换科学公式的MathML数据中是否存在非法字符。在本实施例中,所述非法字符为控制字符。因此,需要查找待转换科学公式数据中的所有字符是否与US-ASCII控制字符表中的字符相同。若在待转换科学公式数据中存在控制字符,则直接删除该字符。
完成上述步骤后,在转换模块中预置的转换关系匹配表中查找科学公式的原始数据格式与目标格式,以查找出合理的格式转换方式。
本实施例中的转换关系匹配表(参见图5)如下所示:
1.Latex=>MathML:使用MathJax进行转换;
2.Latex、MathML=>SVG:使用MathJax进行转换;
3.MathML=>Latex:使用自定义的XSLT将MathML转换为Latex;
4.
Figure BDA0002336626580000071
使用word定义好的OMML2MML.xslt进行转换;
5.
Figure BDA0002336626580000072
使用MathType官方SDK进行转换;
6.OMML、Latex转MathType:
a)将Latex、OMML转换为MathML
b)使用MathType SDK将MathML转换为MathType
7.MathType=>MathML:使用MathType SDK进行转换;
8.MathType=>Latex、OMML:
a)使用MathType SDK转换为MathML;
b)将MathML转换为Latex、OMML。
本实施例的转换关系为MathML单向转换为Latex格式,与转换关系匹配表中第3行中的内容匹配,按照该映射关系转换。
由于MathML本质上是一种标记形语言,具有对于公式的结构描述清晰,且中文字符采用Unicode码的形式存储的优势,因此可以使用XSLT解析器规定字符编码替换的内容。其配置流程为:
1.根据MathML标签指定对应的Latex命令;
2.将MathML中的Unicode字符转换为对应的Latex命令。
在本实施例中,XSLT解析器的核心代码段举例如下:
<xsl:template match="m:math[not(@mode)or@mode='inline'][not(@display)]|m:math[@display='inline']">
<xsl:text>&#x00024;</xsl:text>
<xsl:apply-templates/>
<xsl:text>&#x00024;</xsl:text>
</xsl:template>
上述代码段对XSLT解析器进行了配置。转换模块中的第三子模块完成了MathML格式的科学公式数据转换为Latex格式的工作。
由于MathML格式的公式数据对于公式的样式及结构描述完整清晰,因此本发明将初始格式优先转换为MathML格式的公式数据,再由MathML格式的数据转换到目标格式,这一操作定义为结构化公式数据。
完成上述步骤后,在格式化模块中,将会进一步对Latex格式的科学数据进行删除非法字符操作和替换不支持字符的操作。在本实施例中,非法字符为控制字符,支持字符为MathType软件中支持的Unicode字符,在本实施例中根据MTEF V.5文件中的规定进行处理。
实施例2:公式内容下载
在自然科学领域的教学和文献出版领域中,常常会用到形式相似,但下标或字母等细节不同的科学公式。为了提高文档编辑和校对的效率,就需要在已有科学公式的基础上进行修改,以生成所需的科学公式。
在本实施例中,已有的常用科学公式在数据库中以Latex格式进行存储,用户端采用的文字处理软件为Office Word软件。因此,需要将Latex格式的科学公式数据转换为与Office兼容的OMML或MathType格式。
参考图2-图4所示,在内容解析模块中,先检测待转换科学公式的Latex数据中是否存在非法字符。在本实施例中,所述非法字符为控制字符。因此,需要查找待转换科学公式数据中的所有字符是否与US-ASCII控制字符表中的字符相同。若在待转换科学公式数据中存在控制字符,则直接删除该字符。
完成上述步骤后,在转换模块中预置的转换关系匹配表中查找科学公式的原始数据格式与目标格式,以查找出合理的格式转换方式。
本实施例中的转换关系匹配表(参见图5)如下所示:
1.Latex=>MathML:使用MathJax进行转换;
2.Latex、MathML=>SVG:使用MathJax进行转换;
3.MathML=>Latex:使用自定义的XSLT将MathML转换为Latex;
4.
Figure BDA0002336626580000091
使用word定义好的OMML2MML.xslt进行转换;
5.
Figure BDA0002336626580000092
使用MathType官方SDK进行转换;
6.OMML、Latex转MathType:
a)将Latex、OMML转换为MathML
b)使用MathType SDK将MathML转换为MathType
7.MathType=>MathML:使用MathType SDK进行转换;
8.MathType=>Latex、OMML:
a)使用MathType SDK转换为MathML;
b)将MathML转换为Latex、OMML
本实施例的转换关系为Latex格式转换为OMML或MathType格式,与转换关系匹配表中第1、4、5行中的内容匹配,按照该映射关系进行转换。
在上述转换步骤中,MathJax是一个开源的基于Ajax的数学公式显示的解决方案,结合多种先进的Web技术,支持主流的浏览器。MathJax根据页面中定义的Latex数据,生成对应的数学公式。在本实施例中,直接调用已部署的MathJax服务即可完成对Latex格式的科学公式数据向MathML格式的转换,再使用MathType SDK将MathML数据转换为MathType数据;或使用word定义好的OMML2MML.xslt将MathML数据转换为OMML数据。
完成上述步骤后,在格式化模块中,进一步执行与实施例1中相同的操作,经过删除非法字符和替换不支持字符后,即得到经过格式化后的MathML科学公式数据。
实施例3:电子文档中公式内容的提取
在出版印刷和教学领域中,为了提高工作效率,会对常用的科学公式元素进行提取和保存,以便在后续工作中随时取用,减少重复编写科学公式的劳动量。
在本实施例中,带有科学公式内容的电子文档中包含的公式数据格式为MathType格式,提取后保存在数据库中的公式数据格式为Latex格式。
参考图2-图4所示,在内容解析模块中,先检测待转换科学公式的OMML格式或MathType格式数据中是否存在非法字符。在本实施例中,所述非法字符为控制字符。因此,需要查找待转换科学公式数据中的所有字符是否与US-ASCII控制字符表中的字符相同。若在待转换科学公式数据中存在控制字符,则直接删除该字符。
完成上述步骤后,在转换模块中预置的转换关系匹配表中查找科学公式的原始数据格式与目标格式,以查找出合理的格式转换方式。
本实施例中的转换关系匹配表(参见图5)如下所示:
1.Latex=>MathML:使用MathJax进行转换;
2.Latex、MathML=>SVG:使用MathJax进行转换;
3.MathML=>Latex:使用自定义的XSLT将MathML转换为Latex;
4.
Figure BDA0002336626580000101
使用word定义好的OMML2MML.xslt进行转换;
5.
Figure BDA0002336626580000102
使用MathType官方SDK进行转换;
6.OMML、Latex转MathType:
a)将Latex、OMML转换为MathML
b)使用MathType SDK将MathML转换为MathType
7.MathType=>MathML:使用MathType SDK进行转换;
8.MathType=>Latex、OMML:
a)使用MathType SDK转换为MathML;
b)将MathML转换为Latex、OMML
本实施例的转换关系为MathType格式单向转换为Latex格式,与转换关系匹配表中第8行中的内容匹配,按照该映射关系转换。
由于转换MathType格式的数据需要调用MathType SDK,但MathType SDK中的转换目标格式中没有Latex。因此,需要借助MathML这一中间格式进行两次转换。
第一步,在Windows平台下,调用MathType SDK,将MathType格式数据转化为MathML格式。
第二步,使用XSLT解析器或已有工具,将上一步骤中生成的MathML格式的科学公式转换为Latex格式。
完成上述步骤后,在格式化模块中,进一步执行与实施例1中相同的操作,经过删除非法字符和替换不支持字符后,即得到经过格式化后的Latex科学公式数据。
本公开提供的科学公式格式转换的装置,提供了一种公式在web网页操作端、word文档编辑端以及排版印刷端多端之间的、多格式之间的互相转换的解决方案,实现了一套公式数据的多场景应用减少人工转换时间,极大的提高转换效率,为批量转换需要提供便捷通道。
以上对本发明所提供的一种正确转换科学公式的方法和装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,本说明书内容不应理解为对本发明技术方案的限制。

Claims (10)

1.一种科学公式格式转换的方法,其特征在于,它包括如下步骤:
获取待转换科学公式的初始数据格式和目标数据格式,对待转换公式进行解析,验证内容的合法性;
根据目标数据格式,进行格式转换;
对转换后的公式数据进行格式化,生产统一标准的数据。
2.根据权利要求1所述的科学公式格式转换的方法,其特征在于,所述“对待转换公式数据进行解析,验证内容的合法性”包括:检验待转换科学公式中是否存在非法字符,如存在非法字符,则对非法字符进行处理,使待转换科学公式符合设置的合法标准。
3.根据权利要求1或2所述的科学公式格式转换的方法,其特征在于,所述“根据目标数据格式,进行格式转换”前还包括,设置转换关系匹配表;
在转换关系匹配表中对初始数据格式和目标数据格式进行匹配,如查找到匹配项,则按照转换关系匹配表中设置的转换关系进行科学公式的格式转换。
4.根据权利要求3所述的科学公式格式转换的方法,其特征在于,所述转换关系匹配表中的数据格式至少包括:SVG数据格式,LaTex数据格式,MathML数据格式,OMML数据格式和MathType数据格式;
所述关系匹配表中至少设置有两种数据格式之间的转换匹配关系。
5.根据权利要求1-4任一项所述的科学公式格式转换的方法,其特征在于,所述转换关系匹配表中设置的转换关系为:
MathML数据格式和Latex数据格式分别单向转换为SVG数据格式;
MathML数据格式与Latex数据格式相互转换;
MathML数据格式与OMML数据格式相互转换;
MathML数据格式与MathType数据格式相互转换。
6.根据权利要求5所述的科学公式格式转换的方法,其特征在于,当初始数据格式为:Latex、OMML、MathType时,进行格式转换之前还包括:结构化公式数据,
所述“结构化公式数据”包括:将待转换科学公式转化为MathML数据格式的公式结构,通过MathML数据格式转换为目标数据格式。
7.根据权利要求1或6所述的科学公式格式转换的方法,其特征在于,所述“对转换后的公式数据进行格式化”包括:
对完成格式转换的科学公式数据进行整理,检验是否存在非法字符和/或不支持字符,如存在非法字符,则删除非法字符后重新整理,使其符合设置的格式化标准;
优选地,所述非法字符至少包括:计算机中的控制字符;所述不支持字符包括:目标格式中不支持的Unicode码。
8.一种科学公式格式转换的装置,其特征在于:它依次包括内容解析模块、转换模块和格式化模块;
所述内容解析模块:获取待转换的科学公式的初始数据格式和目标数据格式,对公式进行解析,验证内容的合法性;
所述转换模块:设置有转换关系匹配表,依据科学公式转换关系匹配表,结构化公式数据,将初始格式的科学公式数据转换为目标格式;
所述格式化模块:用于格式化公式数据,生产统一标准的数据。
9.根据权利要求8所述的科学公式格式转换的装置,其特征在于,所述转换模块根据所述转换关系匹配表对LaTex,SVG,MathML,OMML和MathType的数据格式中至少两种数据格式进行转换;
优选地,所述转换模块包括多个子模块:
第一子模块,所述第一转换模块将MathML数据格式单向转换为SVG数据格式;
第二子模块,所述第二转换模块将Latex数据格式单向转换为SVG数据格式;
第三子模块,所述第三转换模块将MathML数据格式与Latex数据格式相互转换;
第四子模块,所述第四转换模块将MathML数据格式与OMML数据格式相互转换;
第五子模块,所述第五转换模块将MathML数据格式与MathType数据格式相互转换;
优选地,所述转换模块还包括:结构化模块,当初始数据格式为:Latex、OMML、MathType时,进行格式转换之前,结构化模块将待转换科学公式转化为MathML数据格式的公式结构,先转换为MathML数据格式再转换为目标数据格式。
10.根据权利要求8或9所述的科学公式格式转换的装置,其特征在于,所述解析模块中设置合法性验证模块,所述合法性验证模块检验待转换科学公式中是否存在非法字符,如存在非法字符,则对非法字符进行处理,使待转换科学公式符合设置的合法标准;
优选地,所述格式化模块对完成格式转换的科学公式数据进行整理,检验是否存在非法字符和不支持字符,如存在非法字符,则删除非法字符后重新整理,使其符合设置的格式化标准。
CN201911358665.9A 2019-12-25 2019-12-25 一种科学公式格式转换的方法和装置 Pending CN111079385A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911358665.9A CN111079385A (zh) 2019-12-25 2019-12-25 一种科学公式格式转换的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911358665.9A CN111079385A (zh) 2019-12-25 2019-12-25 一种科学公式格式转换的方法和装置

Publications (1)

Publication Number Publication Date
CN111079385A true CN111079385A (zh) 2020-04-28

Family

ID=70317734

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911358665.9A Pending CN111079385A (zh) 2019-12-25 2019-12-25 一种科学公式格式转换的方法和装置

Country Status (1)

Country Link
CN (1) CN111079385A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046637A (zh) * 2019-12-25 2020-04-21 小船出海教育科技(北京)有限公司 一种科学公式正确性检验方法和装置
CN112733491A (zh) * 2020-12-31 2021-04-30 北京乐学帮网络技术有限公司 一种数据转化方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140143835A1 (en) * 2012-11-16 2014-05-22 Mighty Vox Llc Web-Based Digital Publishing Platform
CN104408020A (zh) * 2014-10-30 2015-03-11 北京思特奇信息技术股份有限公司 一种公式解析计算系统及方法
CN106021196A (zh) * 2016-05-05 2016-10-12 广东小天才科技有限公司 一种公式转换方法及系统
CN108319724A (zh) * 2018-02-28 2018-07-24 北京仁和汇智信息技术有限公司 一种带公式文件的网页发布方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140143835A1 (en) * 2012-11-16 2014-05-22 Mighty Vox Llc Web-Based Digital Publishing Platform
CN104408020A (zh) * 2014-10-30 2015-03-11 北京思特奇信息技术股份有限公司 一种公式解析计算系统及方法
CN106021196A (zh) * 2016-05-05 2016-10-12 广东小天才科技有限公司 一种公式转换方法及系统
CN108319724A (zh) * 2018-02-28 2018-07-24 北京仁和汇智信息技术有限公司 一种带公式文件的网页发布方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张婷: "网络数学公式转换的研究与实现", 中国优秀硕士学位论文全文数据库 信息科技辑, no. 12, pages 18 - 19 *
郭会芳: "基于MathML的数学公式格式转换研究", 中国优秀硕士学位论文全文数据库 信息科技辑, no. 08, pages 138 - 1070 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046637A (zh) * 2019-12-25 2020-04-21 小船出海教育科技(北京)有限公司 一种科学公式正确性检验方法和装置
CN112733491A (zh) * 2020-12-31 2021-04-30 北京乐学帮网络技术有限公司 一种数据转化方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN108595389B (zh) 一种将Word文档转换为txt纯文本文档的方法
CN104346319B (zh) 检查文档样式的方法及系统
US7984076B2 (en) Document processing apparatus, document processing method, document processing program and recording medium
US7770107B2 (en) Methods and systems for extracting and processing translatable and transformable data from XSL files
CN101872340A (zh) 一种基于版面格式模板的排版方法及装置
US20040015782A1 (en) Templating method for automated generation of print product catalogs
CN104199871A (zh) 一种用于智慧教学的高速化试题导入方法
CN101714133A (zh) 一种基于web的数学公式编辑系统及方法
CN111507073A (zh) 一种基于web富文本的论文编辑与智能排版方法及平台
CN102402432A (zh) 用于产生多国语言网页的方法
CN111079385A (zh) 一种科学公式格式转换的方法和装置
CN105975446A (zh) 手机端分模块显示word文档内容的方法及系统
CN102103574B (zh) 一种格式化输出书版小样文件内容的方法及系统
CN108073562A (zh) 基于云平台的出版物处理方法及装置
US10089975B2 (en) Transliteration work support device, transliteration work support method, and computer program product
Bagley et al. Creating reusable well-structured PDF as a sequence of component object graphic (COG) elements
CN101968804B (zh) 一种实现协同翻译的方法
KR101798475B1 (ko) 다중 플랫폼 지원 다국어 웹문서 출판 시스템
CN112433995A (zh) 文件格式转换方法、系统、计算机设备及存储介质
CN107967243A (zh) 一种支持用户自主断句的处理方法
CN108345589A (zh) 一种全原文参考的在线翻译方法
CN106648618B (zh) 虚拟应用的文本信息生成方法和装置
CN111401005B (zh) 文本转换方法、装置及可读存储介质
KR101165201B1 (ko) 컨텐츠 제공 시스템의 변환서버
CN108984676B (zh) 一种基于xml的电子书跨终端自适应显示系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination