CN113448563B - 一种LaTeX在线协作平台 - Google Patents

一种LaTeX在线协作平台 Download PDF

Info

Publication number
CN113448563B
CN113448563B CN202110973265.XA CN202110973265A CN113448563B CN 113448563 B CN113448563 B CN 113448563B CN 202110973265 A CN202110973265 A CN 202110973265A CN 113448563 B CN113448563 B CN 113448563B
Authority
CN
China
Prior art keywords
latex
formula
document
compiler
online
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110973265.XA
Other languages
English (en)
Other versions
CN113448563A (zh
Inventor
王国栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Austria Intelligent Industry Research Institute Nanjing Co ltd
Original Assignee
China Austria Intelligent Industry Research Institute Nanjing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Austria Intelligent Industry Research Institute Nanjing Co ltd filed Critical China Austria Intelligent Industry Research Institute Nanjing Co ltd
Priority to CN202110973265.XA priority Critical patent/CN113448563B/zh
Publication of CN113448563A publication Critical patent/CN113448563A/zh
Application granted granted Critical
Publication of CN113448563B publication Critical patent/CN113448563B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/33Intelligent editors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/34Graphical or visual programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/37Compiler construction; Parser generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/71Version control; Configuration management

Abstract

本发明公开了一种LaTeX在线协作平台,平台由分层架构实现,包括服务器、关键词模糊匹配、分布式存储、Mongodb数据库、LaTeX编辑器、TexLive编译器和LaTeX OCR公式识别器,通过浏览器在线登录,即可享受海量免费模板,既点即用,快速编辑、排版和预览,提供了非常实用的在线公式编辑器,节省办公时间,大大提升工作和学习的效率。

Description

一种LaTeX在线协作平台
技术领域
该发明属于在线文档编辑领域,具体是一种LaTeX在线协作平台。
背景技术
LaTeX是一种基于TeX的排版系统,即使使用者没有排版的知识也可以充分发挥由TeX提供的强大功能,能在几天,甚至几小时内生成高品质的论文,对于生成复杂表格和数学公式,这一点表现得尤为突出,因此它非常适用于生成高质量的数学、物理和科技文档。
近几年云服务产品高歌猛进,在线文档自然是一个大家都关注的领域,现代办公形式趋于更快捷的方式,而在线编辑文档也能更好的节省办公时间,大大提升效率,在线文档不应仅仅是一个文档,更应该是一个协作办公的容器,在这方面国内有不少优秀的在线文档产品,比如石墨文档,腾讯文档等,然而这些在线文档只支持Markdown格式,并不支持LaTeX格式。
LaTeX不仅在理工科中有较好的应用场景,而且在文科中的应用也逐渐多了起来,LaTeX广泛应用于论文、学术报告、书籍的撰写和制作。要使用LaTeX进行创作,有两种方式:一种是单机版,本地安装LaTeX编辑器,目前有超过20多种编辑器可供选择,比如LyX、TexStudio、WinEdt等;另一种是在线LaTeX编辑器,目前使用最广泛的是国外的Overleaf,全球超过500万名研究人员、学生和教师在使用它。
现有的LaTeX编辑器,无论是单机版还是在线版,都有基础的核心功能比如LaTeX语法高亮,自动补全等,但也存在一些缺陷,单机版的缺陷有本地安装繁琐,需要安装各种版本的LaTeX编译器,不能像在线版本一样无需安装、只需要打开浏览器就可以随时随地使用LaTeX进行写作,国外的Overleaf注册需要翻墙,由于Overleaf的服务器在国外,网络很慢,导致使用并不友好,并且缺少一些非常实用的功能——在线公式编辑器。
发明内容
本发明要解决的技术问题在于,针对现有技术需要在本地手动安装LaTeX编辑器、各种TexLive编译器版本甚至还需要进行繁琐的配置的缺点,提供一种LaTeX在线协作平台,对于编辑LaTeX公式,需要使用LaTeX代码组装公式,使用门槛很高,导致编辑一个公式,需要查阅晦涩难懂的LaTeX代码的问题,对此提供一种LaTeX在线公式编辑器。
本发明解决其技术问题所采用的技术方案是:提供一种LaTeX在线协作平台,该平台按照分层架构实现,前后端分离,前端采用Vue框架,后端网关服务采用的是Django框架实现的无状态服务,Gateway支持横向扩容提高业务承载能力,基础服务包括HDFS分布式文件系统、分布式缓存、非关系型Mongodb数据库、Mysql数据库集群、LaTeX编译器和LaTeXOCR公式识别服务,HDFS分布式文件系统主要用于存储非文本数据,比如图片;分布式缓存作为访问数据库的缓存层,避免频繁访问数据库,减轻数据库访问压力;LaTeX OCR服务用于将公式图片转成LaTeX代码,用户只需要一个浏览器即可使用该平台创造内容。
平台由分层架构实现,前后端分离,前端Web Front选用Vue.js实现LaTeX在线协作平台的页面布局和交互逻辑,采用Nginx + uWSGI作为反向代理和负载均衡,将前端WebFront发送的HTTP API请求转发到后端网关服务Gateway,网关服务对外提供HTTP API接口调用,所有API接口为无状态;平台包括服务器、分布式存储、Mongodb数据库、LaTeX编辑器、TexLive编译器和LaTeX OCR公式识别器。
LaTeX OCR公式识别器将公式图片通过LaTeX OCR公式识别技术,生成LaTeX公式代码,LaTeX公式代码存储在服务器的Mongodb数据库中,并与用户ID进行关联。
LaTeX OCR公式识别器采用AI识别技术,模型使用PyTorch深度学习框架,图片经人工预处理后加载进LaTeX OCR模型,识别成功后将得到的LaTeX公式代码返回到浏览器端,并删除服务器上的公式图片,经图片识别返回的LaTeX公式代码在浏览器端输出到公式编辑框中,实时渲染成公式,调用添加公式API接口,将LaTeX公式代码保存到Mongodb数据库中。
LaTeX编辑器用于在线LaTeX文档项目编辑,在线LaTeX文档项目是存储在服务器上,且需要在浏览器上访问的文档目录树。
TexLive编译器对LaTeX编辑器编辑文档项目进行编译。
在线LaTeX文档项目编辑完成时,使用TexLive 编译器进行编,若编译成功,输出PDF,否则输出错误日志。
LaTeX编辑器包括:图像识别,编辑公式和展示公式。
用户能够在线创建多个LaTeX文档项目,对于所创建的项目可复制、下载、归档、删除。
当对项目下载时,将该项目所有相关的文件打包成 .zip 格式下载到本地,同时支持通过本地导入 .zip 文件的方式创建项目。
单击具体项目可进入项目工作台,在项目工作台页面,最左边是该项目所包含的文件目录树,紧挨着目录树右边的第一个区域是文本编辑器,可在该区域进行LaTeX写作,最右边是项目编译输出区域。
在文件目录树区域,可创建文件夹、LaTeX文本文件、重命名文件,移动文件和删除文件;可上传单个文件,包括文本文件和图片。
选择文本文件,可在文本编辑器区域编辑文本。
选择图片文件,右边整个区域可以预览图片,并支持下载图片。
在文本编辑区域,支持LaTeX代码语法高亮和自动补全。
最右边的项目编译输出区域的上方,可配置编译器版本和编译器类型,云端编译成功返回的PDF显示在该区域。
本发明还提供一种LaTeX在线公式编辑器,包括:
图像识别,用于识别公式图片,用户上传公式图片,并在线选择图片区域,单击开始识别,将裁剪的图片区域上传到服务器端,服务端调用LaTeX OCR公式识别服务,识别成功返回LaTeX公式代码;
编辑公式,用于编辑LaTeX公式代码;
展示公式,用于将编辑框里的LaTeX公式代码,实时显示转义后的公式;
进一步,本发明所述的在线LaTeX公式编辑器,将识别成功的LaTeX公式代码存储在服务器的数据库中,并与用户ID进行关联,并与用户ID进行关联;该用户ID关联的所有公式,可进行预览,修改和删除操作。
本发明优点是:
1:开箱即用,体验友好的LaTeX在线编辑器;
2:云编译LaTeX文档,快速预览;
3:AI赋能,智能识别公式图片为LaTeX公式代码。
附图说明
下面将结合附图及实施例对本发明公开作进一步说明,附图中:
图1为本发明的一种LaTeX在线协作平台架构图;
图2为本发明的一种LaTeX在线协作平台在线编译流程图;
图3为本发明的一种LaTeX在线协作平台AI公式识别流程图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明。
具体的,本LaTeX在线协作平台主要对象是在线LaTeX文档项目,在线LaTeX文档项目指的是存储在服务器上、且需要在浏览器上访问的文档目录树,其包含很多文件,但至少要包含一个tex格式的主文件;该LaTeX在线协作平台需联网才能实现访问和在线编辑LaTeX文档项目,也就是说,本发明公开中的在线LaTeX文档项目不同于存储在本地计算机上、在本地进行编辑的文档,参考图1为在线协作平台架构图,包括:
该平台按照分层架构实现,前后端分离,前端Web Front选用Vue.js主要实现LaTeX在线协作平台的页面布局和交互逻辑;
Nginx + uWSGI作为反向代理和负载均衡,将前端Web Front发送的HTTP API请求转发到后端网关服务Gateway,该网关服务对外提供HTTP API接口调用,所有API接口都是无状态的,所以可以通过网关服务横向扩容来提高业务承载能力;
Mysql和Mongodb数据库主要存储LaTeX在线协作平台的业务数据;
LaTeX 编译器用于编译LaTeX文档项目,该编译过程是在装有TexLive编译器的服务端进行的,而不是在用户本地计算机上;
LaTeX OCR服务对外提供GRPC图片识别接口调用,由Gateway网关服务调用;
进一步,用户通过浏览器注册LaTeX在线协作平台账户,登录平台,就可以创建LaTeX文档项目,在浏览器端进行创作,用户编辑的LaTeX文本文件内容存储在服务器上的Mongodb数据库中;由于LaTeX文档项目不仅包含LaTeX文本文件,还包含非文本文件,比如图片,这些非文本文件存储在服务器上的HDFS分布式文件系统中;
用户创建的LaTeX文档项目与用户的ID关联起来,存储在Mongodb的项目表中;
一个LaTeX文档项目所包含的所有文件索引与项目ID关联起来,存储在Mongodb的文件表中;
当用户通过前端Web Front向网关服务Gateway发起LaTeX文档项目编译API请求时,网关服务首先会根据请求用户ID和项目ID从Mongodb中查找到该LaTeX文档项目的索引信息,根据索引信息分别从Mongodb读取LaTeX文本内容,从HDFS分布式文件系统下载非文本文件,比如图片;最终将获取到的项目文件按照层级关系保存到服务器上的本地目录中;紧接着,网关服务编译LaTeX文档项目。
参考图2在线编辑流程图,每一个LaTeX文档项目都关联了自己的编译器版本和编译器类型,为了提高LaTeX文档项目编译成功率,当编译LaTeX文档项目时,优先使用用户设置的编译器类型和编译器版本进行编译,如果成功,输出PDF和日志;如果编译失败,会尝试其余三种编译器类型,只要有一个编译成功,停止尝试,输出PDF和日志,如果4种编译器都编译失败,只输出LaTeX错误日志。
编译器版本包括2015版、2016版、2017版、2018版、2019版和2021版,可选择不同的编译版本和类型进行编译。
LaTeX OCR公式识别器,用户手写公式、科研杂志上的公式,确切的说任何纸质上的公式都可以通过照相机拍成公式图片,通过搜索引擎搜到的公式图片,或者使用截图软件截取的公式图片都可以上传到图片识别服务进行识别,该图片识别服务在服务端上运行,图片识别的结果返回到浏览器端。
参考图3 AI公式识别流程图。
具体的,用户通过浏览器上传公式图片,图片识别LaTeX OCR服务将接收到的图片保存到服务器上,在将图片输入到LaTeX OCR模型进行识别前,先对图片进行预处理(复原,去雾等),目的是提高公式识别精度,然后,图片服务加载训练好的LaTeX OCR模型,对上传图片进行识别,识别成功后将得到的LaTeX公式代码返回到浏览器端,并删除服务器上的公式图片;
图片识别服务返回的LaTeX公式代码在浏览器端输出到公式编辑框中,在公式编辑框的正下方,实时渲染成公式,用户可对公式编辑框中的图片进行修改,检查无误后,与用户ID关联,调用添加公式API接口,将LaTeX公式代码保存到Mongodb数据库中;
当用户编辑LaTeX文档时,调用获取公式列表接口,从用户自己的公式列表中,复制公式代码,粘贴到LaTeX文档中;同时,也可对公式列表中的公式再次修改,甚至删除。
其中LaTeX OCR模型使用PyTorch深度学习框架,输入大量训练数据集,通过调整参数,最终训练出准确率达到90%以上的LaTeX OCR模型。
关键词模糊匹配,基于正则表达式,如:r”^pdf\w{0,4}$”,对不同LaTeX中的关键词进行模糊匹配,若匹配到对应编译器的关键词,则自动推荐用户使用响应的LaTeX编译器。
拼写纠错,主要针对英文单词和中文的词进行纠错。纠错模型主要包含词库构建,基于概率的分词和新词发现三部分。
词库构建。基于开源语料及抓取的互联网语料,结合已知词库,使用前向最大匹配和后向最大匹配对语料进行分词,并计算每个词的出现概率。
基于构建词库以及前向最大匹配和后向对大匹配分词。假设一个句子序列为
Figure 137090DEST_PATH_IMAGE002
,首先从前向后匹配新词,然后再从后向前匹配词语,序列最长且概率最大的视为一个词,以此类推,从而实现分词功能。
新词发现主要通过爬虫从互联网上抓取新闻、博客等信息,并使用加权的TF-IDF算法进行新词发现,某个词
Figure DEST_PATH_IMAGE003
Figure 830502DEST_PATH_IMAGE004
的计算公式如下:
Figure DEST_PATH_IMAGE005
其中,
Figure 693809DEST_PATH_IMAGE006
表示词
Figure DEST_PATH_IMAGE007
在所有文档中出现的次数,
Figure 172064DEST_PATH_IMAGE008
表示所有文档中的总词数。
Figure DEST_PATH_IMAGE009
表示语料库中文档的个数,
Figure 53477DEST_PATH_IMAGE010
表示包含词
Figure DEST_PATH_IMAGE011
的文档数。若去除已知的词库中的词语,词
Figure 783535DEST_PATH_IMAGE011
Figure 780310DEST_PATH_IMAGE004
值达到了设定的阈值,则认为改词为新词,并自动提交系统审核,人工审核通过后,加入词库。
标签自动补全
针对LaTeX中的语法标签进行自动补全。当用户输入部分标签字符后,根据上下文内容以及标签列表进行自动联想和匹配,并在交互界面中以下拉框的方式展示下拉词。
文本定位
源代码和pdf的双向定位,使用SyncTeX技术,通过创建中间文件,如main.synctex,记录辅助定位信息,同步输入和输出之间数据,从而实现源代码到pdf的定位,反之同理。
Web Front为前端页面开发设计。
Vue.js是一套响应式的JavaScript开发库。
Nginx 为对外的服务器,外部浏览器通过url访问Nginx。
uWSGI是对内的服务器,主要用来处理动态请求。
HTTP API是超文字传输协定应用程序编程接口。
Gateway为网关。
Mongodb为开源数据库。
LaTeX为一种排版语言。
TexLive为一个LaTeX编译器安装包。
pdfLaTeX,XeLaTeX,XeLaTeX和LaTeX均为一种LaTeX编译器类型。
OCR全称为Optical Character Recognition即光学字符识别。
PDF全称为Portable Document Format即可携带文档格式。
zip为一种数据压缩和文档储存的文件格式。
以上实施例只为说明本发明公开的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明公开的内容并据此实施,并不能限制本发明公开的保护范围。凡跟本发明权利要求范围所做的均等变化与修饰,均应属于本发明公开权利要求的涵盖范围。

Claims (8)

1.一种LaTeX在线协作平台,其特征在于,平台由分层架构实现,前端Web Front选用Vue.js实现LaTeX在线协作平台的页面布局和交互逻辑,Nginx作为反向代理和负载均衡,将前端Web Front发送的HTTP API请求转发到后端网关服务Gateway,该网关服务对外提供HTTP API接口调用,所有API接口都是无状态的,包括服务器、关键词模糊匹配、拼写纠错、标签自动补全、文本定位、分布式存储、MongoDB数据库、LaTeX编辑器、TexLive编译器和LaTeX OCR公式识别器;
所述关键词模糊匹配对不同LaTeX中的关键词进行模糊匹配,若匹配到对应编译器的关键词,则自动推荐用户使用响应的LaTeX编译器;
所述拼写纠错包括对英文单词和中文的词进行纠错,纠错模型主要包含词库构建,基于概率的分词和新词发现三部分,所述新词发现的公式为:
Figure 5627DEST_PATH_IMAGE001
,其中,
Figure 453926DEST_PATH_IMAGE002
表示词
Figure 764821DEST_PATH_IMAGE003
在所有文档中出现的次数,
Figure 425610DEST_PATH_IMAGE004
表示所有文档中的总词数,
Figure 521873DEST_PATH_IMAGE005
表示语料库中文档的个数,
Figure 875494DEST_PATH_IMAGE006
表示包含词
Figure 408106DEST_PATH_IMAGE007
的文档数,若去除已知的词库中的词语,词
Figure 138165DEST_PATH_IMAGE007
Figure 183127DEST_PATH_IMAGE008
值达到了设定的阈值,则认为该词为新词;
所述文本定位通过源代码和pdf的双向定位;
所述LaTeX OCR公式识别器对外提供gRPC图片识别接口调用,由Gateway网关服务调用,LaTeX OCR公式识别器将公式图片通过LaTeX OCR公式识别技术,生成LaTeX公式代码,所述LaTeX公式代码存储在服务器的MongoDB数据库中,并与用户ID进行关联,所述LaTeXOCR公式识别器采用AI识别技术,模型使用PyTorch深度学习框架,图片经人工预处理后加载进LaTeX OCR模型,识别成功后将得到的LaTeX公式;
LaTeX 编译器用于编译LaTeX文档项目;
MongoDB数据库用于存储LaTeX在线协作平台的业务数据,用户创建的LaTeX文档项目与用户的ID关联起来,存储在MongoDB的项目表中,一个LaTeX文档项目所包含的所有文件索引与项目ID关联起来,存储在MongoDB的文件表中;
当用户通过前端Web Front向网关服务Gateway发起LaTeX文档项目编译API请求时,网关服务首先会根据请求用户ID和项目ID从MongoDB中查找到该LaTeX文档项目的索引信息,根据索引信息分别从MongoDB读取LaTeX文本内容,从HDFS分布式文件系统下载非文本文件,最终将获取到的项目文件按照层级关系保存到服务器上的本地目录中,网关服务编译LaTeX文档项目。
2.根据权利要求1所述的一种LaTeX在线协作平台,其特征在于,所述LaTeX编辑器通过在浏览器上访问文档目录树进行文档项目编辑,文档项目存储在服务器上,所述TexLive编译器对LaTeX编辑器编辑文档项目进行编译,在线LaTeX文档项目编辑完成时,使用TexLive编译器进行编,若编译成功,输出PDF,否则输出错误日志,所述LaTeX编辑器包括:图像识别,编辑公式和展示公式。
3.根据权利要求1所述的一种LaTeX在线协作平台,其特征在于,用户在线创建一个以上的LaTeX文档项目,对于所创建的项目可复制、下载、归档和删除,用户通过本地导入zip文件的方式创建项目,在文件目录树区域,创建文件夹、LaTeX文本文件、重命名文件,移动文件和删除文件,上传单个文件,包括文本文件和图片。
4.根据权利要求1所述的一种LaTeX在线协作平台,其特征在于,当在线LaTeX文档项目编辑完成时,将在云端进行LaTeX文档项目的编译,不需要在本地安装各种版本的LaTeX编译器,云端提供编译器类型包括pdfLaTeX、XeLaTeX、LuaLaTeX和LaTeX。
5.根据权利要求4所述的一种LaTeX在线协作平台,其特征在于,当在云端编译LaTeX项目时,首先使用项目保存的编译器类型,若编译成功,直接返回编译好的PDF,若编译失败,将轮询使用其余3种编译器类型,如果所使用的编译器类型编译成功,返回编译好的PDF和第一次编译失败日志,同时更新该项目的编译器类型;如果所有的编译器都失败,返回第一次编译失败日志。
6.根据权利要求1所述的一种LaTeX在线协作平台,其特征在于,当编译失败,可以通过解析错误日志,定位到具体LaTeX文档的具体行数。
7.根据权利要求1所述的一种LaTeX在线协作平台,其特征在于,所述LaTeX编辑器,将手写的数学公式拍照或者截取的公式图片,上传到图像识别服务,图像识别服务通过OCR识别技术转化成LaTeX公式代码,识别出的LaTeX公式代码可在线编辑,并在公式编辑器的下方实时显示LaTeX公式代码转义后的数学公式。
8.根据权利要求1所述的一种LaTeX在线协作平台,其特征在于,将编辑好的LaTeX公式代码,添加到我的公式列表中,浏览我的公式列表,可对公式再次进行修改,也可直接删除不需要的公式,当对公式再次修改时,即可更新公式,也可以添加到我的公式列表中,每一个公式都可以起一个名称,可通过公式名称进行模糊搜索。
CN202110973265.XA 2021-08-24 2021-08-24 一种LaTeX在线协作平台 Active CN113448563B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110973265.XA CN113448563B (zh) 2021-08-24 2021-08-24 一种LaTeX在线协作平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110973265.XA CN113448563B (zh) 2021-08-24 2021-08-24 一种LaTeX在线协作平台

Publications (2)

Publication Number Publication Date
CN113448563A CN113448563A (zh) 2021-09-28
CN113448563B true CN113448563B (zh) 2021-12-14

Family

ID=77818798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110973265.XA Active CN113448563B (zh) 2021-08-24 2021-08-24 一种LaTeX在线协作平台

Country Status (1)

Country Link
CN (1) CN113448563B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114661718B (zh) * 2022-03-28 2023-04-25 北京海量数据技术股份有限公司 Opengauss平台下在线创建本地分区索引的方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101329731A (zh) * 2008-06-06 2008-12-24 南开大学 图像中数学公式的自动识别方法
CN106777404A (zh) * 2017-03-29 2017-05-31 北京亿科天元信息技术有限公司 从LaTeX格式到XML格式的转换系统及转换方法
CN107832270A (zh) * 2017-10-17 2018-03-23 金炜 基于LaTeX的公式编辑方法和公式编辑器
CN111507067A (zh) * 2019-01-31 2020-08-07 北京易真学思教育科技有限公司 显示公式图片的获取方法、转存公式图片的方法及装置
CN111401353B (zh) * 2020-03-17 2022-04-05 重庆邮电大学 一种数学公式的识别方法、装置及设备

Also Published As

Publication number Publication date
CN113448563A (zh) 2021-09-28

Similar Documents

Publication Publication Date Title
US8554800B2 (en) System, methods and applications for structured document indexing
CN109408622B (zh) 语句处理方法及其装置、设备和存储介质
US11222053B2 (en) Searching multilingual documents based on document structure extraction
JP2002055872A (ja) ウェブコンテンツを簡略化するための方法、システムおよび媒体
US20070214112A1 (en) Augmenting the contents of an electronic document with data retrieved from a search
WO2004097675A1 (en) Digital library system
CN104123269A (zh) 一种基于模板的出版物半自动生成方法及系统
US20130041892A1 (en) Method and system for converting audio text files originating from audio files to searchable text and for processing the searchable text
US11720617B2 (en) Method and system for automated generation and editing of educational and training materials
US20190317953A1 (en) System and method for computerized semantic indexing and searching
CN116244344B (zh) 基于用户需求的检索方法、装置以及电子设备
US9298689B2 (en) Multiple template based search function
CN110659310A (zh) 一种车辆信息的智能搜索方法
CN112765999A (zh) 机器翻译双语对照方法及系统
CN113448563B (zh) 一种LaTeX在线协作平台
Xia et al. Enriching a massively multilingual database of interlinear glossed text
CN116468009A (zh) 文章生成方法、装置、电子设备和存储介质
Nadee et al. Towards data extraction of dynamic content from JavaScript Web applications
US20090182759A1 (en) Extracting entities from a web page
CN111831624A (zh) 数据表创建方法、装置、计算机设备及存储介质
CN101196883A (zh) 一种互联网信息自然语言翻译通用方法和系统
Jacobs Beginning XML with DOM and Ajax: from Novice to Professional
CN114662002A (zh) 对象推荐方法、介质、装置和计算设备
Hast et al. Making large collections of handwritten material easily accessible and searchable
Beals Stuck in the Middle: Developing Research Workflows for a Multi-Scale Text Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant