CN110188745A

CN110188745A - 教学内容在线代码化方法及系统

Info

Publication number: CN110188745A
Application number: CN201910463851.2A
Authority: CN
Inventors: 胡彬
Original assignee: Beijing Love Top Education Technology Co Ltd
Current assignee: Beijing Love Top Education Technology Co Ltd
Priority date: 2019-05-30
Filing date: 2019-05-30
Publication date: 2019-08-30

Abstract

本发明实施例提供了一种教学内容在线代码化方法及系统。该方法包括：获取客户端上传到的需要代码化的内容信息；在所述内容信息中识别文本框、公式框、图片框；通过对所述文本框、公式框、图片框中的内容信息的多线程并行的光学字符识别OCR，获取到与所述内容信息对应的代码化信息；将所述代码化信息传输至客户端。本发明实施例提供的教学内容在线代码化方法及系统能够克服现有技术中需要代码化数据时的效率低下的问题。

Description

教学内容在线代码化方法及系统

技术领域

本发明涉及数据分析处理技术领域，特别是涉及一种教学内容在线代码化方法及系统。

背景技术

传统的教研内容生产流程中，教学内容编写是一个消耗时间最长且重复率最高的一件事情，大量精品的题目只有扫描版或纸质版，老师想要从线下搬到线上录入线上题库或者想要二次编辑使用时需要重新进行手动录入，效率低下，并且手动人工录入容易出现错误偏差影响使用。

发明内容

本发明要解决的技术问题是提供一种教学内容在线代码化方法及系统，以克服现有技术中需要代码化数据时效率低下的问题。

为解决上述技术问题，本发明提供了一种教学内容在线代码化方法，所述方法包括：获取客户端上传到的需要代码化的内容信息；在所述内容信息中识别文本框、公式框及图片框；通过对所述文本框、公式框及图片框中内容信息的多线程并发光学字符识别OCR，获取到与所述内容信息对应的代码化信息；将所述代码化信息传输至客户端。

在一些实施例中，在所述内容信息中识别文本框、公式框及图片框，包括：根据用户输入，多线程并发的划分文本框、公式框及图片框。

在一些实施例中，对于文本框、公式框及图片框的划分为基于所述文本框、公式框及图片框在内容信息中的位置进行的划分。

在一些实施例中，通过对所述文本框、公式框、图片框内的内容信息的多线程并发光学字符识别OCR，获取到与所述内容信息对应的代码化信息，包括：通过对所述内容信息的分页，多页同时获取与所述内容信息对应的代码化信息。

在一些实施例中，通过对所述内容信息的分页，多页同时获取与所述内容信息对应的代码化信息，包括：利用文本OCR线程识别所述文本信息；利用公式OCR线程识别所述公式信息；根据识别的文本结果、公式结果，汇总为每页的代码化信息。

在一些实施例中，同时运行多个文本OCR线程，并且同时运行多个文本OCR线程。

在一些实施例中，通过对所述内容信息的光学字符识别OCR，获取到与所述内容信息对应的代码化信息，还包括：对所述文本OCR线程及公式OCR线程的运行结果进行监听。

此外，本发明还提供了一种教学内容在线代码化系统，所述系统包括：客户端，用于向服务端上传需要代码化的内容信息，以及将完成代码化的代码化信息下载到本地；服务端，用于获取客户端上传到的需要代码化的内容信息，在所述内容信息中识别文本框、公式框及图片框，通过对所述文本框、公式框及图片框内容信息的多线程并发光学字符识别OCR，获取到与所述内容信息对应的代码化信息，将所述代码化信息传输至客户端。

在一些实施例中，所述服务端包括：任务中心，用于根据客户端的操作启动对客户端上传的教学内容进行代码化的流程；异步计算单元，用于对上传文档中文本位置、公式位置进行识别，并且在完成识别之后完成对上传文档的裁切；并行OCR单元，用于完成对裁切得到的文本框及公式框中的文本、公式进行OCR识别；文本OCR单元，用于对文本框进行OCR；公式OCR单元，用于对公式框进行OCR；监听单元，用于对文本框及公式框的OCR过程进行监听；数据库，用于保存对文本框及公式框进行OCR的识别结果。

在一些实施例中，所述异步计算单元对于上传文档中文本位置、公式位置的识别是多线程的，基于相对位置关系的识别。

采用这样的设计后，本发明至少具有以下优点：

本发明利用多线程并发技术提供了在线快速产出代码化内容，解放人力，很大程度上节省人力成本，效率翻倍提升。

附图说明

上述仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，以下结合附图与具体实施方式对本发明作进一步的详细说明。

图1是本发明实施例提供的教学内容在线代码化方法的流程图；

图2是本发明实施例提供的教学内容在线代码化系统的结构图；

图3是本发明实施例提供的教学内容在线代码化系统的网络架构图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

本发明实施例提供了一种教学内容在线代码化方法。图1示出该方法的流程图。参见图1，教学内容在线代码化方法包括：

S100，读取本地pdf文件。

S101，在读取的本地pdf文件中，根据用户输入进行分页框选。

S102，上传本地pdf文件的图片。

需要说明的是，上传图片时，是根据本地pdf文件的不同内容之间的相对位置进行的上传。例如，一张图片与其所在页面的上边沿之间的距离为3厘米，则在上传过程，不仅要上传这张图片，还需要上传与上边沿之间的距离。

解决上述相对位置上传的问题一种有效手段是在页面内建立坐标体系。例如，以一个页面的左上角为坐标原点，页面内的其他位置点以自身与坐标原点为参照，确定自身的坐标。

这里的距离是像素距离，不是实际距离，取决于屏幕分辨率，并根据pdf文件缩放比例动态计算。

例如在分辨率800*600，缩放比例为200％的情况下，框选一个100*200的图片，则图片的实际大小为50*100。

S103，服务端任务中心启动API服务。

S104，异步计算单元开始异步计算上传文件中的文本位置，并进行裁切。

异步计算单元需要在上传文件页面识别不同的文本框、公式框、图片框，并一一确认识别得到的文本框、公式框、图片框的位置信息。上述确认位置信息的过程也可以被称为裁切。

裁切时会记录每一部分的实际坐标，并按从上到下从左到右排序。识别后拼接时按照裁切的顺序和位置进行还原。

S105，并行OCR单元对裁切得到的文本框、公式框分别进行OCR识别。

典型的，可以对每个单独文本框启动一个文本OCR线程，并对每个单独的公式框启动一个公式OCR线程。每个启动的文本OCR线程负责对应的文本框内的文字识别，而每个启动的公式OCR线程负责对其对应的公式框内的字符识别。

由于对被识别内容运行的OCR过程是多个线程的OCR过程，本发明实施例提供的方法具有转换效率高，运行速度快的特点。

S106,监听单元同步监听子任务的运行结果。

监听单元的任务在于对每个单独启动的线程的运行结果进行监听，并将监听结果存入数据。

S107，文本OCR线程对文本框内的内容进行识别。

S108，公式OCR线程对公式框内的内容进行识别。

需要说明的是，上述由文本OCR线程及公式OCR线程共同构成的OCR过程是对原始上传内容的多页同时进行的转换过程。也就是说，在原始上传内容中处于不同页面上的文本或者公式，是被分配到不同的线程中同时进行识别的。

S109，将文本OCR线程及公式OCR线程的识别结果进行汇总。

S110，将汇总的代码化内容传输至客户端。

典型的，汇总的代码化内容，也就是提供给客户端下载的内容是l atex文本类型。

而且，本发明在将多个线程的识别结果进行汇总之后，在汇总的代码化内容提供下载之前，还包括显示汇总结果，以便用户进行校验修改的步骤。并且，在校验修改的界面上，被校验内容是以识别的文本框、公式框、图片框为单元进行显示的。这样一来，能够方便用户根据框选拆分内容颗粒度，对内容进行校验修改。

由于上述的校验修改过程是线上的校验修改过程，上述的校验修改操作又被称为在线修改过程。

本发明实施例还提供了一种教学内容在线代码化系统。图2示出了该系统的内部系统结构。参见图2，教学内容在线代码化系统包括：任务中心21、异步计算单元22、并行OCR单元23、文本OCR24、公式OCR25、监听单元26，以及数据库27。

任务中心21的功能在于根据客户端的操作启动对客户端上传的教学内容进行代码化的流程，也就是启动API服务。在任务中心21中，能够触发上述API服务的客户端动作是图片形式的教学内容的上传完成动作。

异步计算单元22在系统中用于对上传文档中文本位置、公式位置进行识别，并且在完成识别之后完成对上传文档的裁切。裁切的结果是将上传文档划分为多个文本框、公式框以及纯图片框。并且，上述对于位置的识别，以及对于文档的裁切在异步计算单元22中均是通过异步操作完成的。

并行OCR单元23用于在异步计算单元22完成位置识别及文档裁切之后，完成对裁切得到的文本框及公式框中的文本、公式进行OCR识别。上述识别过程是一个并发的过程。典型的，针对每一个文本框或者公式框，并行OCR单元均会单独启动一个线程进行识别，并且在对当前的文本框或者公式框完成识别之后，完成与之对应线程的终止。

文本OCR24是针对识别得到的文本框的OCR识别程序模块，它对应于并行OCR单元23中对于文本框所启动的文本OCR识别线程。典型情况下，每个文本框会启动单独的文本OCR识别线程进行识别。当然，也不排除出现识别工作量较大的文本框时，启动多个文本识别OCR线程进行识别的情况。

公式OCR25是针对识别得到的公式框的OCR识别程序模块，它对应于并行OCR单元23中对于公式框所启动的公式OCR识别线程。

监听单元26的功能在于监听系统内各个子任务的运行情况。而且，监听单元26所执行的监听是同步监听过程。设置了监听单元26之后，能够有效的防止各个子任务之间由于运行不同步所造成的数据混乱。

数据库27中保存各个子任务的运行结果，也就是OCR识别得到的文本或者公式。这些文本或者公式在代码化内容汇总的过程中将会有十分重要的作用。

图3示出了教学内容在线代码化系统的网络架构。参见图3，教学内容在线代码化系统包括：客户端31，以及服务端32。在本发明实施例中，客户端21的作用在于完成了需要代码化内容的上传，以及代码化结果的下载。而服务端32通过异步过程完成了上传内容的OCR识别，以及识别结果的汇总。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，本领域技术人员利用上述揭示的技术内容做出些许简单修改、等同变化或修饰，均落在本发明的保护范围内。

Claims

1.一种教学内容在线代码化方法，其特征在于，包括：

获取客户端上传到的需要代码化的内容信息；

在所述内容信息中识别文本框、公式框及图片框；

通过对所述文本框、公式框及图片框内的内容信息的多线程并发光学字符识别OCR，获取到与所述内容信息对应的代码化信息；

将所述代码化信息传输至客户端。

2.根据权利要求1所述的教学内容在线代码化方法，其特征在于，在所述内容信息中识别文本框、公式框及图片框，包括：

根据用户输入，多线程并发的划分文本框、公式框及图片框。

3.根据权利要求2所述的教学内容在线代码化方法，其特征在于，对于文本框、公式框及图片框的划分为基于所述文本框、公式框及图片框在内容信息中的位置进行的划分。

4.根据权利要求1所述的教学内容在线代码化方法，其特征在于，通过对所述文本框、公式框及图片框内的内容信息的多线程并发光学字符识别OCR，获取到与所述内容信息对应的代码化信息，包括：

通过对所述内容信息的分页，多页同时获取与所述内容信息对应的代码化信息。

5.根据权利要求4所述的教学内容在线代码化方法，其特征在于，通过对所述内容信息的分页，多页同时获取与所述内容信息对应的代码化信息，包括：

利用文本OCR线程识别所述文本信息；

利用公式OCR线程识别所述公式信息；

根据识别的文本结果、公式结果，汇总为每页的代码化信息。

6.根据权利要求4所述的教学内容在线代码化方法，其特征在于，同时运行多个文本OCR线程，并且同时运行多个公式OCR线程。

7.根据权利要求4所述的教学内容在线代码化方法，其特征在于，通过对所述内容信息的光学字符识别OCR，获取到与所述内容信息对应的代码化信息，还包括：

对所述文本OCR线程及公式OCR线程的运行结果进行监听。

8.一种教学内容在线代码化系统，其特征在于，包括：

客户端，用于向服务端上传需要代码化的内容信息，以及将完成代码化的代码化信息下载到本地；

服务端，用于获取客户端上传到的需要代码化的内容信息，在所述内容信息中识别文本框、公式框及图片框，通过对所述文本框、公式框及图片框内的内容信息的多线程并发光学字符识别OCR，获取到与所述内容信息对应的代码化信息，将所述代码化信息传输至客户端。

9.根据权利要求8所述的教学内容在线代码化系统，其特征在于，所述服务端包括：

任务中心，用于根据客户端的操作启动对客户端上传的教学内容进行代码化的流程；

异步计算单元，用于对上传文档中文本位置、公式位置进行识别，并且在完成识别之后完成对上传文档的裁切；

并行OCR单元，用于完成对裁切得到的文本框及公式框中的文本、公式进行OCR识别；

文本OCR单元，用于对文本框进行OCR；

公式OCR单元，用于对公式框进行OCR；

监听单元，用于对文本框及公式框的OCR过程进行监听；

数据库，用于保存对文本框及公式框进行OCR的识别结果。

10.根据权利要求9所述的教学内容在线代码化系统，其特征在于，所述异步计算单元对于上传文档中文本位置、公式位置的识别是多线程的，基于相对位置关系的识别。