CN110188745A - 教学内容在线代码化方法及系统 - Google Patents

教学内容在线代码化方法及系统 Download PDF

Info

Publication number
CN110188745A
CN110188745A CN201910463851.2A CN201910463851A CN110188745A CN 110188745 A CN110188745 A CN 110188745A CN 201910463851 A CN201910463851 A CN 201910463851A CN 110188745 A CN110188745 A CN 110188745A
Authority
CN
China
Prior art keywords
content
ocr
code
text
formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910463851.2A
Other languages
English (en)
Inventor
胡彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Love Top Education Technology Co Ltd
Original Assignee
Beijing Love Top Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Love Top Education Technology Co Ltd filed Critical Beijing Love Top Education Technology Co Ltd
Priority to CN201910463851.2A priority Critical patent/CN110188745A/zh
Publication of CN110188745A publication Critical patent/CN110188745A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

本发明实施例提供了一种教学内容在线代码化方法及系统。该方法包括:获取客户端上传到的需要代码化的内容信息;在所述内容信息中识别文本框、公式框、图片框;通过对所述文本框、公式框、图片框中的内容信息的多线程并行的光学字符识别OCR,获取到与所述内容信息对应的代码化信息;将所述代码化信息传输至客户端。本发明实施例提供的教学内容在线代码化方法及系统能够克服现有技术中需要代码化数据时的效率低下的问题。

Description

教学内容在线代码化方法及系统
技术领域
本发明涉及数据分析处理技术领域,特别是涉及一种教学内容在线代码化方法及系统。
背景技术
传统的教研内容生产流程中,教学内容编写是一个消耗时间最长且重复率最高的一件事情,大量精品的题目只有扫描版或纸质版,老师想要从线下搬到线上录入线上题库或者想要二次编辑使用时需要重新进行手动录入,效率低下,并且手动人工录入容易出现错误偏差影响使用。
发明内容
本发明要解决的技术问题是提供一种教学内容在线代码化方法及系统,以克服现有技术中需要代码化数据时效率低下的问题。
为解决上述技术问题,本发明提供了一种教学内容在线代码化方法,所述方法包括:获取客户端上传到的需要代码化的内容信息;在所述内容信息中识别文本框、公式框及图片框;通过对所述文本框、公式框及图片框中内容信息的多线程并发光学字符识别OCR,获取到与所述内容信息对应的代码化信息;将所述代码化信息传输至客户端。
在一些实施例中,在所述内容信息中识别文本框、公式框及图片框,包括:根据用户输入,多线程并发的划分文本框、公式框及图片框。
在一些实施例中,对于文本框、公式框及图片框的划分为基于所述文本框、公式框及图片框在内容信息中的位置进行的划分。
在一些实施例中,通过对所述文本框、公式框、图片框内的内容信息的多线程并发光学字符识别OCR,获取到与所述内容信息对应的代码化信息,包括:通过对所述内容信息的分页,多页同时获取与所述内容信息对应的代码化信息。
在一些实施例中,通过对所述内容信息的分页,多页同时获取与所述内容信息对应的代码化信息,包括:利用文本OCR线程识别所述文本信息;利用公式OCR线程识别所述公式信息;根据识别的文本结果、公式结果,汇总为每页的代码化信息。
在一些实施例中,同时运行多个文本OCR线程,并且同时运行多个文本OCR线程。
在一些实施例中,通过对所述内容信息的光学字符识别OCR,获取到与所述内容信息对应的代码化信息,还包括:对所述文本OCR线程及公式OCR线程的运行结果进行监听。
此外,本发明还提供了一种教学内容在线代码化系统,所述系统包括:客户端,用于向服务端上传需要代码化的内容信息,以及将完成代码化的代码化信息下载到本地;服务端,用于获取客户端上传到的需要代码化的内容信息,在所述内容信息中识别文本框、公式框及图片框,通过对所述文本框、公式框及图片框内容信息的多线程并发光学字符识别OCR,获取到与所述内容信息对应的代码化信息,将所述代码化信息传输至客户端。
在一些实施例中,所述服务端包括:任务中心,用于根据客户端的操作启动对客户端上传的教学内容进行代码化的流程;异步计算单元,用于对上传文档中文本位置、公式位置进行识别,并且在完成识别之后完成对上传文档的裁切;并行OCR单元,用于完成对裁切得到的文本框及公式框中的文本、公式进行OCR识别;文本OCR单元,用于对文本框进行OCR;公式OCR单元,用于对公式框进行OCR;监听单元,用于对文本框及公式框的OCR过程进行监听;数据库,用于保存对文本框及公式框进行OCR的识别结果。
在一些实施例中,所述异步计算单元对于上传文档中文本位置、公式位置的识别是多线程的,基于相对位置关系的识别。
采用这样的设计后,本发明至少具有以下优点:
本发明利用多线程并发技术提供了在线快速产出代码化内容,解放人力,很大程度上节省人力成本,效率翻倍提升。
附图说明
上述仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,以下结合附图与具体实施方式对本发明作进一步的详细说明。
图1是本发明实施例提供的教学内容在线代码化方法的流程图;
图2是本发明实施例提供的教学内容在线代码化系统的结构图;
图3是本发明实施例提供的教学内容在线代码化系统的网络架构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明实施例提供了一种教学内容在线代码化方法。图1示出该方法的流程图。参见图1,教学内容在线代码化方法包括:
S100,读取本地pdf文件。
S101,在读取的本地pdf文件中,根据用户输入进行分页框选。
S102,上传本地pdf文件的图片。
需要说明的是,上传图片时,是根据本地pdf文件的不同内容之间的相对位置进行的上传。例如,一张图片与其所在页面的上边沿之间的距离为3厘米,则在上传过程,不仅要上传这张图片,还需要上传与上边沿之间的距离。
解决上述相对位置上传的问题一种有效手段是在页面内建立坐标体系。例如,以一个页面的左上角为坐标原点,页面内的其他位置点以自身与坐标原点为参照,确定自身的坐标。
这里的距离是像素距离,不是实际距离,取决于屏幕分辨率,并根据pdf文件缩放比例动态计算。
例如在分辨率800*600,缩放比例为200%的情况下,框选一个100*200的图片,则图片的实际大小为50*100。
S103,服务端任务中心启动API服务。
S104,异步计算单元开始异步计算上传文件中的文本位置,并进行裁切。
异步计算单元需要在上传文件页面识别不同的文本框、公式框、图片框,并一一确认识别得到的文本框、公式框、图片框的位置信息。上述确认位置信息的过程也可以被称为裁切。
裁切时会记录每一部分的实际坐标,并按从上到下从左到右排序。识别后拼接时按照裁切的顺序和位置进行还原。
S105,并行OCR单元对裁切得到的文本框、公式框分别进行OCR识别。
典型的,可以对每个单独文本框启动一个文本OCR线程,并对每个单独的公式框启动一个公式OCR线程。每个启动的文本OCR线程负责对应的文本框内的文字识别,而每个启动的公式OCR线程负责对其对应的公式框内的字符识别。
由于对被识别内容运行的OCR过程是多个线程的OCR过程,本发明实施例提供的方法具有转换效率高,运行速度快的特点。
S106,监听单元同步监听子任务的运行结果。
监听单元的任务在于对每个单独启动的线程的运行结果进行监听,并将监听结果存入数据。
S107,文本OCR线程对文本框内的内容进行识别。
S108,公式OCR线程对公式框内的内容进行识别。
需要说明的是,上述由文本OCR线程及公式OCR线程共同构成的OCR过程是对原始上传内容的多页同时进行的转换过程。也就是说,在原始上传内容中处于不同页面上的文本或者公式,是被分配到不同的线程中同时进行识别的。
S109,将文本OCR线程及公式OCR线程的识别结果进行汇总。
S110,将汇总的代码化内容传输至客户端。
典型的,汇总的代码化内容,也就是提供给客户端下载的内容是l atex文本类型。
而且,本发明在将多个线程的识别结果进行汇总之后,在汇总的代码化内容提供下载之前,还包括显示汇总结果,以便用户进行校验修改的步骤。并且,在校验修改的界面上,被校验内容是以识别的文本框、公式框、图片框为单元进行显示的。这样一来,能够方便用户根据框选拆分内容颗粒度,对内容进行校验修改。
由于上述的校验修改过程是线上的校验修改过程,上述的校验修改操作又被称为在线修改过程。
本发明实施例还提供了一种教学内容在线代码化系统。图2示出了该系统的内部系统结构。参见图2,教学内容在线代码化系统包括:任务中心21、异步计算单元22、并行OCR单元23、文本OCR24、公式OCR25、监听单元26,以及数据库27。
任务中心21的功能在于根据客户端的操作启动对客户端上传的教学内容进行代码化的流程,也就是启动API服务。在任务中心21中,能够触发上述API服务的客户端动作是图片形式的教学内容的上传完成动作。
异步计算单元22在系统中用于对上传文档中文本位置、公式位置进行识别,并且在完成识别之后完成对上传文档的裁切。裁切的结果是将上传文档划分为多个文本框、公式框以及纯图片框。并且,上述对于位置的识别,以及对于文档的裁切在异步计算单元22中均是通过异步操作完成的。
并行OCR单元23用于在异步计算单元22完成位置识别及文档裁切之后,完成对裁切得到的文本框及公式框中的文本、公式进行OCR识别。上述识别过程是一个并发的过程。典型的,针对每一个文本框或者公式框,并行OCR单元均会单独启动一个线程进行识别,并且在对当前的文本框或者公式框完成识别之后,完成与之对应线程的终止。
文本OCR24是针对识别得到的文本框的OCR识别程序模块,它对应于并行OCR单元23中对于文本框所启动的文本OCR识别线程。典型情况下,每个文本框会启动单独的文本OCR识别线程进行识别。当然,也不排除出现识别工作量较大的文本框时,启动多个文本识别OCR线程进行识别的情况。
公式OCR25是针对识别得到的公式框的OCR识别程序模块,它对应于并行OCR单元23中对于公式框所启动的公式OCR识别线程。
监听单元26的功能在于监听系统内各个子任务的运行情况。而且,监听单元26所执行的监听是同步监听过程。设置了监听单元26之后,能够有效的防止各个子任务之间由于运行不同步所造成的数据混乱。
数据库27中保存各个子任务的运行结果,也就是OCR识别得到的文本或者公式。这些文本或者公式在代码化内容汇总的过程中将会有十分重要的作用。
图3示出了教学内容在线代码化系统的网络架构。参见图3,教学内容在线代码化系统包括:客户端31,以及服务端32。在本发明实施例中,客户端21的作用在于完成了需要代码化内容的上传,以及代码化结果的下载。而服务端32通过异步过程完成了上传内容的OCR识别,以及识别结果的汇总。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,本领域技术人员利用上述揭示的技术内容做出些许简单修改、等同变化或修饰,均落在本发明的保护范围内。

Claims (10)

1.一种教学内容在线代码化方法,其特征在于,包括:
获取客户端上传到的需要代码化的内容信息;
在所述内容信息中识别文本框、公式框及图片框;
通过对所述文本框、公式框及图片框内的内容信息的多线程并发光学字符识别OCR,获取到与所述内容信息对应的代码化信息;
将所述代码化信息传输至客户端。
2.根据权利要求1所述的教学内容在线代码化方法,其特征在于,在所述内容信息中识别文本框、公式框及图片框,包括:
根据用户输入,多线程并发的划分文本框、公式框及图片框。
3.根据权利要求2所述的教学内容在线代码化方法,其特征在于,对于文本框、公式框及图片框的划分为基于所述文本框、公式框及图片框在内容信息中的位置进行的划分。
4.根据权利要求1所述的教学内容在线代码化方法,其特征在于,通过对所述文本框、公式框及图片框内的内容信息的多线程并发光学字符识别OCR,获取到与所述内容信息对应的代码化信息,包括:
通过对所述内容信息的分页,多页同时获取与所述内容信息对应的代码化信息。
5.根据权利要求4所述的教学内容在线代码化方法,其特征在于,通过对所述内容信息的分页,多页同时获取与所述内容信息对应的代码化信息,包括:
利用文本OCR线程识别所述文本信息;
利用公式OCR线程识别所述公式信息;
根据识别的文本结果、公式结果,汇总为每页的代码化信息。
6.根据权利要求4所述的教学内容在线代码化方法,其特征在于,同时运行多个文本OCR线程,并且同时运行多个公式OCR线程。
7.根据权利要求4所述的教学内容在线代码化方法,其特征在于,通过对所述内容信息的光学字符识别OCR,获取到与所述内容信息对应的代码化信息,还包括:
对所述文本OCR线程及公式OCR线程的运行结果进行监听。
8.一种教学内容在线代码化系统,其特征在于,包括:
客户端,用于向服务端上传需要代码化的内容信息,以及将完成代码化的代码化信息下载到本地;
服务端,用于获取客户端上传到的需要代码化的内容信息,在所述内容信息中识别文本框、公式框及图片框,通过对所述文本框、公式框及图片框内的内容信息的多线程并发光学字符识别OCR,获取到与所述内容信息对应的代码化信息,将所述代码化信息传输至客户端。
9.根据权利要求8所述的教学内容在线代码化系统,其特征在于,所述服务端包括:
任务中心,用于根据客户端的操作启动对客户端上传的教学内容进行代码化的流程;
异步计算单元,用于对上传文档中文本位置、公式位置进行识别,并且在完成识别之后完成对上传文档的裁切;
并行OCR单元,用于完成对裁切得到的文本框及公式框中的文本、公式进行OCR识别;
文本OCR单元,用于对文本框进行OCR;
公式OCR单元,用于对公式框进行OCR;
监听单元,用于对文本框及公式框的OCR过程进行监听;
数据库,用于保存对文本框及公式框进行OCR的识别结果。
10.根据权利要求9所述的教学内容在线代码化系统,其特征在于,所述异步计算单元对于上传文档中文本位置、公式位置的识别是多线程的,基于相对位置关系的识别。
CN201910463851.2A 2019-05-30 2019-05-30 教学内容在线代码化方法及系统 Pending CN110188745A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910463851.2A CN110188745A (zh) 2019-05-30 2019-05-30 教学内容在线代码化方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910463851.2A CN110188745A (zh) 2019-05-30 2019-05-30 教学内容在线代码化方法及系统

Publications (1)

Publication Number Publication Date
CN110188745A true CN110188745A (zh) 2019-08-30

Family

ID=67719006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910463851.2A Pending CN110188745A (zh) 2019-05-30 2019-05-30 教学内容在线代码化方法及系统

Country Status (1)

Country Link
CN (1) CN110188745A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111383124A (zh) * 2020-05-29 2020-07-07 支付宝(杭州)信息技术有限公司 一种用户材料的校验方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567300A (zh) * 2011-12-29 2012-07-11 方正国际软件有限公司 图片文档的处理方法及装置
CN102904909A (zh) * 2011-07-25 2013-01-30 上海博路信息技术有限公司 一种云模式的ocr文字识别方法
CN103077388A (zh) * 2012-10-31 2013-05-01 浙江大学 面向便携式计算设备的快速文本扫读方法
CN104123550A (zh) * 2013-04-25 2014-10-29 魏昊 基于云计算的文本扫描识别方法
CN104376317A (zh) * 2013-08-12 2015-02-25 福建福昕软件开发股份有限公司北京分公司 一种将纸质文件转换为电子文件的方法
CN109558875A (zh) * 2018-11-14 2019-04-02 广州同略信息科技有限公司 基于图像自动识别的方法、装置、终端及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102904909A (zh) * 2011-07-25 2013-01-30 上海博路信息技术有限公司 一种云模式的ocr文字识别方法
CN102567300A (zh) * 2011-12-29 2012-07-11 方正国际软件有限公司 图片文档的处理方法及装置
CN103077388A (zh) * 2012-10-31 2013-05-01 浙江大学 面向便携式计算设备的快速文本扫读方法
CN104123550A (zh) * 2013-04-25 2014-10-29 魏昊 基于云计算的文本扫描识别方法
CN104376317A (zh) * 2013-08-12 2015-02-25 福建福昕软件开发股份有限公司北京分公司 一种将纸质文件转换为电子文件的方法
CN109558875A (zh) * 2018-11-14 2019-04-02 广州同略信息科技有限公司 基于图像自动识别的方法、装置、终端及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
贺景宇: "复杂版面文档图像中公式与文本的提取及分析", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111383124A (zh) * 2020-05-29 2020-07-07 支付宝(杭州)信息技术有限公司 一种用户材料的校验方法和装置
CN111383124B (zh) * 2020-05-29 2024-06-14 蚂蚁胜信(上海)信息技术有限公司 一种用户材料的校验方法和装置

Similar Documents

Publication Publication Date Title
US20200327384A1 (en) Method and apparatus for detecting text regions in image, device, and medium
CN109214303B (zh) 一种基于云端api的多线程动态人脸签到方法
CN103092954A (zh) 用于文档导航的低分辨率占位符内容
WO2019033656A1 (zh) 板书处理方法、装置、设备和计算机可读存储介质
RU2579899C1 (ru) Обработка документа с использованием нескольких потоков обработки
CN102799571B (zh) Word文件生成图片的方法及系统
US11544814B2 (en) Method and system for displaying a video poster based on artificial intelligence
US20170032558A1 (en) Multi-format calendar digitization
JP2001005582A (ja) 画像ベースのデータを描画するシステムおよび方法
US10552535B1 (en) System for detecting and correcting broken words
CN110188745A (zh) 教学内容在线代码化方法及系统
CN102708160A (zh) 题库建立方法和装置
CN112532785B (zh) 图像显示方法、装置、电子设备以及存储介质
CN113900629A (zh) 一种计算机流程自动化的引擎实现系统
CN108513034A (zh) 远程拍摄图片的方法、电子装置及计算机可读存储介质
CN211909012U (zh) 拼接图像处理设备
US20230048495A1 (en) Method and platform of generating document, electronic device and storage medium
CN111126265A (zh) 活体检测方法、装置、电子设备及介质
CN111985881A (zh) 智能合同审阅系统及方法
CN113486171B (zh) 一种图像处理方法及装置、电子设备
KR20200058026A (ko) 증강 현실을 이용한 한자 공부를 위한 전자 장치의 동작 방법
CN114331932A (zh) 目标图像生成方法和装置、计算设备以及计算机存储介质
CN110119694B (zh) 一种图片处理方法、装置及计算机可读存储介质
CN111552826B (zh) 示例图片的生成方法、装置、计算机设备及存储介质
CN107730422A (zh) 一种基于面部识别在线考试分析系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Zou Jin

Inventor after: Hu Bin

Inventor after: Xu Jicheng

Inventor before: Hu Bin

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190830