CN106779488A - 数字版电子书的校对方法及系统 - Google Patents

数字版电子书的校对方法及系统 Download PDF

Info

Publication number
CN106779488A
CN106779488A CN201710042585.7A CN201710042585A CN106779488A CN 106779488 A CN106779488 A CN 106779488A CN 201710042585 A CN201710042585 A CN 201710042585A CN 106779488 A CN106779488 A CN 106779488A
Authority
CN
China
Prior art keywords
book
reader
collation
check
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710042585.7A
Other languages
English (en)
Inventor
李政放
常治国
赵慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen MPR Technology Co Ltd
Original Assignee
Shenzhen MPR Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen MPR Technology Co Ltd filed Critical Shenzhen MPR Technology Co Ltd
Priority to CN201710042585.7A priority Critical patent/CN106779488A/zh
Publication of CN106779488A publication Critical patent/CN106779488A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063112Skill-based matching of a person or a group to a task

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种数字版电子书的校对方法及系统,其中该方法包括:获取数字版电子书,将所述数字版电子书分解为若干内容片段;生成所述内容片段对应的校对任务并发布,使得终端的读者获取所述校对任务,通过修正内容片段存在的错误内容来完成校对任务;接收终端上传读者完成校对任务后得到的校对结果并存储;将所述内容片段更新为校对结果并发布。上述方法及系统降低校对成本提高了校对质量。

Description

数字版电子书的校对方法及系统
技术领域
本发明涉及计算机技术领域,特别是涉及一种数字版电子书的校对方法及系统。
背景技术
由于出版产业远早于计算机与信息技术的发展,全世界范围内的出版社拥有的海量图书中,很大一部分只有纸质版没有电子版。为了解决这个问题,通常的做法是用电子图像扫描仪对纸质图书进行扫描后获得所谓扫描版的电子书,然后再对扫描版的电子书进行OCR识别获得原始数字版电子书,然后再对原始数字版电子书进行校对、内容流重建等操作,最终获得高质量数字版电子书。然而校对和内容流重建需要处理图书中的标题、脚注、尾注、标注、图注、表格、公式、参考文献等内容项,在可预见的一段时期内,人工智能很难在获取合理商业利益的约束条件下完成此项工作,因此OCR之后的数字版电子书的校对和内容重建工作仍是靠高成本的人工操作完成,通常情况下是由电子书加工企业雇佣全职的加工人员来完成的,成本较高,此外,同一批加工人员需要加工各种不同类型的图书,一当加工人员的知识水平与所加工的图书(例如工程技术专业书籍)不匹配,加工质量就得不到保障。
发明内容
基于此,有必要针对上述技术问题,提供一种能降低成本的数字版电子书的校对方法及系统,同时还能保电子书的质量。
一种数字版电子书的校对方法,包括:
获取数字版电子书,将所述数字版电子书分解为若干内容片段;
生成所述内容片段对应的校对任务并发布,使得终端的读者获取所述校对任务,通过修正内容片段存在的错误内容来完成校对任务;
接收终端上传读者完成校对任务后得到的校对结果并存储;
将所述内容片段更新为校对结果并发布。
在其中一个实施例中,在所述内容片段更新为校对结果并发布的步骤之后,还包括:
根据校对结果增加读者对应数量的读书积分。
在其中一个实施例中,获取数字版电子图书的步骤之前,还包括:
对纸质图书按页进行扫描,获得版式电子书;
对所述版式电子书的布局结构进行分析,将版式电子书的每一页按照文件类型划分为若干对象;
对所述对象分别采用对应的OCR识别方式进行文字识别获得流式电子书;
将所述版式电子书以及流式电子书进行压缩打包得到数字版电子书。
在其中一个实施例中,在将所述内容片段更新为校对结果并发布的步骤之后,所述方法还包括:
将所述内容片段标记为已校对;
判断所述数字版电子书所有的内容片段是否都标记为已校对;
若是,则监控预设时间内数字版电子书的阅读次数以及终端上传的校对结果的次数;
判断所述修正次数是否小于阅读次数预设阈值,若是,则关闭读者的校对功能,所述数字版电子书为最终阅读版本。
在其中一个实施例中,在所述关闭读者的校对功能的步骤之后,还包括:
将所述最终阅读版本的内容片段与对应的已存储校对结果进行一一比较,判断两者是否一致;
若是,则将上传所述校对结果的终端对应读者的读书积分标记为有效;
否则,将上传所述校对结果的终端对应读者的读书积分标记为无效,并减去所述读者对应已有数量的读书积分。
一种数字版电子书的校对方法,包括:
从服务器获取校对任务,读者通过修正校对任务对应的内容片段存在的错误来完成校对任务;
上传读者完成所述校对任务获得的校对结果,使得所述服务器根据校对结果更新数字版电子书;
获取服务器根据校对结果为读者增加的读书积分,所述读书积分用于兑换购书优惠劵。
一种数字版电子书的校对系统,包括终端以及服务器;其中,所述服务器用于获取数字版电子书,将所述数字版电子书分解为若干内容片段;生成所述内容片段对应的校对任务并发布,使得终端的读者获取所述校对任务,通过修正内容片段存在的错误内容来完成校对任务;接收终端上传读者完成校对任务后得到的校对结果并存储;将所述内容片段更新为校对结果并发布;
所述终端用于从服务器获取校对任务,读者通过修正校对任务对应的内容片段存在的错误来完成校对任务;上传读者完成所述校对任务获得的校对结果,使得所述服务器根据校对结果更新数字版电子书;获取服务器根据校对结果为读者增加的读书积分,所述读书积分用于兑换购书优惠劵。
在其中一个实施例中,所述服务器还用于根据校对结果增加读者对应数量的读书积分;将所述内容片段标记为已校对;判断所述数字版电子书所有的内容片段是否都标记为已校对;若是,则监控预设时间内数字版电子书的阅读次数以及终端上传的校对结果的次数;判断所述修正次数是否小于阅读次数预设阈值,若是,则关闭读者的校对功能,所述数字版电子书为最终阅读版本。
在其中一个实施例中,所述服务器还用于将所述最终阅读版本的内容片段与对应的已存储校对结果进行一一比较,判断两者是否一致;若是,则将上传所述校对结果的终端对应读者的读书积分标记为有效;否则,将上传所述校对结果的终端对应读者的读书积分标记为无效,并减去所述读者对应已有数量的读书积分。
一种数字版电子书的获取装置,所述装置包括如下模块:
扫描模块,对纸质图书按页进行扫描,获得版式电子书;
拆分模块,用于对对所述版式电子书的布局结构进行分析,将版式电子书的每一页按照文件类型划分为若干对象;
识别模块,用于对所述对象分别采用对应的OCR识别方式进行文字识别获得流式电子书;
打包模块,用于将所述版式电子书以及流式电子书进行压缩打包得到数字版电子书。
上述数字版电子书校对方法及系统,相比图书数字化加工企业组织人力集中对图书内容校对,本发明的方法和系统具有如下优势:1、图书校对工作者就是读者,校对结果直接经受读者的检验,质量有最直接的保障标准;2、图书校对工作者就是读者,解决了传统数据加工中心找不到专业图书对口图书校对工作者的难题;3、图书校对工作者就是读者,从社会心理学的角度分析,读者参与图书加工主要是基于内在需要,而传统数据加工中心的工作人员是出于外在需要(即为了获得工资)而进行图书加工,内在需要驱动更能保障工作质量;4、无需成立独立的企业实体,从而省去了办公场所、办公设施、IT基础设施、人力资源与管理等成本,相比传统的数据加工中心集中加工的模式,极大的节省了社会成本,同时保证了校对质量。
附图说明
图1为一个实施例中数字版电子书的校对方法的数据流程图;
图2为一个实施例中版式电子书与流式电子书的结构图;
图3为一个实施例中在获取数字版电子图书步骤之前的数据流程图;
图4为一个实施例中在将内容片段更新为校对结果并发布步骤之前的数据流程图;
图5为一个实施例中在关闭读者的校对功能步骤之前的数据流程图;
图6为另一个实施例中数字版电子书的校对方法的数据流程图;
图7为一个实施例中数字版电子书的校对方法的应用场景图;
图8为一个实施例中数字版电子书获取装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在一个实施例中,如图1所示,提供的数字版电子书的校对方法,该方法包括如下步骤:
步骤101,获取数字版电子书,将数字版电子书分解为若干内容片段。
本实施例中,通过扫描设备过对纸质书进行电子扫描后获得不能编辑的版式电子书,进一步对版式电子书进行OCR识别获得可编辑的流式电子书。如图2所示,数字版电子书包含版式电子书以及流式电子书。数字版电子书出现错误一部分来自于OCR识别过程中出现的识别错误,还可能是对纸质书扫描过程中出现的错误,还可能是纸质书籍本身就存在的错误,这些都需要对其错误进行纠正。服务器获取到待纠正的数字版电子书后,将根据预设规则将待纠正的数字版电子书拆分为若干内容片段,每个内容片段对应有校对任务。例如,可以按页或者按章节的形式将数字版电子书拆开来,以方便读者分批完成任务。
步骤102,生成内容片段对应的校对任务并发布,使得终端的读者获取校对任务,通过修正内容片段存在的错误内容来完成校对任务。
本实施例中,与服务器对应的是安装有电子书阅读器的终端。电子书阅读器带有校对电子书内容的功能。读者可以通过电子书阅读器从服务器中下载包含有版式电子书和流式电子书的数字版电子书,读者可以选择阅读版式电子书或流式电子书,当发现流式电子书与版式电子书不一致或出现错误时,即可通过电子书阅读器的校对功能对流式电子书进行内容修正。服务器会将校对任务通过互联网向外进行发布,读者通过登陆电子书阅读器即可领取校对任务,通过完成任务获得奖赏。
终端获取校对任务可以是由读者主动获取,也可以由服务器根据读者信息对其进行分配的。例如,读者如果喜欢古典文学,则会优先将古典文学的校对任务分配给该读者。读者完成的任务越多获得奖赏也就越多。由于数字版电子书中包含了版式电子书和流式电子书,两者将建立一一对应的关系,版式电子书由于是直接通过电子扫描获取的,因此它的内容可以作为在流式电子书校对过程的参考。读者可以一边读着版式电子书对流式电子书出现的错误进行修改。
步骤103,接收终端上传读者完成校对任务后得到的校对结果并存储。
服务器将会记录终端每次上传的校对记录,并进行存储。目的是保留校对痕迹,以方便后续校对结果的管理,因为同样一个校对任务不同的人校对后得到的校对结果会不同,服务器需要将每个终端上传的校对结果进行存储,以便后续选择最优的校对结果作为最终版本。
步骤104,将数字版电子书对应的内容片段更新为校对结果并发布。
内容片段被修正后,进一步同步到服务器,由服务器将原有的内容片段替换为校对结果。通过发布校对结果方便其它终端的读者能够第一时间享受到校对结果。
上述数字版电子书校对方法,相比图书数字化加工企业组织人力集中对图书内容校对,本发明的方法和系统具有如下优势:1、图书校对工作者就是读者,校对结果直接经受读者的检验,质量有最直接的保障标准;2、图书校对工作者就是读者,解决了传统数据加工中心找不到专业图书对口图书校对工作者的难题;3、图书校对工作者就是读者,从社会心理学的角度分析,读者参与图书加工主要是基于内在需要,而传统数据加工中心的工作人员是出于外在需要(即为了获得工资)而进行图书加工,内在需要驱动更能保障工作质量;4、无需成立独立的企业实体,从而省去了办公场所、办公设施、IT基础设施、人力资源与管理等成本,相比传统的数据加工中心集中加工的模式,极大的节省了社会成本。
如图1所示,在一个实施例中,在步骤104,内容片段更新为校对结果之后,该还包括如下步骤105,根据校对结果增加读者对应数量的读书积分。
为了鼓励更多的读者参与对数字版电子书的校对工作,本实施例中,服务器会根据读者递交的校对结果,增加读者对应的积分,积分用于兑换购书优惠卷。服务器会根据读者校对的工作量以及复杂程度来确定其增加读者积分的数量。
如图3所示,在一个实施例中,在步骤101,获取数字版电子图书之前,该方法还包括:
步骤201,对纸质图书按页进行扫描,获得版式电子书。
步骤202,对版式电子书的布局结构进行分析,将版式电子书的每一页按照文件类型划分为若干对象。
步骤203,对对象分别采用对应的OCR识别方式进行文字识别获得流式电子书。
步骤204,将版式电子书以及流式电子书进行压缩打包得到数字版电子书。
本实施例中,电子书扫描设备将纸质图书分页进行扫描获得版式电子书,版式电子书中的内容是图片格式的无法进行编辑;对版式电子书的每一页进行对象布局结构分析,从而将页面分割为一个或者多个封闭的区域对象,采用封闭的多边形顶点坐标来描述区域对象;将每个区域对象标识为对象类型,例如,文本、图片、表格,分别采用对应的OCR方式进行内容识别。为了便于后续对识别结果进行修正可以由参考对象,需要建立区域对象与识别结果一一对应的关系。具体的,可通过结构化数据文件记录内容识别后得到区域对象与识别结果之间的对应关系。
如图4所示,在一个实施例中,在步骤104,将内容片段更新为校对结果并发布之后,方法还包括:
步骤301,将内容片段标记为已校对。
步骤302,判断数字版电子书所有的内容片段是否都标记为已校对。
若是,则进入步骤303,监控预设时间内数字版电子书的阅读次数以及终端上传的校对结果的次数。
步骤304,判断修正次数是否小于阅读次数预设阈值。
若是,则进入步骤305,关闭读者的校对功能,数字版电子书为最终阅读版本。
若否,则继续发布校对任务。
本实施例中,为了提高校对效率,避免无止境的校对。服务器接收到终端上传的校对结果时会将对应的内容片段标记为已校对,当所有的内容片段都被标记为已校对时,表示该数字版电子书通过了一次完整的校对工作。此时监控读者阅读次数以及校对次数,若阅读次数远大于读者提交校对结果的次数,即可认为数字版已经达到读者期望的质量,校对工作已经完成,同时关闭读者的校对功能后续的读者只可阅读无法对数字版电子书进行修正了。否则继续允许读者校对。
如图5所示,在一个实施例中,在步骤303,关闭读者的校对功能之后,该方法还包括如下步骤:
步骤401,将最终阅读版本的内容片段与对应的已存储校对结果进行一一比较,判断两者是否一致。
若是,则进入步骤402,将上传校对结果的终端对应读者的读书积分标记为有效。
否则,进入步骤403,将上传校对结果的终端对应读者的读书积分标记为无效,并减去读者对应已有数量的读书积分。
为了鼓励读者参与校对,惩罚蓄意破坏者,服务器设置了读者积分系统,以记录每个读者参与校对的工作量,在读者每次将校对结果同步到服务器后,积分系统根据校对操作的复杂程度授予读者相应数量的读书积分,在校对工作完成并关闭读者校对功能的同时,积分系统将最终阅读版本的内容片段与此前读者每次校对获得读书积分的校对结果进行比较,以再次确认读者每次获得的读书积分的有效性,如果某次校对与最终阅读版本的内容片段一致则确认该次提交获得的读书积分有效,如果某次校对结果与最终阅读版本的内容片段不一致,则扣除比先前授予的数量更多的读书积分。如果读者的最终总读书积分数为正数,则可以将积分用于购买图书或者算成现金,以鼓励读者继续参与校对工作,如果读者的最终读书积分值小于预设值,则可对读者实施惩罚性措施,例如关闭其阅读器校对功能,给其发警告信息,公布其恶意校对行为,提高其在本商城的购书价格,甚至冻结其账号等等。
如图6所示,在一个实施例中,提供了一种数字版电子书的校对方法,该方法包括如下步骤:
步骤501,从服务器获取校对任务,读者通过修正校对任务对应的内容片段存在的错误来完成校对任务。
本实施例中,读者通过安装有电子阅读器的终端可以从电子书商城对应的服务器领取校对任务,也可以是服务器分配给读者的校对任务,获得校对任务后读者可以对该校对任务对应的流式电子进行编辑修订。具体的,读者可以阅读校对任务对应的版式电子书内容也可以阅读流式电子书内容,通过参考版式电子书内容来修改流式电子书的内容错误来完成校对任务。
步骤502,上传读者完成校对任务获得的校对结果,使得服务器根据校对结果更新数字版电子书。
本实施例中,更新数字版电子书就是将原有的内容片段更新为读者教对后的内容片段,以方便其他读者也可以看到最新版本的数字版电子书。当其他读者发现仍然有错误时,还可继续对其进行校对并重新上传校对结果。
步骤503,获取服务器根据校对结果为读者增加的读书积分,读书积分用于兑换购书优惠劵。
读书积分是服务器根据读者完成校对任务付出的劳动成果的奖励,完成的任务越多,任务越复杂获得的读书积分就会越多。读书积分可以兑换成购书优惠劵抵现金。
如图7所示,在一个实施例中,提供了一种数字版电子书的校对系统,包括终端以及服务器;其中,所述服务器用于获取数字版电子书,将所述数字版电子书分解为若干内容片段;生成所述内容片段对应的校对任务并发布,使得终端的读者获取所述校对任务,通过修正内容片段存在的错误内容来完成校对任务;接收终端上传读者完成校对任务后得到的校对结果并存储;将所述内容片段更新为校对结果并发布;
所述终端用于从服务器获取校对任务,读者通过修正校对任务对应的内容片段存在的错误来完成校对任务;上传读者完成所述校对任务获得的校对结果,使得所述服务器根据校对结果更新数字版电子书;获取服务器根据校对结果为读者增加的读书积分,所述读书积分用于兑换购书优惠劵。
在另一个实施例中,所述服务器还用于根据校对结果增加读者对应数量的读书积分;将所述内容片段标记为已校对;判断所述数字版电子书所有的内容片段是否都标记为已校对;若是,则监控预设时间内数字版电子书的阅读次数以及终端上传的校对结果的次数;判断所述修正次数是否小于阅读次数预设阈值,若是,则关闭读者的校对功能,所述数字版电子书为最终阅读版本。
在另一个实施例中,所述服务器还用于将所述最终阅读版本的内容片段与对应的已存储校对结果进行一一比较,判断两者是否一致;若是,则将上传所述校对结果的终端对应读者的读书积分标记为有效;否则,将上传所述校对结果的终端对应读者的读书积分标记为无效,并减去所述读者对应已有数量的读书积分。
如图8所示,在一个实施例中,提供了一种数字版电子书的获取装置,该装置包括如下模块:
扫描模块70,对纸质图书按页进行扫描,获得版式电子书。
拆分模块71,用于对对所述版式电子书的布局结构进行分析,将版式电子书的每一页按照文件类型划分为若干对象。
识别模块72,用于对所述对象分别采用对应的OCR识别方式进行文字识别获得流式电子书。
打包模块73,用于将所述版式电子书以及流式电子书进行压缩打包得到数字版电子书。
下面结合一个应用场景来说明下本发明,电子书终端为安装有电子书阅读器的手机,服务器为电子书商城服务器,其中电子书商城服务器包括电子书存储子系统、读者积分子系统以及校对结果存储子系统;
其中电子书存储系统中用于存储版式电子书以及流式电子书;读者积分子系统用于存储各个读者获得的读书积分;校对结果存储子系统,存储了电子书阅读终端每一次上传来的电子书校对结果,并将最新的校对结果公布出来方便读者阅读。
电子书阅读终端的电子书阅读器包含扫描版电子书模板、数字版电子书模块以及校对模块。电子书阅读器通过互联网可以从电子书服务器上下载电子书, 校对模块用于读者获取校对任务对电子书中出现的错误进行修正,并将校对结果上传至电子书商城服务器。电子书阅读终端还可从电子书商城服务器获得读书积分,该积分可用于兑换购书优惠劵。读者可以低于市场价从电子书商城购买图书。
电子书扫描设备将纸书逐页扫描获得多页版式电子书D,版式电子书D的每一页对应纸书的一页;对版式电子书D的每一页进行OCR识别获得流式版电子书S,具体步骤如下:
a)对版式电子书的每一页进行对象布局结构分析,从而将页面分割为一个或多个封闭的区域,用封闭的多边形顶点坐标描述该区域。
b)将每个区域标识为相应的对象类型,如文本、图片、表格,并进行OCR识别;
c)用结构化数据文件S记录区域与OCR识别结果对象的对应关系;
将D和S打包成数字版电子书K发布到电子书商城E;
读者R1通过终端的电子书阅读器A领取校对任务,电子书商城E后台系统分配数据文件S中的N页校对任务给读者R1,电子书阅读器A进入校对模式;
读者R1在电子书阅读器A上完成校对任务,修正校对任务中内容片段出现的错误,得到与N页图像格式电子书对应的流式内容F,F记录了与之对应的D的页编号,读者R1将校对后的结果F提交到电子书商城E,电子书商城E给读者增加M点积分;
读者R2通过电子书阅读器A登录电子书商城E同步数字版电子书K和对应的流式内容F,电子书阅读器A显示流式内容F,读者R2与原稿对照后发现流式电子书F中有内容错误,进入校对模式并修正错误,然后提交校对结果F’,如果F’不等于F,给R2增加N点积分;
在扫描版电子书D的所有页都完成校对后,电子书商城E跟踪读者的校对操作活跃度,一段时间内,如果执行校对操作的人次比上阅读流式版电子书F的人次小于某个阈值T,则认为校对质量达到了高质量的水平,则关闭读者的校对功能,并将读者的有效积分兑换为购书优惠券,以及颁发代表荣誉的等级虚拟勋章;一个内容片段可能被多个读者或同一个多读者多次校对,与最终结果不一致的校对操作获得惩罚性扣分,降低读者信用,并提高其购书价格。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种数字版电子书的校对方法,其特征在于,包括:
获取数字版电子书,将所述数字版电子书分解为若干内容片段;
生成所述内容片段对应的校对任务并发布,使得终端的读者获取所述校对任务,通过修正内容片段存在的错误内容来完成校对任务;
接收终端上传读者完成校对任务后得到的校对结果并存储;
将所述内容片段更新为校对结果并发布。
2.根据权利要求1所述的校对方法,其特征在于,在所述内容片段更新为校对结果并发布的步骤之后,还包括:
根据校对结果增加读者对应数量的读书积分。
3.根据权利要求1所述的方法,其特征在于,获取数字版电子图书的步骤之前,还包括:
对纸质图书按页进行扫描,获得版式电子书;
对所述版式电子书的布局结构进行分析,将版式电子书的每一页按照文件类型划分为若干对象;
对所述对象分别采用对应的OCR识别方式进行文字识别获得流式电子书;
将所述版式电子书以及流式电子书进行压缩打包得到数字版电子书。
4.根据权利要求2所述的方法,其特征在于,在将所述内容片段更新为校对结果并发布的步骤之后,所述方法还包括:
将所述内容片段标记为已校对;
判断所述数字版电子书所有的内容片段是否都标记为已校对;
若是,则监控预设时间内数字版电子书的阅读次数以及终端上传的校对结果的次数;
判断所述修正次数是否小于阅读次数预设阈值,若是,则关闭读者的校对功能,所述数字版电子书为最终阅读版本。
5.根据权利要求4所述的方法,其特征在于,在所述关闭读者的校对功能的步骤之后,还包括:
将所述最终阅读版本的内容片段与对应的已存储校对结果进行一一比较,判断两者是否一致;
若是,则将上传所述校对结果的终端对应读者的读书积分标记为有效;
否则,将上传所述校对结果的终端对应读者的读书积分标记为无效,并减去所述读者对应已有数量的读书积分。
6.一种数字版电子书的校对方法,其特征在于,包括:
从服务器获取校对任务,读者通过修正校对任务对应的内容片段存在的错误来完成校对任务;
上传读者完成所述校对任务获得的校对结果,使得所述服务器根据校对结果更新数字版电子书;
获取服务器根据校对结果为读者增加的读书积分,所述读书积分用于兑换购书优惠劵。
7.一种数字版电子书的校对系统,其特征在于,包括终端以及服务器;其中,所述服务器用于获取数字版电子书,将所述数字版电子书分解为若干内容片段;生成所述内容片段对应的校对任务并发布,使得终端的读者获取所述校对任务,通过修正内容片段存在的错误内容来完成校对任务;接收终端上传读者完成校对任务后得到的校对结果并存储;将所述内容片段更新为校对结果并发布;
所述终端用于从服务器获取校对任务,读者通过修正校对任务对应的内容片段存在的错误来完成校对任务;上传读者完成所述校对任务获得的校对结果,使得所述服务器根据校对结果更新数字版电子书;获取服务器根据校对结果为读者增加的读书积分,所述读书积分用于兑换购书优惠劵。
8.根据权利要求7所述的校对系统,其特征在于,所述服务器还用于根据校对结果增加读者对应数量的读书积分;将所述内容片段标记为已校对;判断所述数字版电子书所有的内容片段是否都标记为已校对;若是,则监控预设时间内数字版电子书的阅读次数以及终端上传的校对结果的次数;判断所述修正次数是否小于阅读次数预设阈值,若是,则关闭读者的校对功能,所述数字版电子书为最终阅读版本。
9.根据权利要求8所述的系统,其特征在于,所述服务器还用于将所述最终阅读版本的内容片段与对应的已存储校对结果进行一一比较,判断两者是否一致;若是,则将上传所述校对结果的终端对应读者的读书积分标记为有效;否则,将上传所述校对结果的终端对应读者的读书积分标记为无效,并减去所述读者对应已有数量的读书积分。
10.一种数字版电子书的获取装置,其特征在于,所述装置包括如下模块:
扫描模块,对纸质图书按页进行扫描,获得版式电子书;
拆分模块,用于对对所述版式电子书的布局结构进行分析,将版式电子书的每一页按照文件类型划分为若干对象;
识别模块,用于对所述对象分别采用对应的OCR识别方式进行文字识别获得流式电子书;
打包模块,用于将所述版式电子书以及流式电子书进行压缩打包得到数字版电子书。
CN201710042585.7A 2017-01-20 2017-01-20 数字版电子书的校对方法及系统 Pending CN106779488A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710042585.7A CN106779488A (zh) 2017-01-20 2017-01-20 数字版电子书的校对方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710042585.7A CN106779488A (zh) 2017-01-20 2017-01-20 数字版电子书的校对方法及系统

Publications (1)

Publication Number Publication Date
CN106779488A true CN106779488A (zh) 2017-05-31

Family

ID=58945080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710042585.7A Pending CN106779488A (zh) 2017-01-20 2017-01-20 数字版电子书的校对方法及系统

Country Status (1)

Country Link
CN (1) CN106779488A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108681811A (zh) * 2018-05-09 2018-10-19 北京慧听科技有限公司 一种去中心化的数据生态系统
CN110059186A (zh) * 2019-04-04 2019-07-26 上海申康医院发展中心 一种医学术语校对任务分配的方法
CN114881007A (zh) * 2022-07-12 2022-08-09 山东天成书业有限公司 一种数字版电子书的校对方法及系统
CN115082045A (zh) * 2022-08-22 2022-09-20 深圳译码阁科技有限公司 数据校对方法、装置、计算机设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890670A (zh) * 2012-09-10 2013-01-23 北京京东世纪贸易有限公司 用于在版式阅读和流式阅读方式之间切换的方法和系统
CN105718554A (zh) * 2016-01-19 2016-06-29 深圳市天朗时代科技有限公司 文档的协同转换方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890670A (zh) * 2012-09-10 2013-01-23 北京京东世纪贸易有限公司 用于在版式阅读和流式阅读方式之间切换的方法和系统
CN105718554A (zh) * 2016-01-19 2016-06-29 深圳市天朗时代科技有限公司 文档的协同转换方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108681811A (zh) * 2018-05-09 2018-10-19 北京慧听科技有限公司 一种去中心化的数据生态系统
CN108681811B (zh) * 2018-05-09 2022-10-18 北京慧听科技有限公司 一种去中心化的数据生态系统
CN110059186A (zh) * 2019-04-04 2019-07-26 上海申康医院发展中心 一种医学术语校对任务分配的方法
CN114881007A (zh) * 2022-07-12 2022-08-09 山东天成书业有限公司 一种数字版电子书的校对方法及系统
CN115082045A (zh) * 2022-08-22 2022-09-20 深圳译码阁科技有限公司 数据校对方法、装置、计算机设备和存储介质
CN115082045B (zh) * 2022-08-22 2023-01-03 深圳译码阁科技有限公司 数据校对方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN106779488A (zh) 数字版电子书的校对方法及系统
Maulani et al. Digital certificate authority with blockchain cybersecurity in education
CN110414512A (zh) 信用证审核终端
CN110334640A (zh) 一种票据审核方法及系统
CN110781650B (zh) 一种基于深度学习的裁判文书自动生成方法及系统
Tofan et al. Some implications of the development of E-commerce on EU tax regulations
US11928878B2 (en) System and method for domain aware document classification and information extraction from consumer documents
CN107844923A (zh) 一种erp管理系统及方法
CN113159796A (zh) 一种贸易合同验证方法及装置
CN110222010B (zh) 基于区块链的论文保存方法、设备及计算机可读存储介质
CN110246063A (zh) 一种指引案件审理的方法及装置
Najafi et al. Introduction of Supervision Pattern on financial Institution in Iran Capital Market with Risk-Based Approach
SHIRMOHAMMADI et al. Designing a model for customers to buy from smart stores in the days of Corona with an emphasis on artificial intelligence
Rodriguez et al. Legal Challenges in the New Digital Age
Hariri Digitalization of Intangible Cultural Heritage (ICH) Archives As Legal Protection of Intellectual Property Rights
CN107220227A (zh) 知识产权官方文件电子存档命名系统及方法
Kazempour et al. Developing the Financial Literacy Education Model in Iran using the Grounded Theory Approach
Dortaj et al. Designing a model for developing strategic and creative thinking at managers of National Iranian Oil Company based on mixed method approach
CN109241487A (zh) 一种基于期刊的线上服务方法及装置
Maleki et al. Lean Education-Essentials and Consequences
Schirripa Spagnolo et al. Smartphone sensors for stone lithography authentication
JP6844076B1 (ja) データ処理装置、データ処理方法及びプログラム
NOORIAN et al. Development a model of Human Resource Risks in The Field of Health and Treatment Using Systematic Review and Delphi Method
JAMEI et al. Investigating the Impact of Company Life Cycle on Corporate Social Responsibility with Emphasis on Financial Resources in Companies Listed on Tehran Stock Exchange
Ostadian Factors for Development of Government Fiqh in the Age of Islamic Revolution of Iran

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531