CN110298349A - 一种快速将纸质书内容转化为数字内容的方法与装置 - Google Patents
一种快速将纸质书内容转化为数字内容的方法与装置 Download PDFInfo
- Publication number
- CN110298349A CN110298349A CN201910518766.1A CN201910518766A CN110298349A CN 110298349 A CN110298349 A CN 110298349A CN 201910518766 A CN201910518766 A CN 201910518766A CN 110298349 A CN110298349 A CN 110298349A
- Authority
- CN
- China
- Prior art keywords
- page
- book
- content
- books
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Studio Devices (AREA)
Abstract
本发明提供一种快速将纸质书内容转化为数字内容的方法与装置,包括:用摄像头对书本快速翻页过程进行拍摄;获取书本中有用的图像数据;对书本内容数据进行倾斜纠正;若页码缺失,则进行再次翻页拍摄;用ocr技术获得全书数字版内容。本发明通过普通的手机摄像头,就能获取全书内容,改变了普通电子书转化需要一页页翻书和拍摄的动作,它能够快速将纸质书本的内容转化为数字版内容数据。速度快,效率高,准确度高。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种快速将纸质书内容转化为数字内容的方法与装置。
背景技术
在纸质书阅读过程中,经常会遇到需要把书中的内容进行电子保存的情况。如果通过专业的扫描仪,需要花费很多钱和时间。如果采用复印的方法,需要花费很多复印费和一页页翻书的时间。
采用手机照相的方式是比较直接的获得书本内容的方法。但是该过程也需要一页页整理和翻页,并不断的按拍摄键。
本发明采用高速摄像头或手机摄像头摄像的方法,对书本中的内容进行摄像。并人工手持书本,手指一页页松开一侧的书页,使之自然翻到另一边的快速翻页的方式。通过摄像头的切割和字符识别技术。迅速获得纸质书本的数字版内容数据。
发明内容
本发明提供了一种快速将纸质书内容转化为数字内容的方法与装置,用于快速将纸质的书本内容转化为数字版的内容。
本发明提供了一种快速将纸质书内容转化为数字内容的方法,主要包括以下步骤:
一种快速将纸质书内容转化为数字内容的方法,其特征在于,所述方法包括:
用高速摄像头对书本快速翻页过程进行拍摄,获得翻书视频;所述快速翻页过程主要是指用手或工具挤压书,使书页因为受到挤压力而能够迅速从书的一边翻到另一边;
获取翻书过程的视频图像数据;去除所述翻书视频图像中,书页处于书本中间位置的帧,获取书本内容数据;
对书本内容数据进行去重,获得书本每一页数据;
对所述书本每一页数据进行倾斜纠正;
根据书本每一页数据,获取页码,对页码进行排序;
若页码缺失,则进行再次翻页拍摄;
根据书本每一页数据,采用ocr字符识别技术,获得全书数字版内容。
进一步可选地,如上所述的方法中,所述用摄像头对书本快速翻页过程进行拍摄,主要包括:
通过高速摄像头进行拍摄,
所述快速翻页过程,包括通过手或其他工具,翻开书,书翻到预设的角度范围,使书展开一半,书面被挤成一定弧度;
顺序一页页松开书的一端,使书一页页翻向另一端;
重复若干次,使书内快速翻过的内容可以被摄像头拍摄到。
进一步可选地,如上所述的方法中,所述获取书本内容数据,主要包括:
对拍摄的翻页视频进行提取,并获取视频帧;
检测翻页页面处于中间位置的帧,对这些页面进行去除;所述中间位置是指,书在翻页过程中,页面正好处于垂直于书本的预设的角度,无法被摄像头拍摄到页面数据内容的位置。
进一步可选地,如上所述的方法中,所述对书本内容数据进行去重,获得书本每一页数据,主要包括:
计算页面内容相似度大于预设阈值的帧,保留书本内容最多的帧;
所述计算页面内容相似度大于预设阈值的帧是指,每一个书页被翻过的过程中,会被高速摄像头拍摄很多次,因为页面在动,每一次拍摄都能看到页面中的部分数据,数据的相似度越大,代表他们属于同一个页面的概率越大,计算相似度大于预设阈值的帧即可获得去重后的,书的每一个页面;
对书本页面内容图片,进行聚类;把具有相似内容的书本内容图片聚合在一起,然后在里面识别字符内容所占面积最大的一张图片;
该图片的文字信息最多,选为目标图片;该目标图片记录了书本中的一个页面的数据。
进一步可选地,如上所述的方法中,所述对书本内容数据进行倾斜纠正,主要包括:
对目标图片进行图像倾斜矫正,采用改进式Hough变换算法,使图片中倾斜的文字矫正为正常的文字。
进一步可选地,如上所述的方法中,所述若页码缺失,则进行再次翻页拍摄,主要包括:
对书本中的页码进行识别;
获取页面中与页面聚集内容具有预设距离的数字;
对该数字进行识别,获得页码;
根据所述页码,对书本内容进行排序。
进一步可选地,如上所述的方法中,所述对书本内容进行排序,主要包括:
当缺少页码时;
提醒用户,该页面缺失,需要针对目标缺失数据,再对着摄像头,翻一次书。
进一步可选地,如上所述的方法中,所述用ocr字符识别技术获得全书数字版内容,主要包括:
采用ocr算法或相关软件工具,对通过手动快速翻页得到的书本摄像图片内容,进行文字识别,获得纸质书本的ocr文字内容。
本发明提供了一种快速将纸质书内容转化为数字内容的装置,所述装置包括:
拍摄模块,用于通过高速摄像头和快速翻页动作,对书本内容进行拍摄;
获取模块,用于去除无用的数据,计算页面内容相似度大于预设阈值的帧,保留信息量最大的帧,获取书本翻页过程中的最有用的数据;
图像倾斜矫正模块,用于使倾斜的文字矫正为正常的文字;
页码识别排序与纠错模块,用于识别书本页码,根据页码进行排序,并对缺失页码进行提示;
字符识别模块,用于通过ocr技术获取书本的数字版数据。
本发明实施例提供的技术方案可以包括以下有益效果:
本发明通过高速摄像头或普通的手机摄像头,就能获取全书内容,免去了一页页翻书和拍摄的动作,能够快速将纸质书本的内容转化为数字版内容数据,速度快,效率高,准确度高。
附图说明
图1为本发明的快速将纸质书内容转化为数字内容的方法实施例的流程图;
图2为本发明的快速将纸质书内容转化为数字内容的装置系统实施例的结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
图1为本发明的一种快速将纸质书内容转化为数字内容的方法的流程图。如图1所示,本实施例一种快速将纸质书内容转化为数字内容的方法,具体可以包括如下步骤:
步骤100,通过具有高速摄像头的设备,对快速翻书过程进行拍摄。优选的,高速摄像头可以采用具有高速摄像头的手机。只有包括,固定手机,并打开摄像头,开启摄像模式,开启高速摄像模式。很多手机都有高速摄像的功能,例如iphone 、华为mate、三星galaxy等 ,手机高速摄像模式能够拍摄慢动作,让书的翻页动作“变慢”。
步骤101,通过手工或其他工具,翻开书,使书翻开到一个阈值角度范围内,例如翻开90度,使书展开一半,并让两侧书面都挤出一定幅度,顺序一页页松开书的一端,使书一页页迅速翻向另一边。重复若干次。以使某些没有被翻到的页面在重复的过程中,被翻到。本操作的目的在于通过挤压翻页,让书的内容,可以被摄像头拍到即可。所有能够达到以上目的的挤压方法或者翻书变换方法,都可以被采用。
步骤102,获取书的翻页视频。对拍摄的翻页视频进行提取,并获取视频帧,变成一张张可以被处理的图片。
步骤103,检测翻页页面处于中间位置的帧,对这些页面进行去除。在翻页过程中,页面从左到右翻过,一定会经过中间位置,因为页面处于翻开的书的左边两边的中间,因此看不到页面内容。将这些处于中间位置,看不到书本中内容的帧,去除。免去处理无用的数据。
步骤104,页面内容相似度大于某阈值的帧,保留信息最大的帧。因为在翻页过程中,一个页面被翻从左到右翻过去的过程中,高速摄像头依然会多次拍摄到该页面。因此,获得的很多页面数据是同一个页面的重复拍摄内容。因此,页面翻过的过程中,面向摄像头,更加垂直于摄像头的角度的照片,角度会最好,更容易被后续流程处理。因此,需要对页面进行相似度计算,对页面内容相似的那些页面,进行去重,挑选显示的书本页面内容最大的一张。
相似度计算方法,可以采用图像页面内容的聚类方法。把具有相似内容的图片聚合在一起,即进行去重。然后在里面识别字符内容所占面积最大的一张图片。视为该图片的文字信息最多。选为目标图片。
步骤105,对页面进行图像倾斜矫正。采用改进式Hough变换算法。使倾斜的文字矫正为正确的文字。该算法转换效果好,效率高。
步骤106,识别页码,用页码进行排序。对书本中的页码进行识别。获取书本页面内容中,与页面正文内容有一定距离的数字。并对该数字进行识别。获取页码,对书本内容根据页码进行排序。
步骤107,当缺少页码时,说明还有某些页面没有翻到。或者书中某些页面内容与其他页面的边缘大于某个阈值,说明该页面拍摄角度错误,导致有些文本遗漏。因此系统应该提醒用户,该页面缺失,可以再针对那几页缺失的数据,再对着摄像头,翻一次书。
步骤108,进行ocr文字识别, 获得整本书的数字内容。采用ocr算法及软件工具,进行数据转化。并存储识别后的书本文字数据。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (9)
1.一种快速将纸质书内容转化为数字内容的方法,其特征在于,所述方法包括:
用高速摄像头对书本快速翻页过程进行拍摄,获得翻书视频;所述快速翻页过程主要是指用手或工具挤压书,使书页因为受到挤压力而能够迅速从书的一边翻到另一边;
获取翻书过程的视频图像数据;去除所述翻书视频图像中,书页处于书本中间位置的帧,获取书本内容数据;
对书本内容数据进行去重,获得书本每一页数据;
对所述书本每一页数据进行倾斜纠正;
根据书本每一页数据,获取页码,对页码进行排序;
若页码缺失,则进行再次翻页拍摄;
根据书本每一页数据,采用ocr字符识别技术,获得全书数字版内容。
2.根据权利要求1所述的方法,其中,所述用摄像头对书本快速翻页过程进行拍摄,主要包括:
通过高速摄像头进行拍摄,
所述快速翻页过程,包括通过手或其他工具,翻开书,书翻到预设的角度范围,使书展开一半,书面被挤成一定弧度;
顺序一页页松开书的一端,使书一页页翻向另一端;
重复若干次,使书内快速翻过的内容可以被摄像头拍摄到。
3.根据权利要求1所述的方法,其中,所述获取书本内容数据,主要包括:
对拍摄的翻页视频进行提取,并获取视频帧;
检测翻页页面处于中间位置的帧,对这些页面进行去除;所述中间位置是指,书在翻页过程中,页面正好处于垂直于书本的预设的角度,无法被摄像头拍摄到页面数据内容的位置。
4.根据权利要求1所述的方法,其中,所述对书本内容数据进行去重,获得书本每一页数据,主要包括:
计算页面内容相似度大于预设阈值的帧,保留书本内容最多的帧;
所述计算页面内容相似度大于预设阈值的帧是指,每一个书页被翻过的过程中,会被高速摄像头拍摄很多次,因为页面在动,每一次拍摄都能看到页面中的部分数据,数据的相似度越大,代表他们属于同一个页面的概率越大,计算相似度大于预设阈值的帧即可获得去重后的,书的每一个页面;
对书本页面内容图片,进行聚类;把具有相似内容的书本内容图片聚合在一起,然后在里面识别字符内容所占面积最大的一张图片;
该图片的文字信息最多,选为目标图片;该目标图片记录了书本中的一个页面的数据。
5.根据权利要求1所述的方法,其中,所述对所述书本每一页数据进行倾斜纠正,主要包括:
对目标图片进行图像倾斜矫正,采用改进式Hough变换算法,使图片中倾斜的文字矫正为正常的文字。
6.根据权利要求1所述的方法,其中,所述若页码缺失,则进行再次翻页拍摄,主要包括:
对书本中的页码进行识别;
获取页面中与页面聚集内容具有预设距离的数字;
对该数字进行识别,获得页码;
根据所述页码,对书本内容进行排序。
7.根据权利要求6所述的方法,其中,所述对书本内容进行排序,主要包括:
当缺少页码时;
提醒用户,该页面缺失,需要针对目标缺失数据,再对着摄像头,翻一次书。
8.根据权利要求1所述的方法,其中,所述用ocr字符识别技术获得全书数字版内容,主要包括:
采用ocr算法或相关软件工具,对通过手动快速翻页得到的书本摄像图片内容,进行文字识别,获得纸质书本的ocr文字内容。
9.一种快速将纸质书内容转化为数字内容的装置,其特征在于,所述系统包括:
拍摄模块,用于通过高速摄像头和快速翻页动作,对书本内容进行拍摄;
获取模块,用于去除无用的数据,计算页面内容相似度大于预设阈值的帧,保留信息量最大的帧,获取书本翻页过程中的最有用的数据;
图像倾斜矫正模块,用于使倾斜的文字矫正为正常的文字;
页码识别排序与纠错模块,用于识别书本页码,根据页码进行排序,并对缺失页码进行提示;
字符识别模块,用于通过ocr技术获取书本的数字版数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910518766.1A CN110298349A (zh) | 2019-06-15 | 2019-06-15 | 一种快速将纸质书内容转化为数字内容的方法与装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910518766.1A CN110298349A (zh) | 2019-06-15 | 2019-06-15 | 一种快速将纸质书内容转化为数字内容的方法与装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110298349A true CN110298349A (zh) | 2019-10-01 |
Family
ID=68028084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910518766.1A Pending CN110298349A (zh) | 2019-06-15 | 2019-06-15 | 一种快速将纸质书内容转化为数字内容的方法与装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110298349A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110942054A (zh) * | 2019-12-30 | 2020-03-31 | 福建天晴数码有限公司 | 页面内容识别方法 |
CN111358145A (zh) * | 2020-02-28 | 2020-07-03 | 苏州承儒信息科技有限公司 | 一种用于行走教育的智能书包及其工作方法 |
CN111556251A (zh) * | 2020-05-20 | 2020-08-18 | 深圳前海微众银行股份有限公司 | 电子书生成方法、设备及介质 |
CN111611986A (zh) * | 2020-05-11 | 2020-09-01 | 上海翎腾智能科技有限公司 | 一种基于手指交互的焦点文本提取和识别方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2910601Y (zh) * | 2006-01-24 | 2007-06-13 | 谭全福 | 有方便准确翻页设置的书及其带有翻页工具的书 |
CN101179639A (zh) * | 2006-11-07 | 2008-05-14 | 汉王科技股份有限公司 | 可自动翻页的数码照相装置 |
CN101609612A (zh) * | 2008-06-17 | 2009-12-23 | 上海市格致中学 | 多功能读书机 |
CN103179315A (zh) * | 2011-12-20 | 2013-06-26 | 长沙鹏阳信息技术有限公司 | 连续视频图像处理的纸质文档扫描仪及扫描方法 |
US10074920B2 (en) * | 2013-04-25 | 2018-09-11 | Intel Corporation | Interconnect cable with edge finger connector |
CN109729231A (zh) * | 2018-12-17 | 2019-05-07 | 中国科学院深圳先进技术研究院 | 一种文件扫描方法、装置及设备 |
-
2019
- 2019-06-15 CN CN201910518766.1A patent/CN110298349A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2910601Y (zh) * | 2006-01-24 | 2007-06-13 | 谭全福 | 有方便准确翻页设置的书及其带有翻页工具的书 |
CN101179639A (zh) * | 2006-11-07 | 2008-05-14 | 汉王科技股份有限公司 | 可自动翻页的数码照相装置 |
CN101609612A (zh) * | 2008-06-17 | 2009-12-23 | 上海市格致中学 | 多功能读书机 |
CN103179315A (zh) * | 2011-12-20 | 2013-06-26 | 长沙鹏阳信息技术有限公司 | 连续视频图像处理的纸质文档扫描仪及扫描方法 |
US10074920B2 (en) * | 2013-04-25 | 2018-09-11 | Intel Corporation | Interconnect cable with edge finger connector |
CN109729231A (zh) * | 2018-12-17 | 2019-05-07 | 中国科学院深圳先进技术研究院 | 一种文件扫描方法、装置及设备 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110942054A (zh) * | 2019-12-30 | 2020-03-31 | 福建天晴数码有限公司 | 页面内容识别方法 |
CN111358145A (zh) * | 2020-02-28 | 2020-07-03 | 苏州承儒信息科技有限公司 | 一种用于行走教育的智能书包及其工作方法 |
CN111611986A (zh) * | 2020-05-11 | 2020-09-01 | 上海翎腾智能科技有限公司 | 一种基于手指交互的焦点文本提取和识别方法及系统 |
CN111611986B (zh) * | 2020-05-11 | 2023-06-09 | 上海翎腾智能科技有限公司 | 一种基于手指交互的焦点文本提取和识别方法及系统 |
CN111556251A (zh) * | 2020-05-20 | 2020-08-18 | 深圳前海微众银行股份有限公司 | 电子书生成方法、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110298349A (zh) | 一种快速将纸质书内容转化为数字内容的方法与装置 | |
Burie et al. | ICDAR2015 competition on smartphone document capture and OCR (SmartDoc) | |
US10671662B2 (en) | Method and system for analyzing an image generated by at least one camera | |
RU2668717C1 (ru) | Генерация разметки изображений документов для обучающей выборки | |
JP6856091B2 (ja) | 10指指紋カード入力装置、10指指紋カード入力方法、及び記憶媒体 | |
Erol et al. | HOTPAPER: multimedia interaction with paper using mobile phones | |
WO2010101186A1 (ja) | 画像検索方法、画像検索プログラム及び画像登録方法 | |
Anwar et al. | Image deblurring with a class-specific prior | |
US8873863B2 (en) | System and method for fingerprinting for comics | |
US7924314B2 (en) | Bulk image gathering system and method | |
US20190155883A1 (en) | Apparatus, method and computer program product for recovering editable slide | |
CN109034002A (zh) | 实体书检测方法及装置 | |
WO2014082551A1 (zh) | 获取纸质笔记本中内容的方法及装置 | |
CN106649629A (zh) | 一种关联书本与电子资源的系统 | |
CN110751071A (zh) | 人脸识别方法及装置、存储介质、计算设备 | |
JP2008117271A (ja) | デジタル画像の被写体認識装置、プログラム、および記録媒体 | |
CN110209759B (zh) | 自动识别书页的方法及装置 | |
US20220309275A1 (en) | Extraction of segmentation masks for documents within captured image | |
Driscoll et al. | The airplane information management system: An integrated real-time flight-deck control system | |
Kumar et al. | Mobile video capture of multi-page documents | |
Chazalon et al. | A semi-automatic groundtruthing tool for mobile-captured document segmentation | |
KR101800975B1 (ko) | 필기체가 인식되어 생성된 전자문서의 공유 방법 및 그 장치 | |
CN111144288A (zh) | 一种图像处理方法、装置及电子设备 | |
JP2020149668A5 (zh) | ||
Kim et al. | Design of smart portable rehabilitation exoskeletal device for upper limb |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191001 |