CN105095894A - 非接触型图书扫描设备 - Google Patents

非接触型图书扫描设备 Download PDF

Info

Publication number
CN105095894A
CN105095894A CN201510477590.1A CN201510477590A CN105095894A CN 105095894 A CN105095894 A CN 105095894A CN 201510477590 A CN201510477590 A CN 201510477590A CN 105095894 A CN105095894 A CN 105095894A
Authority
CN
China
Prior art keywords
dimensional
books
scanned
structured light
scanning equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510477590.1A
Other languages
English (en)
Inventor
刘海川
廖文灯
潘敬华
林进发
季明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PANOWIN TECHNOLOGIES Co Ltd
Original Assignee
PANOWIN TECHNOLOGIES Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PANOWIN TECHNOLOGIES Co Ltd filed Critical PANOWIN TECHNOLOGIES Co Ltd
Priority to CN201510477590.1A priority Critical patent/CN105095894A/zh
Publication of CN105095894A publication Critical patent/CN105095894A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Input (AREA)

Abstract

本公开提供一种非接触型图书扫描设备。该非接触型图书扫描设备包括:一深度信息采集组件,面向一待扫描图书以采集其深度信息;一色彩信息采集组件,面向所述待扫描图书以采集其色彩信息;以及,一服务器终端,接收所述深度信息采集组件采集的深度信息以及所述色彩信息采集组件采集的色彩信息;所述服务器终端包括:一三维建模模块,用于基于接收的所述深度信息建构所述待扫描图书的三维网格模型;以及,一二维平展模块,用于基于所述待扫描图书的三维网格模型以及接收的所述色彩信息恢复所述待扫描图书的二维平展图像。本公开可以提升扫描效果、提高图像识别度下降以及改善用户阅读体验。

Description

非接触型图书扫描设备
技术领域
本公开涉及文件扫描技术领域,尤其涉及一种用于图书影印、图书电子化存档、纸质文字图像影印、古藉整理、其他非平整表面印刷品影印等场景的非接触型图书扫描设备。
背景技术
扫描设备是将图书等纸质文件的图像信息输入计算机进行数字化存储的重要工具。例如,图书扫描设备利用摄像技术将已有的纸质图书的每一页拍摄后数字化保存,以满足未来直接阅读、再版影印、文字图像提取等可能用途。扫描设备包括接触型和非接触型扫描设备;由于接触型扫描设备中需要将被扫描对象压放在扫描设备的玻璃平台上进行扫描,可能会对图书造成损伤,现有技术中大量图书扫描设备为非接触型扫描设备。非接触型图书扫描设备一般有手持式装置和固定式装置两种选择。
手持式装置只需要有数字摄像功能的设备,如手机、数码相机即可。使用者手持这些设备,将图书翻到需要扫描的页面,手动将设备维持在某个位置,按下快门,即可记录保存当前页面的图像。手持式装置取材容易,实现简单。但相对于固定式装置,由于拍摄每一页时相机的位置,光照条件都不确定的,所以拍摄的每一页图像的位置、角度、明暗都可能存在差异。另外,手动式装置取景拍摄的速度也不如后者。
固定式装置中将书架、摄像头以及照明灯通过底座和支架相对固定。使用者将书置于书架上,翻到需要扫描的页,按下底座上的扫描按钮,支架上的摄像头和照明灯装置即可以把拍摄保存当前页面的图像。固定式装置解决了手持式装置环境因素不确定的问题,相对于前者,其拍摄质量和速度都有所提高。
然而,现有的非接触型图书扫描设备,不论是手持式还是固定式,都是采用二维摄像技术来采集书页的平面图像。如图1所示,由于本身的结构特点,图书在打开状态下,依据其封装、厚薄、纸质的不同,书页或多或少都会有所弯曲。这种弯曲状态下拍摄出来的二维图像也一定存在扭曲,进而造成扫描效果不好、图像识别度下降、用户阅读体验不佳。
发明内容
针对现有技术中的部分或者全部问题,本公开提供一种扫描效果更好的非接触型图书扫描设备,从而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或多个问题。
根据本公开实施例的一方面,提供一种非接触型图书扫描设备,包括:
一深度信息采集组件,面向一待扫描图书以采集其深度信息;
一色彩信息采集组件,面向所述待扫描图书以采集其色彩信息;以及,
一服务器终端,接收所述深度信息采集组件采集的深度信息以及所述色彩信息采集组件采集的色彩信息;所述服务器终端包括:
一三维建模模块,用于基于接收的所述深度信息建构所述待扫描图书的三维网格模型;以及,
一二维平展模块,用于基于所述待扫描图书的三维网格模型以及接收的所述色彩信息恢复所述待扫描图书的二维平展图像。
本公开的一种示例性实施例中,所述深度信息采集组件包括:
结构光深度摄像组件、TOF深度摄像组件、基于三维激光扫描的深度摄像组件、Kinect摄像组件或者RealSense摄像组件中的一种或多种。
本公开的一种示例性实施例中,所述深度信息采集组件为结构光深度摄像组件,其包括:
一结构光发射器,用于投射特定模式的结构光至所述待扫描图书,所述结构光被所述待扫描图书的表面调制为一结构光三维图像;以及,
一结构光摄像机,用于对所述结构光三维图像进行采样,获取结构光被调制后的纹理图像。
本公开的一种示例性实施例中,所述特定模式的结构光为根据格雷灰度编码策略生成的投影光栅。
本公开的一种示例性实施例中,所述建构所述待扫描图书的三维网格模型包括:
结构光摄像机标定步骤,以获取所述结构光摄像机的内外部参数;
结构光发射器标定步骤,以获取所述结构光发射器的内外部参数;
三维测距步骤,从所述结构光被调制后的纹理图像确定特征点信息并结合所述结构光摄像机和结构光发射器的内外部参数输出三维点云;以及,
三维重构步骤,对所述三维点云进行处理以生成一三维网格模型。
本公开的一种示例性实施例中,所述结构光摄像机标定步骤中采用张正友棋盘格算法。
本公开的一种示例性实施例中,所述结构光摄像机标定步骤中采用角点提取算法。
本公开的一种示例性实施例中,所述三维测距步骤包括:
根据所述结构光被调制后的纹理图像边缘信息、图像二值化以及图案结构信息确定所述特征点对应的投影条纹在投影图案参考坐标系中的位置;
根据特征点信息、所述结构光摄像机和结构光发射器的内外部参数,通过三角测距原理计算各像素点三维空间坐标;以及
计算所有所述特征点的三维数据并输出所述三维点云。
本公开的一种示例性实施例中,所述三维测距步骤中对所述三维点云通过数据对齐、数据排序、数据精简以及曲面重建算法进行处理,生成所述三维网格模型。
本公开的一种示例性实施例中,所述恢复所述待扫描图书的二维平展图像包括:
点云降采样步骤,用于通过降采样以降低后续运算涉及到的三维点云数量;
粒子系统建模步骤,将降采样后的所述三维网格模型模拟为基于牛顿经典力学原理的粒子系统模型;
二维平展步骤,基于所述粒子系统模型将所述三维网格模型还原至二维平面;
图像恢复步骤,将所述色彩信息对应至所述二维平面,得到所述待扫描图书的二维平展图像。
本公开的一种示例性实施例中,所述点云降采样步骤中采用空间单元格算法。
本公开的一种示例性实施例中,所述粒子系统建模步骤中将三维网格模型的每个顶点模拟为一个粒子,粒子之间通过虚拟弹簧连接。
本公开的一种示例性实施例中,所述二维平展步骤中,模拟施加外力使所述三维网格模型趋于二维平面网格,直至所述粒子系统模型内部能量最低。
本公开的一种示例性实施例中,所述图像恢复中,计算所述色彩信息图像中各像素点的三维空间坐标并将其映射到所述二维平展步骤中得到的二维平面网格。
本公开的一种示例性实施例中,所述三维建模模块及/或二维平展模块中的部分步骤或全部步骤通过软件方式实现或通过硬件方式实现。
本公开的一种示例性实施例中,所述色彩信息采集组件为RGB色彩相机。
本公开的一种示例性实施例中,所述非接触型图书扫描设备还包括:
一自动翻页机构,用于在所述非接触型图书扫描设备对所述图书的当前页面扫描完成后,自动将所述图书翻至其他页面。
本公开的一种示例性实施例中,所述其他页面为所述当前页面的下一页。
本公开示例性实施例所提供的非接触型图书扫描设备中,同时采集待扫描图书的深度信息和色彩信息,并根据采集的深度信息和色彩信息建构所述待扫描图书的三维网格模型以及进行二维平展恢复待扫描图书的二维平展图像,进而可以有效改进扫描过程中因为待扫描图书弯曲导致的图像扭曲变形引起的识别度下降的问题,从而可以提升扫描效果、提高图像识别度以及改善用户阅读体验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为待扫描图书页面弯曲结构图。
图2为本公开示例性实施例中一种非接触型图书扫描设备的原理示意图。
图3为本公开示例性实施例中一种非接触型图书扫描设备的立体结构示意图。
图4为图3非接触型图书扫描设备的仰视结构示意图。
图5为本公开示例性实施例中三维建模过程流程示意图。
图6为本公开示例性实施例中二维平展过程流程示意图。
图7为本公开示例性实施例中有限元模型示意图。
图8为本公开示例性实施例中图像恢复过程示意图。
图9为本公开示例性实施例中深度结构光摄像机采集到的三维网格模型。
图10为对图9中三维网格模型进行二维平展还原后的数据图。
图11为对图10中图像进行图像恢复后的效果图。
具体实施方式
现在将参考附图更全面地描述示例性实施例。然而,示例性实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施方式;相反,提供这些实施方式使得本公开将全面和完整,并将示例性实施例的构思全面地传达给本领域的技术人员。在图中,相同的附图标记表示相同或类似的结构,因而将省略它们的详细描述。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。
本示例性实施例中提供了一种非接触型图书扫描设备,用于图书影印、图书电子化存档、纸质文字图像影印、古藉整理、其他非平整表面印刷品影印等场景。该非接触型图书扫描设备为固定式装置;但本领域技术人员容易理解的是,在本公开的其他示例性实施例中,该图书扫描设备也可能为手持式装置。参考图2中所示,该非接触型图书扫描设备主要包括一深度信息采集组件、一色彩信息采集组件以及一服务器终端。
上述深度信息采集组件面向一待扫描图书以采集其深度信息。深度信息采集是指信息采集过程中不仅仅采集到待扫描图书的二维平面图像,更可以采集到待扫描图书距离信息采集组件的深度数据。本示例性实施例中,所述深度信息采集组件可以包括结构光深度摄像组件、TOF深度摄像组件、基于三维激光扫描的深度摄像组件、Kinect摄像组件以及RealSense摄像组件等深度信息获取组件中的一种或多种。举例而言:
结构光深度摄像技术是一种利用辅助的结构光照明获取待扫描对象成像的技术,其技术方案是投影一个载频光栅图案到待扫描对象表面,利用成像设备从另一角度记录受待扫描对象表面的高度调制的变形光栅图像,再从获取的变形光栅图中数字解调重建出待扫描对象的三维数字图像信息。由于结构光深度摄像技术采用非接触面扫描机制,具有扫描速度快、精度高、稳定性好、不受环境影响、操作简单等特点,广泛应用于机器视觉、自动化控制加工、工业自动检测、产品质量控制、实物仿形、生物医学、三维动画和影视特技制作等领域。
TOF(TimeofFlight,飞行时间)深度摄像技术的原理是通过给待扫描对象连续发送光脉冲,然后利用传感器接收从待扫描对象返回的光信息,通过探测光脉冲的飞行时间来得到待扫描对象的深度信息。TOF深度摄像组件主要由光源、光学部件、传感器、控制电路以及处理电路等部分组成,TOF深度摄像组件通过对出射光、反射光进行探测来获取待扫描对象的深度信息。
基于三维激光扫描的深度摄像技术主要用途是创建待扫描对象几何表面点云,进而插补成待扫描对象表面形状。由于其不能同时获取二维平面图形,只能获得深度信息,因此一般用于测绘等领域,具体技术包括时差测距,三角测距等。
Kinect摄像组件是微软公司推出的体感交互设备,其获取深度信息的原理不同于上述结构光深度摄像技术或TOF深度摄像技术,而是采用光编码(LightCoding)技术。例如,通过红外线发射器向环境中发射出具有高度随机性的“激光散斑”(LaserSpeckle),对环境形成立体的“光编码”,再通过红外线接收器采集反射光得到红外图像,再根据Kinect的原始参数进行计算即可得到待扫描对象的深度信息。
RealSense摄像组件是Intel公司推出的“实感”交互设备,其集成了3D深度和2D镜头模块设备,能够赋予设备以类似于人眼的视觉深度。借助英特尔RealSense实感技术,人们手中的电脑、平板电脑等计算设备可实现手势控制、头部控制、人脸识别、3D扫描、景深识别、语音控制等功能。RealSense最核心的部分就是可记录三维信息的摄像头,利用RealSense设备及原始参数计算即可得到待扫描对象的深度信息。
上述色彩信息采集组件面向所述待扫描图书以采集其色彩信息。为了全面记录待扫描图书的内容,本示例性实施例中所述色彩信息采集组件可以为RGB色彩相机。但在本公开的其他示例性实施例中,该色彩信息采集组件也可能为灰度相机或其他色彩通道的相机。此外,深度信息采集组件和所述色彩信息采集组件可以集成在一起,也可以分别为各自独立的组件,本示例性实施例中对此不做特殊限定。
上述服务器终端接收所述深度信息采集组件采集的深度信息以及所述色彩信息采集组件采集的色彩信息;本示例性实施例中所述服务器终端可以为计算机或其他具备处理功能的终端。所述服务器终端可以包括一三维建模模块以及一二维平展模块。其中,三维建模模块用于基于接收的所述深度信息建构所述待扫描图书的三维网格模型。二维平展模块用于基于所述待扫描图书的三维网格模型以及接收的所述色彩信息恢复所述待扫描图书的二维平展图像。
下面结合图3以及图4,对本示例性实施例中的非接触型图书扫描设备进行进一步的说明。
参考图3中所示,本示例性实施例中的非接触型图书扫描设备主要包括非接触型图书扫描设备的核心部分即扫描机构1,用于实现快速扫描功能作用。除扫描机构1之外,非接触型图书扫描设备还可以包括:扫描机构调整按钮2,按下后进入调节状态,即可对扫描机构1的面向方向进行调整,松开后即锁定扫描结构1。上支撑机构3和下支撑机构6之间活动连接,可以通过高度调整按钮4调整上支撑机构3的高度,进而调整扫描结构1的高度。例如,调整按钮4可以包括上调整按钮和下调整按钮,分别设置在上支撑机构3和下支撑机构6之间的连接部位的左右两侧,按下后可以分别升高以及降低扫描机构1的高度。下支撑机构6和底座之间稳固结合,保证扫描过程的稳定性和高效性。底座主要用于承载上述部件以及待扫描图书。例如,底座上设置有橡胶防滑固定部位7,可以保证图书稳定准确的放到扫描区域而不滑动,提高扫描准确性和操作稳定性。在橡胶防滑固定部位7中部设置有图书中心摆放槽8,可提示使用者摆放位置以及保证使用过程中的稳定性。图书摆放台9主要实现支脚、摆放、操作等功能。在底座的左右两侧分别设置有扫描操作按钮10,例如,左边为开启键,右边为扫描键。在底座底部还可以设置底座防滑胶条11,用于避免非接触型图书扫描设备的滑动。此外,该非接触型图书扫描设备还可以包括一与扫描机构1通信连接的上述服务器终端(图中未示出)。
参考图4中所示,为图3中非接触型图书扫描设备的仰视图,可以看出,其中扫描机构1主要包括一RGB相机12,一结构光摄像机13以及一结构光发射器14。其中,结构光发射器14用于投射特定模式的结构光至所述待扫描图书,所述结构光被所述待扫描图书的表面调制为一结构光三维图像。结构光摄像机13用于对所述结构光三维图像进行采样,获取结构光被调制后的纹理图像。例如,按下启动键启动非接触型图书扫描设备后,将图书放在图书摆放台9上,通过图书中心摆放槽8确定扫描位置;通过调整按钮4对上支撑机构3以及扫描机构1的高度进行调整,使扫描机构1达到最佳高度位置;通过扫描机构调整按钮2对扫描机构1的面向方向进行旋转,使其与待扫描图书的中心对齐,达最佳扫描效果。按下扫描键,即可完成一次的图书页面的扫描工作。其中,RGB相机12以及结构光摄像机13在采集图像信息后,发送至服务器终端的三维建模模块以及二维平展模块进行三维建模算法和二维平整算法,从而得到扭曲矫正后的二维平展图像。在当前页面扫描完成后,手动翻页重复上述操作动作,即可完成完成下一页面的扫描工作。扫描得到的图像信息以可以以PDF、TIFF等格式存储于所述服务器终端。
如图4中所示,本示例性实施例中,所述建构所述待扫描图书的三维网格模型主要包括结构光摄像机标定步骤、结构光发射器标定步骤、三维测距步骤以及三维重构步骤。详细而言:
结构光摄像机标定步骤主要用于获取所述结构光摄像机的内外部参数,例如包括结构光摄像机的焦距、光心、畸变参数、旋转矩阵和平移矩阵等。本示例性实施例中,结构光摄像机标定步骤中可以采用张正友棋盘格算法。举例而言:
1)若不考虑结构光摄像机畸变,使用线性方法对小孔成像结构光摄像机模型进行标定和参数估计,需要计算的参数包括图像成像中心坐标u0,v0,横向和纵向焦距fx,fy,旋转矩阵Rc,平移矩阵Tc
2)若考虑畸变影响,则可以利用前面求得的参数线性求解畸变参数kc1,kc2,pc1,pc2,其中kc1,kc2为径向畸变系数,pc1,pc2为切向畸变系数。
3)用非线性方法优化全部参数。
结构光发射器标定步骤主要用于获取所述结构光发射器的内外部参数;在结构光发射器标定过程中,结构光发射器和结构光摄像机组成相对位置固定的距离传感器模型。本示例性实施例中,结构光摄像机标定步骤中可以采用Jean-YvesBouguet的角点提取算法。举例而言:
1)根据结构光摄像机参数计算标定板上成像点在结构光摄像机坐标系中的坐标Mc
2)对于每幅图像,计算单应性矩阵Hi,m=HiMc
3)通过单应性矩阵Hi构造Vb=0,计算矩阵其中Kp是结构光发射器内参矩阵。
4)从矩阵B中提取结构光发射器内部参数,得到Kp
5)通过Kp和矩阵Hi,计算结构光发射器外部参数Rp和Tp
6)求解成像畸变系数kp1,kp2,pp1,pp2
三维测距步骤主要用于从所述结构光被调制后的纹理图像确定特征点信息并结合所述结构光摄像机和结构光发射器的内外部参数输出三维点云。本示例性实施例中,三维测距步骤可以包括:
1)根据格雷码灰度编码策略生成投影光栅图案,通过结构光发射器投射到待扫描图书的表面,被待扫描图书的表面调制为一结构光三维图像。
2)结构光摄像机用于对所述结构光三维图像进行采样,获取结构光被调制后的纹理灰度图像。
3)根据灰度图像的边缘信息、图像二值化以及图案结构信息等数据确定特征点对应的投影条纹在投影图案参考坐标系中的位置。
4)根据特征点信息、结构光摄像机和结构光发射器的内外部参数,通过三角测距原理计算各像素点三维空间坐标。
5)计算所有所述特征点的三维数据并输出所述三维点云。
三维重构步骤用于对所述三维点云进行处理以生成一三维网格模型。本示例性实施例中,所述三维测距步骤中主要对所述三维点云通过数据对齐、数据排序、数据精简以及曲面重建算法等算法进行处理,生成所述三维网格模型。
如图5中所示,本示例性实施例中,所述恢复所述待扫描图书的二维平展图像包括点云降采样步骤、粒子系统建模步骤、二维平展步骤以及图像恢复步骤。详细而言:
点云降采样步骤主要用于通过降采样以降低后续运算涉及到的三维点云数量,进而降低计算复杂度,保证扫描实时性。一般三维重构得到的点云数据量较大(10万个点以上),导致二维平展算法实时性较差。测试表明约1000个数据点就可以得到较好平展效果。本示例性实施例中,点云降采样步骤中可以采用空间单元格算法。举例而言:
将整个测量点云形成一个包围盒,在X、Y、Z方向上按照一定间隔分别创建一系列平行平面,利用这三组互相垂直的平面把包围盒划分为多个单元格,取每单元格中最靠近单元格中心的数据点作为有效点,删除其它点。
粒子系统建模步骤主要基于物理建模思想,将降采样后的所述三维网格模型模拟为基于牛顿经典力学原理的粒子系统模型。本示例性实施例中,粒子系统建模步骤可以包括:
粒子系统模型将三维网格模型中的每个顶点模拟成一个粒子(particle),粒子之间用虚拟弹簧连接。整个粒子系统模型由多个有限元单元组成,每个有限元为四边形,具体粒子系统模型可以如图6中所示。每个粒子状态用向量(x1,x2,x3,v1,v2,v3)表示,其中x1,x2,x3是粒子三维空间坐标,v1,v2,v3是粒子三维空间速度。粒子系统模型服从经典牛顿定理f=ma,其中m是粒子质量,a是加速度。粒子系统模型作用力可分为外力Fext和内力Fint,F=Fext+Fint。内力Fint指粒子之间作用力,具体为弹簧形变作用力,可以用胡克定理计算。外力Fext包括方向为垂直向下的重力(使粒子回复到Z=0平面)和粘滞阻力。粘滞阻力定义为f=-μv,其中μ是粘滞系数,v是粒子速度,该力促使粒子回复到静止态(RestState)。
二维平展步骤主要基于所述粒子系统模型将所述三维网格模型还原至二维平面。三维网格模型的二维平展可看成平面纸张扭曲变形的逆过程,需要从三维变形状态推导出平面状态。二维平展算法实质是将三维变形网格还原至Z=0的平面,即平面碰撞(对应深度坐标x3=0或者x3<ξ,ξ是接近0的极小值)。深度坐标x3的改变将导致三维空间坐标速度改变,vnew=vt-krvn。其中vt为切向速度,vn为法向速度,kr为恢复系数,一般选取为0.1。速度和位置的改变都将引起外力和内力的变化。Barraff证明该系统满足如下关系:
a = M - 1 ( - &part; E &part; x + F )
其中E是内力,F是外力,M-1是元素为1/m和x的对角矩阵,表示粒子位置状态。可采用欧拉算法或Runge-Kutta算法解决平面碰撞问题。具体方法如下:
1)三维网格模型初始化为一个粒子系统模型后,各粒子之间用弹簧相连,各弹簧处于初始状态。
2)二维平展算法可看成强加一外力使三维网格模型趋于平面网格的过程,通过数值运算得到收敛状态。
3)当系统内部能量(弹簧作用力)最低时,二维平展过程结束,此时保存各粒子新位置。
图像恢复步骤主要用于将色彩信息对应至所述二维平面,得到所述待扫描图书的二维平展图像。图像恢复具体算法可以如图7所示,其中以A,B,C,D四点为例,可扩展到所有像素点及对应的三维空间坐标点。举例而言,
1)根据未校正原始图像(色彩信息图像)坐标mi=(ui,vi)及投影矩阵P估计三维空间坐标Mi=(Xi,Yi,Zi),其中mi为图像坐标,Mi为对应三维空间坐标。
Mi=P-1mi
2)通过二维平展过程将三维空间坐标Mi=(Xi,Yi,Zi)映射到二维平面坐标Mi'=(X'i,Y'i,Z'i),其中,Z'i=0。具体算法可以参考上述二维平展算法。
3)通过投影矩阵P计算mui=(ui',vi')。mui是恢复后的图像坐标。
mui=PMi'
本示例性实施例中虽然例举了三维建模以及二维平展的具体实现方式,但本示例性实施例中并不以此为限。本领域技术人员容易理解的是,其他三维建模以及二维平展方法亦可适用于本示例性实施例中的非接触型图书扫描设备。本示例性实施例中,上述三维建模模块中的部分步骤或全部步骤可以通过软件方式(例如程序、固件等)实现,也可以通过硬件方式(例如集成芯片、单片机、DSP等)实现;上述二维平展模块中的部分步骤或全部步骤同样可以通过软件(例如程序、固件等)方式实现,也可以通过硬件方式(例如集成芯片、单片机、DSP等)实现。
此外,在本公开的其他示例性实施例中,所述非接触型图书扫描设备还可以包括一自动翻页机构。自动翻页机构用于在所述非接触型图书扫描设备对所述图书的当前页面扫描完成后,自动将所述图书翻至其他页面。所述其他页面可以为所述当前页面的下一页,也可以根据用于设定自行确定;例如所述当前页面的上一页等等。
下面,以对一图书的具体扫描结果对本示例性实施例中非接触型图书扫描设备的技术效果进行进一步的说明。参考图9中所示,为结构光摄像机采集到的图像,由于图书本身弯曲的特点,扫描后的图像完整的呈现出该图书弯曲状的表面图像。从图中可以看出,折痕的地方,辨识度不高。利用本示例性实施例中所提供的算法对图9中的图像进行三维点云数据重构,得到重构后的点云图像,具体如图10中所示,然后对图10图像通过二维平整,扭曲校正,纹理映射,最后,经图像恢复后得到的二维平展图像的效果图如图11所示。可以明显看出,本示例性实施例中的非接触型图书扫描设备可以明显提升扫描效果,得到的图像辨识度得以大幅度提高,进而可以改善用户阅读体验。
以上所述仅为本公开的部分示例性实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (10)

1.一种非接触型图书扫描设备,其特征在于,包括:
一深度信息采集组件,面向一待扫描图书以采集其深度信息;
一色彩信息采集组件,面向所述待扫描图书以采集其色彩信息;以及,
一服务器终端,接收所述深度信息采集组件采集的深度信息以及所述色彩信息采集组件采集的色彩信息;所述服务器终端包括:
一三维建模模块,用于基于接收的所述深度信息建构所述待扫描图书的三维网格模型;以及,
一二维平展模块,用于基于所述待扫描图书的三维网格模型以及接收的所述色彩信息恢复所述待扫描图书的二维平展图像。
2.根据权利要求1所述的非接触型图书扫描设备,其特征在于,所述深度信息采集组件包括:
结构光深度摄像组件、TOF深度摄像组件、基于三维激光扫描的深度摄像组件、Kinect摄像组件或者RealSense摄像组件中的一种或多种。
3.根据权利要求2所述的非接触型图书扫描设备,其特征在于,所述深度信息采集组件为结构光深度摄像组件,其包括:
一结构光发射器,用于投射特定模式的结构光至所述待扫描图书,所述结构光被所述待扫描图书的表面调制为一结构光三维图像;以及,
一结构光摄像机,用于对所述结构光三维图像进行采样,获取结构光被调制后的纹理图像。
4.根据权利要求3所述的非接触型图书扫描设备,其特征在于,所述建构所述待扫描图书的三维网格模型包括:
结构光摄像机标定步骤,以获取所述结构光摄像机的内外部参数;
结构光发射器标定步骤,以获取所述结构光发射器的内外部参数;
三维测距步骤,从所述结构光被调制后的纹理图像确定特征点信息并结合所述结构光摄像机和结构光发射器的内外部参数输出三维点云;以及,
三维重构步骤,对所述三维点云进行处理以生成一三维网格模型。
5.根据权利要4所述的非接触型图书扫描设备,其特征在于,所述恢复所述待扫描图书的二维平展图像包括:
点云降采样步骤,用于通过降采样以降低后续运算涉及到的三维点云数量;
粒子系统建模步骤,将降采样后的所述三维网格模型模拟为基于牛顿经典力学原理的粒子系统模型;
二维平展步骤,基于所述粒子系统模型将所述三维网格模型还原至二维平面;
图像恢复步骤,将所述色彩信息对应至所述二维平面,得到所述待扫描图书的二维平展图像。
6.根据权利要求5所述的非接触型图书扫描设备,其特征在于,所述点云降采样步骤中采用空间单元格算法。
7.根据权利要求5所述的非接触型图书扫描设备,其特征在于,所述粒子系统建模步骤中将三维网格模型的每个顶点模拟为一个粒子,粒子之间通过虚拟弹簧连接。
8.根据权利要求7所述的非接触型图书扫描设备,其特征在于,所述二维平展步骤中,模拟施加外力使所述三维网格模型趋于二维平面网格,直至所述粒子系统模型内部能量最低。
9.根据权利要求8所述的非接触型图书扫描设备,其特征在于,所述图像恢复中,计算所述色彩信息图像中各像素点的三维空间坐标并将其映射到所述二维平展步骤中得到的二维平面网格。
10.根据权利要求1-9任意一项所述的非接触型图书扫描设备,其特征在于,所述三维建模模块及/或二维平展模块中的部分步骤或全部步骤通过软件方式实现或通过硬件方式实现。
CN201510477590.1A 2015-08-06 2015-08-06 非接触型图书扫描设备 Pending CN105095894A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510477590.1A CN105095894A (zh) 2015-08-06 2015-08-06 非接触型图书扫描设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510477590.1A CN105095894A (zh) 2015-08-06 2015-08-06 非接触型图书扫描设备

Publications (1)

Publication Number Publication Date
CN105095894A true CN105095894A (zh) 2015-11-25

Family

ID=54576281

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510477590.1A Pending CN105095894A (zh) 2015-08-06 2015-08-06 非接触型图书扫描设备

Country Status (1)

Country Link
CN (1) CN105095894A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105872291A (zh) * 2016-05-31 2016-08-17 大连成者科技有限公司 带有激光校正的智能互联网高清扫描仪
CN105894586A (zh) * 2016-03-29 2016-08-24 北方工业大学 一种三维图书模型的单侧页面提取方法
CN105931177A (zh) * 2016-04-14 2016-09-07 付常青 特定环境下的图像采集处理装置及其方法
CN105979117A (zh) * 2016-04-28 2016-09-28 大连成者科技有限公司 基于激光线的弯曲书页图像展平方法
CN108234874A (zh) * 2018-01-10 2018-06-29 南京华捷艾米软件科技有限公司 体感摄像头的成像精度的调节方法及调节装置
CN108790509A (zh) * 2018-05-11 2018-11-13 陈歆 一种按压复制器
CN109873920A (zh) * 2019-02-13 2019-06-11 盎锐(上海)信息科技有限公司 基于滚动快门的投影光栅建模方法及装置
CN112509106A (zh) * 2020-11-17 2021-03-16 科大讯飞股份有限公司 文档图片展平方法、装置以及设备
US10972624B2 (en) 2016-05-31 2021-04-06 Dalian Czur Tech Co., Ltd. Smart internet high-definition scanner with laser correction
WO2022193310A1 (en) * 2021-03-19 2022-09-22 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Electric device, method of controlling electric device, and computer readable storage medium

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10173905A (ja) * 1996-12-11 1998-06-26 Minolta Co Ltd 画像読取り装置
EP1067757A1 (en) * 1999-07-09 2001-01-10 Hewlett-Packard Company Curled surface imaging system
CN1342021A (zh) * 2000-09-04 2002-03-27 富士通株式会社 校正输入图象失真的设备与方法
US20050074144A1 (en) * 2000-11-24 2005-04-07 Yuichi Abe Image processing method and contactless image input apparatus utilizing the method
CN101697233A (zh) * 2009-10-16 2010-04-21 长春理工大学 一种基于结构光的三维物体表面重建方法
CN102801894A (zh) * 2012-07-18 2012-11-28 天津大学 一种变形书页展平方法
CN104197838A (zh) * 2014-09-19 2014-12-10 安徽中烟工业有限责任公司 基于计算机视觉的卷烟条与盒包装纸尺寸测量方法
CN104616284A (zh) * 2014-12-09 2015-05-13 中国科学院上海技术物理研究所 彩色深度相机的彩色图像到深度图像的像素级对准算法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10173905A (ja) * 1996-12-11 1998-06-26 Minolta Co Ltd 画像読取り装置
EP1067757A1 (en) * 1999-07-09 2001-01-10 Hewlett-Packard Company Curled surface imaging system
CN1342021A (zh) * 2000-09-04 2002-03-27 富士通株式会社 校正输入图象失真的设备与方法
US20050074144A1 (en) * 2000-11-24 2005-04-07 Yuichi Abe Image processing method and contactless image input apparatus utilizing the method
CN101697233A (zh) * 2009-10-16 2010-04-21 长春理工大学 一种基于结构光的三维物体表面重建方法
CN102801894A (zh) * 2012-07-18 2012-11-28 天津大学 一种变形书页展平方法
CN104197838A (zh) * 2014-09-19 2014-12-10 安徽中烟工业有限责任公司 基于计算机视觉的卷烟条与盒包装纸尺寸测量方法
CN104616284A (zh) * 2014-12-09 2015-05-13 中国科学院上海技术物理研究所 彩色深度相机的彩色图像到深度图像的像素级对准算法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BROWN M.S. 等: "Document Restoration Using 3D Shape:A General Deskewing Algorithm for Arbitrarily Warped Documents", 《COMPUTER VISION, 2001. ICCV 2001. PROCEEDINGS. EIGHTH IEEE INTERNATIONAL CONFERENCE ON》 *
孙瑞 等: "点云数据压缩算法综述", 《科技信息》 *
张广军: "《光电测试技术》", 31 March 2008 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105894586A (zh) * 2016-03-29 2016-08-24 北方工业大学 一种三维图书模型的单侧页面提取方法
CN105894586B (zh) * 2016-03-29 2019-02-22 北方工业大学 一种三维图书模型的单侧页面提取方法
CN105931177A (zh) * 2016-04-14 2016-09-07 付常青 特定环境下的图像采集处理装置及其方法
CN105979117B (zh) * 2016-04-28 2018-11-27 大连成者科技有限公司 基于激光线的弯曲书页图像展平方法
CN105979117A (zh) * 2016-04-28 2016-09-28 大连成者科技有限公司 基于激光线的弯曲书页图像展平方法
CN105872291B (zh) * 2016-05-31 2018-11-27 大连成者科技有限公司 带有激光校正的智能互联网高清扫描仪
CN105872291A (zh) * 2016-05-31 2016-08-17 大连成者科技有限公司 带有激光校正的智能互联网高清扫描仪
US10972624B2 (en) 2016-05-31 2021-04-06 Dalian Czur Tech Co., Ltd. Smart internet high-definition scanner with laser correction
CN108234874A (zh) * 2018-01-10 2018-06-29 南京华捷艾米软件科技有限公司 体感摄像头的成像精度的调节方法及调节装置
CN108234874B (zh) * 2018-01-10 2020-07-21 南京华捷艾米软件科技有限公司 体感摄像头的成像精度的调节方法及调节装置
CN108790509A (zh) * 2018-05-11 2018-11-13 陈歆 一种按压复制器
CN109873920A (zh) * 2019-02-13 2019-06-11 盎锐(上海)信息科技有限公司 基于滚动快门的投影光栅建模方法及装置
CN109873920B (zh) * 2019-02-13 2021-08-20 盎锐(上海)信息科技有限公司 基于滚动快门的投影光栅建模方法及装置
CN112509106A (zh) * 2020-11-17 2021-03-16 科大讯飞股份有限公司 文档图片展平方法、装置以及设备
WO2022193310A1 (en) * 2021-03-19 2022-09-22 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Electric device, method of controlling electric device, and computer readable storage medium

Similar Documents

Publication Publication Date Title
CN105095894A (zh) 非接触型图书扫描设备
US10798359B2 (en) Generating hi-res dewarped book images
Lanman et al. Build your own 3D scanner: 3D photography for beginners
CN101697233B (zh) 一种基于结构光的三维物体表面重建方法
CN103759671B (zh) 一种牙模三维表面数据非接触扫描方法
Lampert et al. Oblivious document capture and real-time retrieval
CN105872291B (zh) 带有激光校正的智能互联网高清扫描仪
US11023762B2 (en) Independently processing plurality of regions of interest
Zhang et al. An improved physically-based method for geometric restoration of distorted document images
CN107463659A (zh) 物体搜索方法及其装置
CN106839989A (zh) 一种三维扫描仪的扫描方法及扫描辅助标记板
CN113505626A (zh) 一种快速三维指纹采集方法与系统
CN107079112A (zh) 图像数据分割
Taubin et al. 3d scanning for personal 3d printing: build your own desktop 3d scanner
Sun et al. Geometric and photometric restoration of distorted documents
Lanman et al. Build your own 3D scanner: optical triangulation for beginners
Kumara et al. Real-time 3D human objects rendering based on multiple camera details
Wei et al. Bend-a-rule: a fabrication-based workflow for 3D planar contour acquisition
WO2021029890A1 (en) Image dewarping with curved document boundaries
CN205721990U (zh) 使用移动终端采集二维图像进行足部三维重建的系统
Slossberg et al. Freehand Laser Scanning Using Mobile Phone.
CN103985151A (zh) 移动设备中形成三维图像的数据采集处理方法及装置
Choi et al. Dense 3D depth map with DOE pattern
Breuckmann 3-dimensional digital fingerprint of paintings
CN115112017A (zh) 应用于移动终端的超薄型三维采集模组

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151125

WD01 Invention patent application deemed withdrawn after publication