CN101799828A - 一种用于视频点读机的基于透视变换的书本查找方法 - Google Patents

一种用于视频点读机的基于透视变换的书本查找方法 Download PDF

Info

Publication number
CN101799828A
CN101799828A CN 201010122553 CN201010122553A CN101799828A CN 101799828 A CN101799828 A CN 101799828A CN 201010122553 CN201010122553 CN 201010122553 CN 201010122553 A CN201010122553 A CN 201010122553A CN 101799828 A CN101799828 A CN 101799828A
Authority
CN
China
Prior art keywords
front cover
book
cover
picture
picture library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010122553
Other languages
English (en)
Other versions
CN101799828B (zh
Inventor
熊邦书
陈乐平
欧巧凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang Hangkong University
Original Assignee
Nanchang Hangkong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Hangkong University filed Critical Nanchang Hangkong University
Priority to CN2010101225536A priority Critical patent/CN101799828B/zh
Publication of CN101799828A publication Critical patent/CN101799828A/zh
Application granted granted Critical
Publication of CN101799828B publication Critical patent/CN101799828B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

一种用于视频点读机的基于透视变换的书本查找方法,包括步骤:1)利用视频摄像头实时采集单帧书本封面图像并输入微处理器;2)对目标封面和图库参考封面图像分别提取书本封面边缘轮廓;3)利用书本封面的边缘轮廓分别提取目标封面和图库参考封面的特征点;4)将目标封面和图库参考封面灰度进行归一化;5)对目标封面和图库参考封面图像进行透视匹配;6)计算得到目标封面和图库中每一参考封面图像的相似度;7)从而实现用于视频点读机的基于透视变换的书本查找功能。本发明的优点是:基于透视变换的书本封面查找方法简单、实用,实现了点读机书本的自动选择。

Description

一种用于视频点读机的基于透视变换的书本查找方法
技术领域
本发明涉及一种书本查找方法,尤其涉及一种用于视频点读机的基于透视变换的书本查找方法。
背景技术
点读机作为现代数码信息技术与最新教学需求完美结合的一种有声互动学习产品,已经迅速进入了国内市场,并发展成为国内儿童早期教育的主要学习工具之一。各种应用于完善点读机功能的技术方法也在不断更新发展。
目前流行的点读机书本选择功能是用于动选择来实现,其具体步骤是:在点读机的“功能模块”中,选择“选书”按钮,进入显示屏中的选书列表,通过滚动选书列表来选择所要找的书本书名信息,实现了选书功能。利用这种方法实现的点读机选书功能,优点是选书准确、操作简单。但是由于点读机所包含的书本数量较多,通过人工手动滚动选书列表来进行逐一查找,这样使得选书操作繁琐费时,增加了选书工作量,给用户的选书操作带来了不便。
发明内容
本发明的目的在于提供一种用于视频点读机的基于透视变换的书本查找方法,该查找方法简单、实用,实现了点读机书本的自动选择。
本发明是这样来实现的,其特征是方法步骤为:
(1)利用视频摄像头实时采集单帧书本封面图像并输入微处理器;
(2)先利用边缘检测算子和阈值分割法将图像二值化,再采用图像膨胀与腐蚀、图像滤波和最大连通域法排除背景噪声干扰,对目标封面和图库参考封面图像分别提取书本封面边缘轮廓;
(3)利用书本封面的边缘轮廓分别提取目标封面和图库参考封面的特征点;
(4)在书本封面轮廓区域内,将目标封面和图库参考封面灰度进行归一化,采用传统的灰度归一化方法建立目标封面和图库参考封面图像匹配的统一光照强度标准;
(5)根据提取的目标封面和图库参考封面的特征点,先利用透视变换法对目标封面进行坐标变换,再利用双线性插值法获得目标封面的像素灰度值,最后利用中值滤波法平滑目标封面图像,完成目标封面和图库参考封面的图像进行透视匹配;
(6)利用基于灰度的图像匹配方法,计算得到目标封面和图库中每一参考封面图像的相似度;
(7)根据图像相似度,利用极小值原则进行目标封面查找,输出查找到的书名信息,从而实现用于视频点读机的基于透视变换的书本查找功能。
所述目标封面和图库参考封面分别为微处理器控制摄像头单帧采集的书本封面图像和微处理器中已存储的书本封面图库中的书本封面图像。
本发明的优点是:利用最大连通域法有效排除了噪声和其他非目标物体的干扰;利用灰度归一化方法排除光照强度的影响;利用图像透视变换实现目标封面和图库参考封面图像的几何归一化;利用视频摄像头和微处理器实现了用于视频点读机的基于透视变换的书本查找功能。基于透视变换的书本封面查找方法简单、实用,实现了点读机书本的自动选择。
附图说明
图1为本发明的工作流程图。
具体实施方式
本发明方法要求用简单支架支撑普通广角摄像头使之能够垂直拍摄,拍摄的场景中只有单一的书本,且能够完全包含该书本的整个封面,同时,场景中的书本不能是倒置或横置的,场景中的背景为普通的任意单色桌面。微处理器中应存储参考书本封面的图库及其相应书名和读音信息。
本发明采用如图1所示的用于视频点读机的基于透视变换的书本查找方法的流程图,来实现目标封面在点读机图库中的查找工作,其具体实施步骤如下:
1、目标封面图像采集
将带有支架的摄像头放置在书本正前方的合适位置,实时获取书本封面的视频图像,利用微处理器控制摄像头采集单帧书本封面图像并输入微处理器。
2、目标封面和图库参考封面轮廓提取
对目标封面和图库参考封面图像分别提取书本封面边缘轮廓。其主要步骤如下:
1)利用边缘检测算子提取目标封面和图库参考封面的边缘信息,其中边缘检测算子可用Canny、Robert或Sobel。
2)采用阈值法对图像进行二值化,并采用图像膨胀与腐蚀、图像滤波和最大连通域法排除背景噪声干扰,准确提取目标封面和图库参考封面的边缘轮廓。
3、目标封面和图库参考封面特征点提取
利用第2步提取的书本封面的边缘轮廓,采用扫描法和两次最小二乘拟合法得到目标封面和图库中每张参考封面的边缘直线方程,提取出目标封面和图库中每张参考封面对应的四对顶点,作为透视变换的特征点。其中对书本封面特征点提取的主要步骤如下:
1)通过扫描法提取书本封面的四条边缘点集,并利用最小二乘拟合法拟合得到四条边缘直线方程。
2)计算各个边缘点集中每点到相应拟合直线的距离,并按从小到大排序,去除点集中距离远的二分之一的点,排除噪声点的影响。
3)利用各个边缘点集中剩余的点,再次利用最小二乘拟合法拟合得到四条边缘直线方程。
4)利用四条边缘直线方程,提取出书本封面的四个顶点作为透视变换的特征点。
4、目标封面和图库参考封面灰度归一化
在第2步确定的书本封面边缘轮廓区域内,分别计算目标封面及图库中每张参考封面图像中三基色对应的各个灰度分量的灰度期望和灰度方差,采用灰度归一化方法将目标封面和图库参考封面灰度进行归一化。
灰度归一化方法如下:
假设书本封面图像I大小为N×N,令G(i,j)为像素点(i,j)的灰度值,M和VAR分别为书本封面图像灰度期望和灰度方差,G′(i,j)为像素点(i,j)归一化后的灰度值。对所有像素点归一化后书本封面图像的灰度期望和灰度方差接近于给定的灰度期望M0和灰度方差VAR0,本发明中M0和VAR0为某一定值,灰度归一化处理公式如下所示:
G ′ ( i , j ) = M 0 + VAR 0 ( G ( i , j ) - M ) 2 VAR , ( G ( i , j ) > M ) M 0 - VAR 0 ( G ( i , j ) - M ) 2 VAR , ( G ( i , j ) ≤ M )
其中: M = 1 N 2 Σ i = 0 N - 1 Σ j = 0 N - 1 G ( i , j ) , VAR = 1 N 2 Σ i = 0 N - 1 Σ j = 0 N - 1 [ G ( i , j ) - M ] 2 .
5、目标封面和图库单张参考封面透视匹配
根据第3步提取的目标封面和图库中每张参考封面的四对特征点,利用图像透视变换法,对目标封面和图库单张参考封面进行透视匹配,实现书本封面几何归一化。其主要步骤如下:
1)利用透视变换法对目标封面进行坐标变换,把目标封面变换到和图库参考封面有同样尺寸大小和几何位置的坐标空间中。其转换公式如下所示:
x ′ = ax + by + c gx + hy + 1 y ′ = dx + ey + f gx + hy + 1
其中:(x,y)是目标封面图像坐标系中的像素坐标,(x′,y′)是变换后对应于图库参考封面图像坐标系中相应的像素坐标。a,b,c,d,e,f,g和h是变换系数,可通过提取的目标封面和图库中每张参考封面的四对特征点,代入以上公式解方程组而求出。
2)利用双线性差值法,获得经过坐标变换的目标封面图像的像素灰度值。
3)利用中值滤波法对透视变换后的目标封面图像进行平滑处理,去除了噪声干扰。
6、封面图像的相似度计算及结果保存
利用第4步计算得到的灰度期望,并在第5步对目标封面和图库单张参考封面进行透视变换基础上,将目标封面与图库参考封面的图像灰度分量中灰度期望差值最大的灰度分量进行差分,利用基于灰度的图像匹配方法,计算出目标封面和图库中每张参考封面的相似度并保存结果。
相似度计算方法如下:
假设书本封面大小为为N×N,目标封面与图库中第k张参考封面的相似度Rk的计算公式如下所示:
R k = 1 N 2 Σ i = 0 N - 1 Σ j = 0 N - 1 [ G ( i , j ) - G k ( i , j ) ] 2
其中:G(i,j)和Gk(i,j)分别为目标封面和图库中第k张参考封面在像素点(i,j)的灰度分量值。
7、是否完成和所有参考封面的匹配计算
判断目标封面是否完成和图库中所有参考封面的匹配计算,若完成匹配计算,则执行下一步;若没有完成,则取下一张参考封面图像再次执行第5、6、7步。
8、书本查找功能实现
在第7步判断完成目标封面和图库中所有参考封面的匹配计算的基础上,利用极小值原则进行目标封面查找。将计算得到的数值最小的相似度所对应的图库参考封面的书名信息输出,并调出相应书本的点读语音信息,从而实现了用于视频点读机的基于透视变换的书本查找功能。

Claims (2)

1.一种用于视频点读机的基于透视变换的书本查找方法,其特征是方法步骤为:
(1)利用视频摄像头实时采集单帧书本封面图像并输入微处理器;
(2)先利用边缘检测算子和阈值分割法将图像二值化,再采用图像膨胀与腐蚀、图像滤波和最大连通域法排除背景噪声干扰,对目标封面和图库参考封面图像分别提取书本封面边缘轮廓;
(3)利用书本封面的边缘轮廓分别提取目标封面和图库参考封面的特征点;
(4)在书本封面轮廓区域内,将目标封面和图库参考封面灰度进行归一化,采用传统的灰度归一化方法建立目标封面和图库参考封面图像匹配的统一光照强度标准;
(5)根据提取的目标封面和图库参考封面的特征点,先利用透视变换法对目标封面进行坐标变换,再利用双线性插值法获得目标封面的像素灰度值,最后利用中值滤波法平滑目标封面图像,完成目标封面和图库参考封面的图像进行透视匹配;
(6)利用基于灰度的图像匹配方法,计算得到目标封面和图库中每一参考封面图像的相似度;
(7)根据图像相似度,利用极小值原则进行目标封面查找,输出查找到的书名信息,从而实现用于视频点读机的基于透视变换的书本查找功能。
2.根据权利要求1所述的一种用于视频点读机的基于透视变换的书本查找方法,其特征是所述目标封面和图库参考封面分别为微处理器控制摄像头单帧采集的书本封面图像和微处理器中已存储的书本封面图库中的书本封面图像。
CN2010101225536A 2010-03-11 2010-03-11 一种用于视频点读机的基于透视变换的书本查找方法 Expired - Fee Related CN101799828B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010101225536A CN101799828B (zh) 2010-03-11 2010-03-11 一种用于视频点读机的基于透视变换的书本查找方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101225536A CN101799828B (zh) 2010-03-11 2010-03-11 一种用于视频点读机的基于透视变换的书本查找方法

Publications (2)

Publication Number Publication Date
CN101799828A true CN101799828A (zh) 2010-08-11
CN101799828B CN101799828B (zh) 2012-01-11

Family

ID=42595504

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101225536A Expired - Fee Related CN101799828B (zh) 2010-03-11 2010-03-11 一种用于视频点读机的基于透视变换的书本查找方法

Country Status (1)

Country Link
CN (1) CN101799828B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102522008A (zh) * 2011-11-23 2012-06-27 康佳集团股份有限公司 一种多媒体互动教学方法及其系统、一种电视机
CN103425954A (zh) * 2012-05-15 2013-12-04 仪鼎半导体股份有限公司 扫描演算方法
CN104933910A (zh) * 2015-07-08 2015-09-23 杭州问嫂科技有限公司 基于实物图文的视听内容播放方法及儿童早教机
CN105447499A (zh) * 2015-10-23 2016-03-30 北京爱乐宝机器人科技有限公司 一种图书互动方法、装置和设备
CN106658141A (zh) * 2016-11-29 2017-05-10 维沃移动通信有限公司 一种视频处理方法及移动终端
WO2017206340A1 (zh) * 2016-05-30 2017-12-07 中兴通讯股份有限公司 图片的显示方法及装置
CN108509584A (zh) * 2018-03-29 2018-09-07 北京百度网讯科技有限公司 封面图的选择方法、装置和计算机设备
CN109034002A (zh) * 2018-07-04 2018-12-18 安徽淘云科技有限公司 实体书检测方法及装置
CN109084721A (zh) * 2017-06-13 2018-12-25 睿励科学仪器(上海)有限公司 用于确定半导体器件中的目标结构的形貌参数的方法和设备
CN109947273A (zh) * 2019-03-25 2019-06-28 广东小天才科技有限公司 一种点读定位方法及装置
CN110263187A (zh) * 2019-06-19 2019-09-20 深圳市沃特沃德股份有限公司 绘本识别方法、装置、存储介质及计算机设备
CN111077990A (zh) * 2019-06-03 2020-04-28 广东小天才科技有限公司 一种待点读内容的确定方法及学习设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050018904A1 (en) * 2003-07-22 2005-01-27 Jason Davis Methods for finding and characterizing a deformed pattern in an image
CN1290061C (zh) * 2003-07-23 2006-12-13 西北工业大学 一种利用显著边缘进行图像检索的方法
CN101377847A (zh) * 2007-08-29 2009-03-04 中国科学院自动化研究所 一种文档图像的配准及特征点选取方法
CN101504798A (zh) * 2009-03-05 2009-08-12 东莞市步步高教育电子产品有限公司 学习机

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050018904A1 (en) * 2003-07-22 2005-01-27 Jason Davis Methods for finding and characterizing a deformed pattern in an image
CN1290061C (zh) * 2003-07-23 2006-12-13 西北工业大学 一种利用显著边缘进行图像检索的方法
CN101377847A (zh) * 2007-08-29 2009-03-04 中国科学院自动化研究所 一种文档图像的配准及特征点选取方法
CN101504798A (zh) * 2009-03-05 2009-08-12 东莞市步步高教育电子产品有限公司 学习机

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102522008A (zh) * 2011-11-23 2012-06-27 康佳集团股份有限公司 一种多媒体互动教学方法及其系统、一种电视机
CN103425954A (zh) * 2012-05-15 2013-12-04 仪鼎半导体股份有限公司 扫描演算方法
CN103425954B (zh) * 2012-05-15 2016-05-25 仪鼎半导体股份有限公司 扫描演算方法
CN104933910A (zh) * 2015-07-08 2015-09-23 杭州问嫂科技有限公司 基于实物图文的视听内容播放方法及儿童早教机
CN105447499A (zh) * 2015-10-23 2016-03-30 北京爱乐宝机器人科技有限公司 一种图书互动方法、装置和设备
CN105447499B (zh) * 2015-10-23 2018-09-04 北京爱乐宝机器人科技有限公司 一种图书互动方法、装置和设备
WO2017206340A1 (zh) * 2016-05-30 2017-12-07 中兴通讯股份有限公司 图片的显示方法及装置
CN106658141A (zh) * 2016-11-29 2017-05-10 维沃移动通信有限公司 一种视频处理方法及移动终端
CN109084721A (zh) * 2017-06-13 2018-12-25 睿励科学仪器(上海)有限公司 用于确定半导体器件中的目标结构的形貌参数的方法和设备
CN108509584A (zh) * 2018-03-29 2018-09-07 北京百度网讯科技有限公司 封面图的选择方法、装置和计算机设备
CN109034002A (zh) * 2018-07-04 2018-12-18 安徽淘云科技有限公司 实体书检测方法及装置
CN109947273A (zh) * 2019-03-25 2019-06-28 广东小天才科技有限公司 一种点读定位方法及装置
CN109947273B (zh) * 2019-03-25 2022-04-05 广东小天才科技有限公司 一种点读定位方法及装置
CN111077990A (zh) * 2019-06-03 2020-04-28 广东小天才科技有限公司 一种待点读内容的确定方法及学习设备
CN111077990B (zh) * 2019-06-03 2024-03-19 广东小天才科技有限公司 一种待点读内容的确定方法及学习设备
CN110263187A (zh) * 2019-06-19 2019-09-20 深圳市沃特沃德股份有限公司 绘本识别方法、装置、存储介质及计算机设备

Also Published As

Publication number Publication date
CN101799828B (zh) 2012-01-11

Similar Documents

Publication Publication Date Title
CN101799828B (zh) 一种用于视频点读机的基于透视变换的书本查找方法
CN110866953B (zh) 地图构建方法及装置、定位方法及装置
CN107423698B (zh) 一种基于并联卷积神经网络的手势估计方法
CN105701447B (zh) 迎宾机器人
CN101877143B (zh) 一种二维图像组的三维场景重建方法
CN104134200B (zh) 一种基于改进加权融合的运动场景图像拼接方法
CN103248906B (zh) 一种双目立体视频序列的深度图获取方法与系统
CN104715256A (zh) 一种基于图像方法的书法练习辅助系统及评价方法
CN101777129B (zh) 一种基于特征检测的图像匹配方法
CN102006425A (zh) 一种基于多摄像机的视频实时拼接方法
CN106056053A (zh) 基于骨骼特征点提取的人体姿势识别方法
RU2008143205A (ru) Эффективное кодирование множества видов
CN102034247B (zh) 一种基于背景建模对双目视觉图像的运动捕捉方法
CN106507199A (zh) 电视节目推荐方法及装置
CN105740780A (zh) 人脸活体检测的方法和装置
CN105457908B (zh) 基于单目ccd的小尺寸玻璃面板的分拣快速定位方法及系统
CN107798313A (zh) 一种人体姿态识别方法、装置、终端和存储介质
CN104598871A (zh) 一种基于相关回归的面部年龄计算方法
CN102737370A (zh) 检测图像前景的方法及设备
CN108377374A (zh) 用于产生与图像相关的深度信息的方法和系统
CN101315668A (zh) 试卷卷面表格自动检测方法
CN104915667A (zh) 一种基于移动终端的答题卡识别分析方法及系统
CN109376641A (zh) 一种基于无人机航拍视频的运动车辆检测方法
CN106295514A (zh) 一种图像识别题目显示答案的方法及装置
CN106778658B (zh) 基于课堂场景及学习者视线分析学习者注意力的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120111

Termination date: 20150311

EXPY Termination of patent right or utility model