CN201097383Y - 听书机 - Google Patents
听书机 Download PDFInfo
- Publication number
- CN201097383Y CN201097383Y CNU2007200006766U2007200006766U CN200720000676U CN201097383Y CN 201097383 Y CN201097383 Y CN 201097383Y CN U2007200006766U2007200006766 U CNU2007200006766U2007200006766 U CN U2007200006766U2007200006766U CN 200720000676 U CN200720000676 U CN 200720000676U CN 201097383 Y CN201097383 Y CN 201097383Y
- Authority
- CN
- China
- Prior art keywords
- page
- motor
- machine
- image acquisition
- bar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 claims abstract description 36
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 7
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 7
- 230000007246 mechanism Effects 0.000 claims description 33
- 230000008093 supporting effect Effects 0.000 claims description 20
- 230000033001 locomotion Effects 0.000 claims description 18
- 238000003756 stirring Methods 0.000 claims description 16
- 238000004891 communication Methods 0.000 claims description 4
- 238000012876 topography Methods 0.000 claims description 3
- 238000005452 bending Methods 0.000 claims description 2
- 230000008878 coupling Effects 0.000 claims description 2
- 238000010168 coupling process Methods 0.000 claims description 2
- 238000005859 coupling reaction Methods 0.000 claims description 2
- 238000003825 pressing Methods 0.000 claims description 2
- 238000000034 method Methods 0.000 abstract description 17
- 230000008569 process Effects 0.000 abstract description 16
- 230000007306 turnover Effects 0.000 description 20
- 230000000694 effects Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000012015 optical character recognition Methods 0.000 description 9
- 230000007423 decrease Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000008676 import Effects 0.000 description 4
- 238000004088 simulation Methods 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000003760 hair shine Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000037152 sensory function Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Images
Landscapes
- Image Input (AREA)
Abstract
听书机,一种自动地翻动印刷品,将印刷品上的文字内容转化成电子文档和语音文件的便携式数码电子机器,它包括中央处理器、图像采集器、翻书机、扬声器、显示屏、外部存储器接口、网络接口,图像采集器、翻书机、扬声器、显示屏、外部存储器接口、网络接口与中央处理器连接,图像采集器安装在翻书机上,中央处理器采用OCR算法对图像采集器摄取的图像数据进行字符识别,采用TTS算法对字符识别结果进行语音合成,使人们快捷地存储、编辑、检索、聆听书本的内容,并通过网络接口向计算机网络实时地提供远程图书的信息内容。听书机包括盒式听书机和台式听书机,盒式听书机将图像采集器伸进书本内部进行扫描式图像采集。
Description
技术领域
本实用新型涉及一种可以通过电动翻书机构翻动印刷品,并通过数字集成芯片的程序进行图像处理、语音合成、数据通信,识别并朗读印刷品文字信息的数码电子机器。
背景技术
当今社会,知识快速增长,不同载体的信息之间转换、流通的效率在提高。人们学习的方式走向多样化,以视觉为主要渠道的传统读书方式受到挑战。
随着数字处理器运算速度的提升,模式识别、语音图像处理技术的进步,机器对人的感官功能的模拟更加智能化。OCR(Optical Character Recognition)光学字符识别技术增强了机器识别纸制文档的能力。电脑软件可以将扫描仪输出的图像文件中的文字、表格、图形转化成电子文档,俄罗斯ABBYY公司的FineReader软件具有高度的智能化,可以识别多种字体格式、多语种混合、超过170多种语言的文字,识别过程只需要很少的人工辅助,不过电脑、扫描仪体积大,不易携带,不宜随时随地使用。目前可随身携带的电子资料笔可以摘录并存储印刷资料中的精华内容,但它需要人工地将笔头对准文字逐个划过,自动化程度不高,录入速度较低,仅为8汉字/秒左右。同时,TTS(Text To Speech)语音合成技术日趋成熟,机器模拟语言发音的智能在提高,电脑软件利用该技术朗读电子文档。在脱机工作的嵌入式产品中的应用,如电子辞典和手机等,主要是单词、词组或简单句子的发音。最近国外有一种小型数码产品,利用OCR技术和TTS技术帮助盲人聆听账单、名片等简单印刷品的内容,不过其发音效果较为单调,不适宜聆听文章、书本的朗读,并且它需要人工对着页面拍照,和扫描仪、电子资料笔一样没有自动翻页功能,自动化程度不高。目前已有一些翻书机的设计出现,一般用于阅读乐谱或帮助伤残人士翻书,其运行速度较慢,没有自动识别页码的功能,容易出现粘页,有的还会损坏书页,且体积大,较重,不易携带。另一方面,目前的网络搜索引擎因为尚未将自动翻书与文字识别工作有效地结合起来,所以只能对已人工录入计算机存储器的信息进行检索,不能实时地提供印刷品上的信息。
发明内容
为了减轻视觉的阅读压力,拓展人们的学习方式,提高机器对印刷品信息采集、转换、录入的效率和自动化程度,本实用新型提出一种能自动地将书本翻到指定页面,将其中内容转换成电子文档并模拟人的语言发音朗读出来的便携式的数码电子机器,称为听书机。
本实用新型解决其技术问题所采用的技术方案是:听书机包括中央处理器、图像采集器、翻书机、扬声器、显示屏、外部存储器接口、网络接口、操作面板,图像采集器、翻书机、扬声器、显示屏、外部存储器接口、网络接口与中央处理器连接,操作面板与中央处理器、翻书机连接,图像采集器安装在翻书机上。翻书机通过粗翻的方式快速地接近目标页的大致范围,通过逐页翻动的方式准确地翻向目标页。图像采集时,翻书机调整图像采集器与书本的相对位置,图像采集器将采集到的图像数据传送至中央处理器,中央处理器首先对书页图像的周边进行局部的图像处理以检测出其中的页码,如果检测出的页码没有达到目标页码则继续翻书和图像采集,如果达到了则采用OCR算法将书页图像的内容进行字符识别并转化成电子文档,再通过TTS算法将电子文档中的文字进行语音合成。听书机通过网络接口连接到计算机网络上,使人们可以实时地获得远程图书的信息内容,这增加了网络搜索引擎对纸载信息的搜索功能,实现印刷品信息广泛的资源共享。
本实用新型涉及一种展开式听书机和一种非展开式听书机,展开式听书机,也称台式听书机,它自动地操纵数码相机对展开的页面进行摄像;非展开式听书机,也称盒式听书机,它在运行时书本并不完全展开,而是将平板状的图像采集器伸进书本内部进行扫描式采集,这使听书机减小了体积,更便于携带,将它装进盒子或背包里,就可以在行走中使用。这两种听书机的翻书机均采用吸盘式翻页机构,可以在逐页翻动时准确地达到目标页,避免粘页或损坏书页,对不同大小、厚度、纸质的书本均适用,另一方面,对于距离较远的目标页码,估算要翻动的厚度而进行粗翻,这提高了翻书的速度。
本实用新型的有益效果是,听书机进行的翻书、摄像、文字识别、语音朗读均自动完成,它可随身携带、随时随地使用,可识别页码,翻页准确且速度快,可自动调整图像采集器的工作状态,使人们可以快捷地存储、编辑、检索、聆听到本地或远程的图书的知识信息。
附图说明
图1是听书机的整体构造图。
图2是非展开式听书机的结构图。
图3是图2中的支承杆的放大图。
图4是非展开式听书机的图像采集器的内部结构图。
图5是气压式吸盘的内部结构图。
图6是展开式听书机的结构图。
图7是图6中的分页杆的放大图。
具体实施方式
听书机的整体构造如图1所示,它包括中央处理器、图像采集器、翻书机、操作面板、扬声器、显示屏、外部存储器接口、网络接口,其中翻书机包括控制电路、采集器支持机构、翻页机构。图像采集器、翻书机的控制电路、扬声器、显示屏、外部存储器接口、网络接口与中央处理器连接,图像采集器安装在采集器支持机构上,操作面板与中央处理器、翻书机的控制电路连接,翻书机的控制电路与翻页机构、采集器支持机构连接。中央处理器控制图像采集器内部参数的设置和摄像动作的启动与关闭,翻书机的控制电路通过电机和机械传动控制采集器支持机构和翻页机构,采集器支持机构调整图像采集器与书本的相对位置,翻页机构对书页进行翻动和体位调节。翻书机完成翻书动作并调整好采集器支持机构和书页的体位之后,向中央处理器发送标志信号,中央处理器接到该信号后,启动图像采集器对书本进行摄像。中央处理器可采用具有图像处理、语音合成、通信功能的高速处理器,比如DSP芯片或其他高速的嵌入式芯片,翻书机控制电路的运算和控制功能主要由低速的处理器如单片机完成,图像采集器可以由感光器件CCD或CMOS传感器构成。
翻书机接收到输入的目标页码后,将它与当前页码比较,如果两者差距较大则估算待翻的书页厚度,采用粗翻的方式快速地接近目标页的大致范围,如果差距小则计算待翻的张数,对书本逐页翻动相应的次数(一次翻动一张)。不同的书,纸张的厚度也不尽相同,而经过对该书第一次粗翻和页码识别之后,纸张的厚度就可以估算出来,这使以后的粗翻能更准确地接近目标页码。每完成一次粗翻或者完成了指定张数的逐页翻动,图像采集器对书页进行一次图像采集,所得的图像数据发送到中央处理器。中央处理器先对图像进行初步的预处理,检测该图像的周边以识别出其中的页码并将页码传给翻书机的控制电路。控制电路判断是否达到了目标页,如果没有达到则继续翻书和图像采集,如果达到了目标页,则采用OCR算法将该图像的全部内容进行图文划分和字符识别,其识别结果(包括文字和图形)以电子文档的形式存储并在显示屏上显示和编辑,再通过TTS算法将电子文档中的文字进行语音合成,其合成结果以语音文件的形式存储并送扬声器朗读播放。
页码识别的图像处理流程是,先进行影像正规化、去除噪声、影像矫正等影像前处理,再确定书页的四边形边界,确定正文版面的四边形边界,再对这两个四边形边界之间的局部图像进行版面分析,划分各字组的边界(这些字组可能是页码也可能是页眉或页脚上的章节号、章节名称或其他),再计算各字组的长度,对较短的那些字组(短字组是页码的可能性更大)进行行字切分,清点字的个数,如果字数较少则对各个字进行文字特征抽取,再将文字特征与数字特征数据库(数字特征数据库包含的是阿拉伯数字、汉语数字、希腊数字或其他语言的数字符号的特征信息)进行比对,如果比对符合则说明该字符是数字,如果字组的所有字符均是同语种的数字,则再检测原局部图像中与该数字组对称的地方是否也存在同样规格而与它差值为1的数字组,如果是则说明该数字组是页码。第一次页码识别之后的页码识别工作只需对固定位置上的字组进行识别。
开机后,在操作人输入目标页码之前,听书机自动进入默认工作流程:首先识别并朗读封面,然后翻书机从封面起逐页翻动,图像采集器随之逐页采集图像,中央处理器逐页进行文字识别,遇到内容提要页时朗读之,遇到目录页时朗读其中所有的章节名及其页码,使操作人对书本的内容及其页码有整体的了解,以便选择目标页码(书的封面到正文第一页之前的书页号码被编为负数或零),之后朗读前言、序、出版说明等,再从正文第一页开始逐页朗读整本书。若操作人输入目标页码,则中断默认工作流程,翻到目标页进行朗读,接着从目标页往后逐页朗读。若操作人输入的不是页码而是检索名,则中央处理器记录该检索名,先从目录页的章节名中查找出与之匹配的内容并将对应的页码传给翻书机,翻到该页朗读,如果目录页中没有匹配的内容则从内容提要、序、前言、正文第一页开始往后逐页查找,找到后再朗读,因此,输入的检索名最终是转化成页码传给翻书机的。朗读时,可加进背景音乐,在显示屏上同步地显示文字,同时,存储朗读过的书页的内容并将其对应的页码、主题名称或其它检索特征列入数据库,以供操作人对朗读过的历史内容进行搜索和回顾。
外部存储器通过外部存储器接口与中央处理器交换图像文件、电子文档等数据,并向OCR模块的字库提供扩展字库,向TTS的音库提供扩展音库。对来自外部存储器的图像文件,听书机可以直接进行OCR算法和TTS算法处理,对电子文档则可以直接进行TTS算法处理。字库里存储了文字字集,OCR处理时将从图像中抽取的文字特征与字集中的文字比对,字集中符合特征的文字就是识别出的文字。音库里存储的是音节或音节组的发音信息,TTS处理时从音库中调用与电子文档的文字相对应的音节或音节组,再根据文字的词语属性、前后的语法关系、在句子中的位置等,模拟人朗读文章的发声规律,调整音节或音节组发声的轻重缓急长短以及音节或音节组之间的衔接、停顿。通过扩展字库可以增加对更多国家、更多字体的文字的识别功能,通过扩展音库可以增加对更多语种的语言的合成功能。中央处理器通过网络接口与计算机网络通信,操作人可以远程控制听书机,向听书机发送操作指令,实时地获得远程图书的信息内容。
下面说明非展开式听书机和展开式听书机的特征:
I)非展开式听书机也称盒式听书机,是听书机的一种,其结构如图2所示,操作人位于图中标示的前边,将书本放在平台26的右上角。平台26、导轨6、导轨13、导轨18、导轨20、电机22固定在底板27上,导轨18、导轨20与平台的横边平行,导轨6、导轨13与平台的横边垂直,图像采集器16与平台纵向平行,翻页机构位于平台右上角的后边,采集器支持机构分布于平台周边,平台的底部留有横向贯穿其中线的通孔25,以供皮带21通过,各电机均与翻书机的控制电路连接。图像采集器16是一块横截面为梯形的内置CCD感光器件和光源的平板(其内部结构在图4中展示)。
翻页机构包括吸盘1、曲杆2、套筒3、电机4、滑块5、导轨6、螺纹杆7、电机8、夹板28和承页杆9、套筒10、电机11、滑块12、导轨13、螺纹杆14、电机15、夹板29。
吸盘1(其内部结构在图5中展示)固定于曲杆2上,曲杆垂直的部分带有螺纹,与套筒3内部的螺纹咬合,套筒3垂直地固定于电机4的旋转轴上,电机4固定于滑块5上,滑块5活动地安装在导轨6上,滑块5上留有与导轨6平行的内带螺纹的通孔,该通孔的螺纹与螺纹杆7的螺纹咬合,螺纹杆7固定于电机8的旋转轴上,电机8固定于导轨6上,夹板28垂直地固定于滑块5上,将曲杆2的水平部分夹住,使之不能左右摆动。
承页杆9的头部是水平的薄片,用于插进书页的间隙当中,承页杆垂直的部分带有螺纹,与套筒10内部的螺纹咬合,套筒10垂直地固定于电机11的旋转轴上,电机11固定于滑块12上,滑块12活动地安装在导轨13上,滑块12上留有与导轨13平行的内带螺纹的通孔,该通孔的螺纹与螺纹杆14的螺纹咬合,螺纹杆14固定于电机15的旋转轴上,电机15固定于导轨13上,夹板29垂直地固定于滑块12上,将承页杆9的水平部分夹住,使之不能左右摆动。
在螺纹传动的作用下,电机4带动套筒3正向或反向旋转时,吸盘将垂直上下运动,电机8带动螺纹杆7正向或反向旋转时,滑块5将沿导轨6水平前后运动,吸盘随之水平前后运动;同理,电机11控制承页杆垂直上下运动,电机15控制承页杆水平前后运动。
采集器支持机构包括支承杆17、导轨18、支承杆19、导轨20、皮带21、电机22、滑轮23(六只)、滑轮24(四只)、电机30、滑块31、电机32、滑块33。
图像采集器16水平地固定于支承杆17和支承杆19上(支承杆的放大图在图3中展示),支承杆底部的电机30、32通过调整支承杆的高度来调整图像采集器的高度,这两只支承杆分别固定于滑块31和滑块33上,滑块31和滑块33分别活动地安装在导轨18和导轨20上,四只滑轮24分别安装于导轨18和导轨20的端点上,六只滑轮23分别安装于通孔25的延伸线两端(其中一只固定于电机22的旋转轴上),皮带21由电机22牵引,嵌套在滑轮上,通过滑轮改变方向,联结在支承杆17和19,拉动图像采集器左右水平移动。
图3所示的是非展开式听书机的图像采集器的支承杆的放大图,在图3中,套筒34固定在电机的旋转轴上,套筒34内部的螺纹与螺纹杆35的螺纹咬合,开口向上的套筒36固定在螺纹杆35上,开口向下的套筒37与套筒36相互嵌套,两者的内部装有弹簧38,弹簧的上端固定在套筒37上,弹簧的下端固定在套筒36上,联结图像采集器的曲杆39固定在套筒37的上部。这样,支承杆可以通过其底部的电机调整图像采集器的高度,并且内嵌的弹簧可以缓冲图像采集器上下表面的书页的压力。
图4所示的是非展开式听书机的图像采集器16的内部结构,在图4中,图像采集器16的采集板的横截面略呈梯形,这是因为当采集板被书本夹住时,靠书脊的一边总是比对面的一边窄一点。在采集板内部,放置光源40,感光器件CCD阵列41和42上下对称分布,分别与ADC模数转换器43连接,模数转换器与采集板外部的存储器连接。采集板的上下表面与书页接触,光源40发出的光线照到书页后反射到CCD阵列上,光信号被转化成模拟的电信号,再经过模数转换器转换成数字量,存在存储器里。
吸盘1有吸取纸张、释放纸张、检验吸纸效果的功能,图5展示的是一种气压式吸盘的内部结构,它包括圆筒51、电机50、套筒49、螺纹杆48、活塞47、挡板46、压强传感器45、锥形吸盘口44,圆筒51垂直地固定于曲杆上,锥形吸盘口44固定于圆筒下端,在圆筒的内部,电机50固定于圆筒上端,套筒49固定于电机50的转动轴上,其内部的螺纹与螺纹杆48的螺纹咬合,螺纹杆48活动地安装于活塞47上,活塞47与圆筒51的内壁紧密接触,圆环状的挡板46位于活塞的下面,固定于圆筒的内壁,压强传感器45位于挡板46的下面,也固定于圆筒的内壁,用于测量吸盘口内的气压强度,压强传感器、电机50与翻书机控制电路连接,电机50旋转时带动活塞上下运动。吸取纸张时,锥形吸盘口44压到纸面上,活塞自下向上走,同时检查压强传感器的测量值,看是否小于大气压,如果是,则说明纸张被吸到了吸盘上,如果不是则说明吸盘口和纸张之间出现了空隙,需加大吸盘口对纸面的压力,同时继续向上拉活塞;释放纸张时,活塞自上向下走。
开机前,吸盘1、承页杆9、图像采集器16处于各自活动范围的最低点,并且,吸盘1、承页杆9处于各自活动范围的最后点,图像采集器16处于它活动范围的最右点,以后根据电机4、电机11、电机30和32的转数分别可以推断吸盘、承页杆、图像采集器在运动时相对于各自的最低点的高度,根据电机22的转数可以推断图像采集器相对于它的最右点的距离。开机后,承页杆升到它的最高点,向前走,再下降压到书的封面上,测得书本的总厚度。关机后,吸盘、承页杆、图像采集器返回各自在开机前的状态。
操作人输入目标页码时,吸盘压在当前页面上,承页杆支承着吸盘上面的书页,接下来:如果页码差,即目标页码减去当前页码的差(在默认工作流程中这个值为1)大于零且小于三十则逐页翻动,否则粗翻。逐页翻动只能向页码大的页翻;粗翻分为向下翻和向上翻,如果页码差不小于三十则向下粗翻,如果小于零则向上粗翻。
粗翻的实施过程是,翻书机的控制电路先估算出页码差对应的书页的厚度Y,承页杆下降至当前页面,然后水平地往后撤离书本,接下来:如果是向下粗翻,则承页杆向下降,下降的距离比Y稍小一点;如果是向上粗翻,则吸盘上升(但不吸纸)、向后撤,再向前走、下降,压到封面上,承页杆向上升,上升的距离比Y稍大一点(这是为了使目标页码在承页杆的下方,以便进行后面的逐页翻动)。然后,承页杆向前进,其头部的薄片插进书页中(因为吸盘本来就压在上边的页面,所以承页杆头部薄片的上方和吸盘的下方的书页之间的空隙被压缩到最小,这提高了粗翻的精度),承页杆头部薄片的当前高度被控制电路记录下来(这用于图像采集时调整采集器的高度),然后,吸盘抬起来(但不吸纸)、向后撤离书本,承页杆将自己上方的书页抬升起来,为图像采集作准备。
逐页翻动的实施过程是,翻书机的控制电路先根据页码差计算出待翻的张数(即次数),吸盘吸取当前页提起来,曲杆2接近承页杆上面的书页时,承页杆往后退,把自己上面的书页交由曲杆2支承。然后,承页杆向下降,再向前进,吸盘释放书页,承页杆将该书页承接并上升,将曲杆2上面的书页也支承起来。然后,吸盘向下降,压在下一张书页上并将其吸取,重复前面的运动。重复了指定的次数后,吸盘抬起来(但不吸纸)往后撤离书本,承页杆下降压到当前页面上再重新抬升起来(这为的是测量当前页面的高度),为图像采集做准备。
图像采集的实施过程是,完成了指定张数的逐页翻动或完成了一次粗翻之后,图像采集器的高度调整到与当前页面相等,然后向书本内部平移,从承页杆的下方经过,直至书脊的内部。然后,承页杆下降到当前页面,再往后退使其支承的书页轻落到图像采集器上,这样图像采集器就被书本夹在中间。然后,吸盘向前进、下降,轻压在书本的封面上,使图像采集器与书页充分接触。接着,翻书机的控制电路向中央处理器发送标志信号,中央处理器启动图像采集器的摄像功能,图像采集器同时向书本外缘平移,对与它上下接触的两页书进行扫描,所获得的图像数据被录入存储器中并送至中央处理器。当图像采集器刚从承页杆前边经过时,承页杆向前进,插进图像采集器后面的书页间隙中,图像采集器移出书本外缘之后,摄像功能被关闭,吸盘向后退,承页杆将书页抬升起来,吸盘再向前进、下降,压在当前页面上,为以后的翻书做准备。
II)展开式听书机也称台式听书机,是听书机的一种,其结构如图6所示,平台79固定于底板80的前部,平台上印刻的中轴线77与底板80的中线重合,用于对书本限位的挡板78固定于平台的右上方,操作人位于平台的前边,将(闭合的)书本放在平台上,书本后侧贴紧挡板78,书脊对准中轴线77。竖杆76、电机75、电机58、电机67固定地排列于底板中线的后部,翻页机构、采集器支持机构位于平台的后边,各电机均与翻书机的控制电路连接。
翻页机构包括吸盘1、曲杆52、套筒53、螺纹杆54、电机55、竖杆56、平板57、电机58和薄片59、压页块60、分页杆61、套筒62、螺纹杆63、电机64、竖杆65、平板66、电机67。
吸盘1固定在曲杆52上,曲杆52固定于套筒53上,套筒53内部的螺纹与螺纹杆54的螺纹咬合,螺纹杆54垂直地固定于电机55的转动轴上,竖杆56、电机55固定在平板57上,一个开有圆孔的薄板固定于套筒53的下部,竖杆56从圆孔中穿过。这样,当电机55带动螺纹杆54旋转时,将使套筒53、吸盘垂直上下运动。平板57固定在电机58的转动轴,因此吸盘可在电机58的操纵下做水平的圆周运动。
薄片59呈圆角矩形,水平地固定于分页杆61的前端,压页块60垂直地固定于分页杆前部的下方(分页杆的放大图在图7中展示),分页杆61固定于套筒62上,套筒62内部的螺纹与螺纹杆63的螺纹咬合,螺纹杆63垂直地固定于电机64的转动轴上,竖杆65、电机64固定在平板66上,一个开有圆孔的薄板固定于套筒62的下部,竖杆65从圆孔中穿过。这样,当电机64带动螺纹杆63旋转时,将使套筒62、分页杆61、薄片59、压页块60垂直上下运动。平板66固定在电机67的转动轴,因此分页杆、薄片、压页块可在电机67的操纵下做水平的圆周运动。
采集器支持机构包括滑块69、螺纹杆70、电机71、支承杆72、套筒73、螺纹杆74、电机75、竖杆76。
支承杆72呈弯形,它的投影位于底板80的中线上,图像采集器68是一台数码相机,固定于滑块69上,滑块上有两个通孔,下面一个套在支承杆72的水平部分上,上面一个内带螺纹,与螺纹杆70的螺纹咬合,螺纹杆70水平地固定于电机71的旋转轴上,电机71固定于支承杆72上。这样,电机71旋转时,将带动滑块69和数码相机沿支承杆72做水平的前后运动。支承杆72的垂直部分固定于套筒73上,套筒73内部的螺纹与螺纹杆74的螺纹咬合,螺纹杆74垂直地固定于电机75的旋转轴上,一个开有圆孔的薄板固定于套筒73的下部,竖杆76从圆孔中穿过。这样,在电机75旋转时,套筒73、支承杆72、数码相机将垂直上下运动。
展开式听书机的吸盘1同样可采用图5所示的气压式吸盘。图7所示的是图6中的分页杆61的放大图,在图7中,圆角矩形的薄片59水平地固定于分页杆61的前端,压页块60是透明的,左右对称的轮廓线形似书脊内部的轮廓,它垂直地固定在分页杆前部的下方。翻书后,书的左右两瓣可能严重拱起而不利于摄像,利用压页块60压在书脊内部可以使将左右两瓣书页充分分开,以便于图像采集。
开机前,吸盘1、分页杆61、数码相机68处于各自活动范围的最低点,吸盘、分页杆处于各自活动范围的最右点,数码相机处于它活动范围的最后点,以后根据电机55、电机64、电机75的转数就可以推断吸盘、分页杆、数码相机在运动时相对于各自的最低点的高度,根据电机71的转数可推断数码相机相对它的最后点的距离,根据电机58和电机67的转数可推断吸盘和分页杆旋转的位移。开机后,分页杆升到它的最高点,向内旋(即向中轴线77方向),再下降,使薄片59压在书本的封面上,测量书本的总厚度。关机后,吸盘、分页杆、数码相机返回各自在开机前的状态。
操作人输入目标页码时,如果页码差大于零则是向左翻,吸盘1、分页杆61旋转到中轴线77的右边,小于零则是向右翻,吸盘、分页杆旋转到中轴线的左边。如果页码差的绝对值大于三十则进行粗翻,否则逐页翻动。
粗翻的实施过程是,控制电路先估算出页码差对应的书页的厚度Y,分页杆61下降,使薄片59压在当前页面上,然后水平外旋退离书本,再垂直下降Y的距离,等吸盘向下降并压在当前页面上之后,分页杆内旋使薄片59插进书页当中,然后,吸盘抬起来(但不吸纸),分页杆将自己上方的书页抬升起来之后再旋转到中轴线上方,使书页被拨到中轴线的另一边。
逐页翻动的实施过程是,控制电路先根据页码差计算出待翻的张数,吸盘1吸取当前页提起来直至分页杆61的高度之上,然后分页杆内旋至吸盘之下,吸盘释放书页,分页杆承接书页,旋转至中轴线77上方,使该书页被拨至中轴线另一边。然后,分页杆旋转返回,吸盘下降并吸取下一页提起来。重复以上运动直至达到指定张数。
图像采集的实施过程是,刚开机时,将数码相机68调到它的最高点,对平台79上的书本预拍照一张,图像数据送至中央处理器,计算出书本的长宽尺寸,翻书机控制电路根据该长宽尺寸,前后水平地调整数码相机的位置,使它的投影在书脊的中心,同时调整数码相机的高度,使它刚好能拍下整幅翻开的书。完成了指定张数的逐页翻动或完成了一次粗翻之后,吸盘外旋退离书本,分页杆旋到中轴线的上方再向下降,使压页块60压在书脊内部。翻书机控制电路向中央处理器发送信号,中央处理器启动数码相机对书本拍照,所得的图像数据被存储并送回中央处理器。
Claims (8)
1. 听书机,一种翻动印刷品并将印刷品上的文字内容转化成电子文档和语音文件的电子机器,其特征是:它包括中央处理器、图像采集器、翻书机、扬声器、显示屏、外部存储器接口、网络接口,其中翻书机包括控制电路、采集器支持机构、翻页机构,图像采集器、翻书机的控制电路、扬声器、显示屏、外部存储器接口、网络接口与中央处理器连接,图像采集器安装在采集器支持机构上,翻书机的控制电路与翻页机构、采集器支持机构连接,中央处理器采用OCR算法对图像采集器摄取的图像数据进行字符识别,采用TTS算法对字符识别结果进行语音合成,中央处理器通过网络接口与计算机网络通信。
2. 根据权利要求1所述的听书机,其特征是:它包括展开式听书机和非展开式听书机,展开式听书机进行图像采集时将书本完全展开,非展开式听书机进行图像采集时将图像采集器伸进书本内部进行扫描式采集。
3. 根据权利要求1所述的听书机,其特征是:它对检索名进行搜索时,首先从目录页的章节名中查找出与之匹配的内容并将对应的页码传给翻书机,翻到该页朗读,如果目录页中没有匹配的内容则在书本中逐页查找,找到后再朗读;朗读时,加进背景音乐,在显示屏上同步地显示文字。
4. 根据权利要求1所述的听书机,其特征是:中央处理器对书页图像的周边进行局部图像处理,识别出书页的页码并传给翻书机,翻书机计算当前页码与目标页码的差距,如果差距大则估算待翻的书页的厚度,对书本进行粗翻,如果差距小则计算待翻的书页的张数,对书本逐页翻动相应的张数。
5. 根据权利要求1所述的听书机,其特征是:非展开式听书机的图像采集器(16)是一块横截面为梯形的内置感光器件(41)、(42)和光源(40)的平板,感光器件(41)、(42)在其内部上下对称分布。
6. 根据权利要求1所述的听书机,其特征是:在非展开式听书机的结构中,平台(26)、导轨(6)、导轨(13)、导轨(18)、导轨(20)、电机(22)固定在底板(27)上,导轨(18)、导轨(20)与平台的横边平行,导轨(6)、导轨(13)与平台的横边垂直,图像采集器(16)与平台纵向平行,翻页机构位于平台右上角的后边,采集器支持机构分布于平台周边,各电机均与翻书机的控制电路连接;
翻页机构包括吸盘(1)、曲杆(2)、电机(4)、滑块(5)、导轨(6)、电机(8)和承页杆(9)、电机(11)、滑块(12)、导轨(13)、电机(15),吸盘(1)固定于曲杆(2)上,承页杆(9)的头部是水平的薄片,电机(4)控制吸盘垂直上下运动,电机(8)控制吸盘水平前后运动,电机(11)控制承页杆垂直上下运动,电机(15)控制承页杆水平前后运动;
采集器支持机构包括支承杆、导轨、滑块、电机,图像采集器水平地固定于支承杆上,通过电机控制图像采集器的高度及左右水平运动。
7. 根据权利要求1所述的听书机,其特征是:在展开式听书机的结构中,图像采集器(68)是一台数码相机,平台(79)固定于底板(80)的前部,平台上印刻中轴线(77),用于对书本限位的挡板(78)固定于平台的右上方,竖杆(76)、电机(75)、电机(58)、电机(67)固定地排列于底板中线的后部,翻页机构、采集器支持机构位于平台的后边,各电机均与翻书机的控制电路连接;
翻页机构包括吸盘(1)、曲杆(52)、电机(55)、电机(58)和薄片(59)、压页块(60)、分页杆(61)、电机(64)、电机(67),吸盘(1)固定在曲杆(52)上,薄片(59)呈圆角矩形,水平地固定于分页杆(61)的前端,压页块(60)是透明的,左右对称的轮廓线形似书脊内部的轮廓,它垂直地固定于分页杆(61)前部的下方,电机(55)控制吸盘垂直上下运动,电机(58)控制吸盘做水平的圆周运动,电机(64)控制分页杆、薄片、压页块垂直上下运动,电机(67)控制分页杆、薄片、压页块做水平的圆周运动;
采集器支持机构包括滑块(69)、螺纹杆(70)、电机(71)、支承杆(72)、电机(75),支承杆(72)呈弯形,它的投影位于底板(80)的中线上,图像采集器(68)固定于滑块(69)上,电机(71)控制图像采集器(68)做水平的前后运动,电机(75)控制图像采集器(68)垂直上下运动。
8. 根据权利要求1所述的听书机,其特征是:它的翻书机采用吸盘式翻页机构,吸盘(1)采用气压式吸盘,气压式吸盘包括圆筒(51)、电机(50)、螺纹杆(48)、活塞(47)、压强传感器(45)、锥形吸盘口(44),锥形吸盘口(44)固定于圆筒(51)下端,螺纹杆(48)活动地安装于活塞(47)上,活塞(47)与圆筒的内壁紧密接触,压强传感器测量锥形吸盘口(44)内部的气压强度,电机(50)控制活塞上下运动,压强传感器、电机(50)与翻书机控制电路连接。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CNU2007200006766U2007200006766U CN201097383Y (zh) | 2007-01-12 | 2007-01-12 | 听书机 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CNU2007200006766U2007200006766U CN201097383Y (zh) | 2007-01-12 | 2007-01-12 | 听书机 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN201097383Y true CN201097383Y (zh) | 2008-08-06 |
Family
ID=39924436
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CNU2007200006766U2007200006766U Expired - Fee Related CN201097383Y (zh) | 2007-01-12 | 2007-01-12 | 听书机 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN201097383Y (zh) |
Cited By (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102376174A (zh) * | 2011-11-18 | 2012-03-14 | 吴江诚达电子科技有限公司 | 一种书签 |
| CN103052979A (zh) * | 2010-07-06 | 2013-04-17 | 星火有限公司 | 用于提升读书体验的方法和系统 |
| CN103761892A (zh) * | 2014-01-20 | 2014-04-30 | 广东小天才科技有限公司 | 一种语音播放纸质书籍内容的方法及装置 |
| CN103763453A (zh) * | 2013-01-25 | 2014-04-30 | 陈旭 | 一种图文采集识别装置 |
| CN104029526A (zh) * | 2014-06-28 | 2014-09-10 | 田家林 | 一种带有语音识别和扫描读字的自动翻书装置 |
| CN104835361A (zh) * | 2014-02-10 | 2015-08-12 | 陈旭 | 一种电子词典 |
| CN107256647A (zh) * | 2017-08-17 | 2017-10-17 | 重庆华凤衣道文化创意有限公司 | 一种可折叠便携式免看自动翻页阅读器 |
| CN107886787A (zh) * | 2017-12-28 | 2018-04-06 | 贵州大学 | 变看书为听书的装置 |
| CN110576693A (zh) * | 2019-09-25 | 2019-12-17 | 黄苏丹 | 一种书籍翻页语音播放设备 |
| CN111050017A (zh) * | 2013-01-25 | 2020-04-21 | 陈旭 | 图文拍照设备 |
| CN111276017A (zh) * | 2020-01-21 | 2020-06-12 | 上海万得维进出口有限公司 | 基于智能标记实现针对学生进行自助家默控制的系统及其方法 |
| CN112259074A (zh) * | 2020-09-21 | 2021-01-22 | 北京麦哲科技有限公司 | 一种基于高拍仪获得语音播放方法和系统 |
| CN114299524A (zh) * | 2021-11-18 | 2022-04-08 | 珠海读书郎软件科技有限公司 | 基于页面图像的页码识别方法、存储介质和计算机设备 |
-
2007
- 2007-01-12 CN CNU2007200006766U2007200006766U patent/CN201097383Y/zh not_active Expired - Fee Related
Cited By (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103052979A (zh) * | 2010-07-06 | 2013-04-17 | 星火有限公司 | 用于提升读书体验的方法和系统 |
| US10220646B2 (en) | 2010-07-06 | 2019-03-05 | Sparkup Ltd. | Method and system for book reading enhancement |
| CN102376174A (zh) * | 2011-11-18 | 2012-03-14 | 吴江诚达电子科技有限公司 | 一种书签 |
| CN103763453B (zh) * | 2013-01-25 | 2019-09-10 | 陈旭 | 一种图文采集识别装置 |
| CN103763453A (zh) * | 2013-01-25 | 2014-04-30 | 陈旭 | 一种图文采集识别装置 |
| CN111429767A (zh) * | 2013-01-25 | 2020-07-17 | 陈旭 | 一种图文拍照识别设备 |
| CN111050017A (zh) * | 2013-01-25 | 2020-04-21 | 陈旭 | 图文拍照设备 |
| CN103761892A (zh) * | 2014-01-20 | 2014-04-30 | 广东小天才科技有限公司 | 一种语音播放纸质书籍内容的方法及装置 |
| CN103761892B (zh) * | 2014-01-20 | 2016-02-03 | 广东小天才科技有限公司 | 一种语音播放纸质书籍内容的方法及装置 |
| CN104835361A (zh) * | 2014-02-10 | 2015-08-12 | 陈旭 | 一种电子词典 |
| CN104029526A (zh) * | 2014-06-28 | 2014-09-10 | 田家林 | 一种带有语音识别和扫描读字的自动翻书装置 |
| CN107256647A (zh) * | 2017-08-17 | 2017-10-17 | 重庆华凤衣道文化创意有限公司 | 一种可折叠便携式免看自动翻页阅读器 |
| CN107886787A (zh) * | 2017-12-28 | 2018-04-06 | 贵州大学 | 变看书为听书的装置 |
| CN110576693A (zh) * | 2019-09-25 | 2019-12-17 | 黄苏丹 | 一种书籍翻页语音播放设备 |
| CN111276017A (zh) * | 2020-01-21 | 2020-06-12 | 上海万得维进出口有限公司 | 基于智能标记实现针对学生进行自助家默控制的系统及其方法 |
| CN112259074A (zh) * | 2020-09-21 | 2021-01-22 | 北京麦哲科技有限公司 | 一种基于高拍仪获得语音播放方法和系统 |
| CN114299524A (zh) * | 2021-11-18 | 2022-04-08 | 珠海读书郎软件科技有限公司 | 基于页面图像的页码识别方法、存储介质和计算机设备 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN201097383Y (zh) | 听书机 | |
| US10741167B2 (en) | Document mode processing for portable reading machine enabling document navigation | |
| US7505056B2 (en) | Mode processing in portable reading machine | |
| US8711188B2 (en) | Portable reading device with mode processing | |
| US8531494B2 (en) | Reducing processing latency in optical character recognition for portable reading machine | |
| US9626000B2 (en) | Image resizing for optical character recognition in portable reading machine | |
| US8626512B2 (en) | Cooperative processing for portable reading machine | |
| US8320708B2 (en) | Tilt adjustment for optical character recognition in portable reading machine | |
| EP2311018B1 (en) | Aiding device for reading a printed text | |
| US20060013483A1 (en) | Gesture processing with low resolution images with high resolution processing for optical character recognition for a reading machine | |
| US20110066424A1 (en) | Text Stitching From Multiple Images | |
| US20150043822A1 (en) | Machine And Method To Assist User In Selecting Clothing | |
| US20100266205A1 (en) | Device and Method to Assist User in Conducting A Transaction With A Machine | |
| CN109448453B (zh) | 基于图像识别追踪技术的点读问答方法与系统 | |
| US8249309B2 (en) | Image evaluation for reading mode in a reading machine | |
| US20060006235A1 (en) | Directed reading mode for portable reading machine | |
| WO2005096760A2 (en) | Portable reading device with mode processing | |
| CN206226557U (zh) | 折叠式认证高拍仪 | |
| KR20170005720A (ko) | 도서 내용 점자 출력 장치 | |
| Saleous et al. | Read2Me: A cloud-based reading aid for the visually impaired | |
| CN210428454U (zh) | 一种图书馆的翻译阅读桌 | |
| CN201004322Y (zh) | 纸质文字数码摘录存储笔 | |
| CN112435543A (zh) | 一种盲人智能识别设备 | |
| CN2849868Y (zh) | 电子学习系统 | |
| CN115762257A (zh) | 一种多模态英语教学装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C14 | Grant of patent or utility model | ||
| GR01 | Patent grant | ||
| C17 | Cessation of patent right | ||
| CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080806 Termination date: 20100219 |