CN110855849A - 一种扫描设备及其激光指向扫描方法 - Google Patents
一种扫描设备及其激光指向扫描方法 Download PDFInfo
- Publication number
- CN110855849A CN110855849A CN201911005914.6A CN201911005914A CN110855849A CN 110855849 A CN110855849 A CN 110855849A CN 201911005914 A CN201911005914 A CN 201911005914A CN 110855849 A CN110855849 A CN 110855849A
- Authority
- CN
- China
- Prior art keywords
- laser
- scanning
- picture book
- image
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 239000000284 extract Substances 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 4
- 239000011521 glass Substances 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
- H04N1/00209—Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/0035—User-machine interface; Control console
- H04N1/00405—Output means
- H04N1/00488—Output means providing an audible output to the user
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/024—Details of scanning heads ; Means for illuminating the original
- H04N1/028—Details of scanning heads ; Means for illuminating the original for picture information pick-up
- H04N1/02815—Means for illuminating the original, not specific to a particular type of pick-up head
- H04N1/0282—Using a single or a few point light sources, e.g. a laser diode
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Optics & Photonics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Laser Beam Processing (AREA)
Abstract
本发明公开了一种扫描设备及其激光指向扫描方法,包括扫描台、以及设置在扫描台一侧的图像采集装置,扫描台一侧靠近图像采集装置处设置有激光发生装置,图像采集装置和激光发生装置连接至计算机;图像采集装置用于采集扫描台上的待扫描绘本以获取绘本图像;激光发生装置用于发射激光指向点,并可控制激光指向点打在扫描台的任意位置上;计算机基于绘本图像以提取绘本图像中的文字信息,将文字信息转换成语音信息进行播放,并根据语音信息的播放进度控制激光发生装置的激光指向点打在待扫描绘本对应的目标文字上。本发明具有提高使用便利性的特点。
Description
技术领域
本发明涉及图像扫描识别的技术领域,特别涉及一种扫描设备及其激光指向扫描方法。
背景技术
随着视频采集和处理技术的发展,扫描仪已从传统的光敏扫描仪升级到了主要基于视频图像采集的新一代图像采集扫描仪,这种新型扫描仪通过位于扫描物上方的摄像头采集书页照片即可完成扫描,免去了人工将待扫描的印刷品按压在扫描面的传统扫描方式带来的繁重工作量,具有扫描速度快的巨大优势。
目前市场上出现了一种扫描设备,包括扫描台以及设置在扫描台一侧的图像采集装置,通过将待扫描绘本放置在扫描台上压平,图像采集装置采集到待扫描绘本上的绘本图像,进而将绘本图像传输到计算机中,计算机利用OCR文字识别软件能够对绘本图像进行处理,提取绘本图像上的文字,利用上述扫描设备能够完成待扫描绘本的扫描工作。
其中,在后续环节中,特别是需要语音输出待扫描绘本上的文字时,通过文字转换语音软件能够将提取出的文字转换成语音播放的形式输出,以方便用户学习使用。申请人在学习使用中发现,语音转换成文字输出后,需要将文字与语音结合起来学习观看时,用户往往听着语音播放无法得知所处的文字段落位置,导致扫描设备的使用便利性较低,因此存在一定的改进之处。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种扫描设备,能在一定程度上提高使用便利性。
本发明的上述技术目的是通过以下技术方案得以实现的:
一种扫描设备,包括扫描台、以及设置在扫描台一侧的图像采集装置,所述扫描台一侧靠近图像采集装置处设置有激光发生装置,所述图像采集装置和激光发生装置连接至计算机;
所述图像采集装置用于采集扫描台上的待扫描绘本以获取绘本图像;
所述激光发生装置用于发射激光指向点,并可控制激光指向点打在扫描台的任意位置上;
所述计算机基于绘本图像以提取绘本图像中的文字信息,将文字信息转换成语音信息进行播放,并根据语音信息的播放进度控制激光发生装置的激光指向点打在待扫描绘本对应的目标文字上。
优选的,所述激光发生装置包括主控芯片、激光器、X轴电机驱动器、Y轴电机驱动器、X轴振镜和Y轴振镜;
所述主控芯片连接于计算机,所述激光器、X轴电机驱动器和Y轴电机驱动器连接于主控芯片,所述X轴振镜和Y轴振镜受控于X轴电机驱动器和Y轴电机驱动器的脉冲信号进行摆动以调整激光器所发出激光指向点在扫描台上的位置。
优选的,所述激光发生装置包括激光器、摆动驱动机构和主控芯片;
所述摆动驱动机构包括安装架、固定在安装架上的X轴驱动电机、以及固定在X轴驱动电机输出轴上的Y轴驱动电机;
所述激光器固定在Y轴驱动电机的输出轴上,所述X轴驱动电机通过X轴电机驱动器连接于主控芯片,所述Y轴驱动电机通过Y轴电机驱动器连接于主控芯片,所述激光器连接于主控芯片,所述主控芯片连接于计算机。
针对现有技术存在的不足,本发明的目的在于提供一种应用上述技术方案中扫描设备的激光指向扫描方法,能在一定程度上提高使用便利性。
本发明的上述技术目的是通过以下技术方案得以实现的:
一种应用如上述技术方案所述扫描设备的激光指向扫描方法,包括如下步骤:
在扫描台上放置待扫描绘本以位于图像采集装置的图像采集范围中后,获取图像采集装置采集的待扫描绘本的绘本图像;
识别并提取绘本图像中的文字信息;
将文字信息转换成语音信息进行播放,并根据语音信息的播放进度控制激光发生装置的激光指向点打在待扫描绘本对应的目标文字上。
优选的,在识别并提取绘本图像中的文字信息中,包括如下步骤:
根据预建立的透视畸变变换矩阵对绘本图像进行拉伸修正;
通过OCR文字识别软件对拉伸修正后的绘本图像进行识别,提取拉伸修正后的绘本图像中的文字信息。
优选的,预建立的透视畸变变换矩阵,包括如下步骤:
将预先打印好的网格标定图纸放置在水平放置的扫描台上,其中,网格标定图纸在其四个角落分别设置有标定点;
获取网格标定图纸的标定图像,测量标定图像中标定点之间的像素距离;
测量网格标定图纸的标定点之间的实际物理距离;
基于网格标定图纸中标定点之间的实际物理距离,对标定图像进行拉伸和调整,确定拉伸和调整的参数以形成透视畸变变换矩阵。
优选的,在识别并提取绘本图像中的文字信息之后,包括如下步骤:
基于图像采集装置的图像采集范围建立x-y坐标系;
记录激光指向点打在x-y坐标系中每个坐标点位上激光发生装置所需的脉冲信号,生成每个坐标点位与脉冲信号相对应的坐标脉冲链表;
获取绘本图像中文字信息每个文字所在x-y坐标系中的文字坐标点位。
优选的,在将文字信息转换成语音信息进行播放,并根据语音信息的播放进度控制激光发生装置的激光指向点打在待扫描绘本对应的目标文字上之中,包括如下步骤:
基于提取出的绘本图像中的文字信息,通过文字转换语音软件将文字信息转换成语音信息进行播放;
根据语音信息的当前播放进度,判定当前播放进度在文字信息中所对应的目标文字;
基于目标文字的文字坐标点位以在坐标脉冲链表中查询所对应的脉冲信号;
激光发生装置根据脉冲信号控制激光指向点移动以打在待扫描绘本对应的目标文字上。
综上所述,本发明对比于现有技术的有益效果为:
本发明通过在扫描设备上设置激光发生装置,将待扫描绘本放置在扫描台上后,图像采集装置能够采集待扫描绘本的绘本图像,进而能够将绘本图像中的文字信息进行识别并提取后,将文字信息以语音信息的形式进行播放,在语音信息播放的同时能够将激光指向点打在待扫描绘本对应的目标文字上;
通过本申请的设置,方便用户在听语音信息的同时,能够时刻知晓语音信息在待扫描绘本上的所指向的文字,从而方便用户进行学习,提高用户对于扫描设备的使用便利性。
附图说明
图1为本发明技术方案中扫描设备的结构示意图;
图2为本发明技术方案中其中一个实施例的激光发生装置的结构示意图;
图3为本发明技术方案中另一个实施例的激光发生装置的第一结构示意图;
图4为本发明技术方案中另一个实施例的激光发生装置的第二结构示意图;
图5为本发明技术方案中激光指向扫描方法的流程示意图;
图6为本发明技术方案中网格标定图纸的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术中扫描设备扫描待扫描绘本后以获取绘本图像,进而能够提取出绘本图像中的文字信息,将文字信息转换成语音信息进行播放,从而用户无需看待扫描绘本,通过听语音信息即可获得待扫描绘本上的内容。
但语音信息在播放过程中,用户无法得知语音信息对应到待扫描绘本上的文字位置,进而使得用户体验感较差,该扫描设备的使用便利性有待提高。
因此,申请人针对于上述技术内容,提出了一种扫描设备,该扫描设备用户在听语音信息的同时,能够时刻知晓语音信息在待扫描绘本上的所指向的文字,从而方便用户进行学习,提高用户对于扫描设备的使用便利性。
结合图1和图2所示,扫描设备包括扫描台、图像采集装置和激光发生装置。扫描台呈方形台体,扫描台水平设置且扫描台的表面平整。扫描台的一侧固定设置有支架,支架可拆卸设置在扫描台上,在本实施例中,支架与扫描台之间的拆卸方式为螺栓连接。其中,支架垂直于扫描台的表面,并且支架位于扫描台的一个侧边上。
图像采集装置设置在支架上,图像采集装置的图像采集范围打在扫描台上,图像采集装置采用工业摄像机,图像采集装置安装好后,保持图像采集装置的图像采集范围的中心轴线位于扫描台的中心点上,并将图像采集范围尽可能覆盖扫描台表面。
在一个实施例中,图像采集装置可在支架上转动以在任意位置上停留,以调整其图像采集范围在扫描台上的位置。在另一个实施例中,图像采集装置固定在支架上,其图像采集范围在扫描台上的位置。在本实施例中,图像采集装置以固定在支架上进行阐述说明。
激光发生装置设置在支架上,在一个实施例中,激光发生装置与图像采集装置位于同一水平线上。在另一个实施例中,激光发生装置靠近图像采集装置且位于图像采集装置的下方。在本实施例中,以激光发生装置位于图像采集装置下方为例进行说明。
值得说明的是,图像采集装置和激光发生装置连接至计算机。图像采集装置和激光发生装置可通过RS232接口连接在计算机上。在扫描台上放置待扫描绘本后,待扫描绘本包括但不限于为教科书、字典、杂志、期刊等,其中,待扫描绘本位于图像采集装置的图像采集范围中,图像采集装置用于采集扫描台上的待扫描绘本以获取绘本图像,并将绘本图像发送至计算机。
激光发生装置用于发射激光指向点,并可控制激光指向点打在扫描台的任意位置上。由此,计算机基于绘本图像以提取绘本图像中的文字信息,将文字信息转换成语音信息进行播放,并根据语音信息的播放进度控制激光发生装置的激光指向点打在待扫描绘本对应的目标文字上。
具体地,在识别并提取绘本图像中的文字信息之后,计算机将基于图像采集装置的图像采集范围建立x-y坐标系,在本实施例中,图像采集范围为方形形状,x-y坐标系的原点以图像采集范围的其中一个角为例进行说明。
建立好x-y坐标系后,计算机记录激光指向点打在x-y坐标系中每个坐标点位上激光发生装置所需的脉冲信号,生成每个坐标点位与脉冲信号相对应的坐标脉冲链表。并进一步获取绘本图像中文字信息每个文字所在x-y坐标系中的文字坐标点位。
基于提取出的绘本图像中的文字信息,通过文字转换语音软件将文字信息转换成语音信息进行播放;根据语音信息的当前播放进度,判定当前播放进度在文字信息中所对应的目标文字;基于目标文字的文字坐标点位以在坐标脉冲链表中查询所对应的脉冲信号;激光发生装置根据脉冲信号控制激光指向点移动以打在待扫描绘本对应的目标文字上。
由此,本发明通过在扫描设备上设置激光发生装置,将待扫描绘本放置在扫描台上后,图像采集装置能够采集待扫描绘本的绘本图像,进而能够将绘本图像中的文字信息进行识别并提取后,将文字信息以语音信息的形式进行播放,在语音信息播放的同时能够将激光指向点打在待扫描绘本对应的目标文字上,能够时刻知晓语音信息在待扫描绘本上的所指向的文字,从而方便用户进行学习,提高用户对于扫描设备的使用便利性。
其中,激光发生装置可以受控于计算机的控制指令,以控制其激光指向点移动。
在一个实施例中,如图2所示,激光发生装置包括安装壳体、以及设置在安装壳体中的主控芯片、激光器、X轴电机驱动器、Y轴电机驱动器、X轴振镜和Y轴振镜,安装壳体固定在支架上。
主控芯片通过RS232接口连接于计算机,激光器、X轴电机驱动器和Y轴电机驱动器连接于主控芯片,X轴振镜和Y轴振镜受控于X轴电机驱动器和Y轴电机驱动器输出的脉冲信号进行摆动,以调整激光器所发出激光指向点在扫描台上的位置。主控芯片可采用STM32F103高性能单片机,用于接收计算机控制指令并解码,控制激光器的开关、通过X轴电机驱动器控制X轴振镜转动、以及通过Y轴电机驱动器控制Y轴振镜转动。
激光器可采用市售普通小功率激光器,X轴振镜包括X轴步进电机和X轴玻璃平面镜,Y轴振镜包括Y轴步进电机和Y轴玻璃平面镜,X轴步进电机和Y轴步进电机采用行星减速步进电机,减速比为1:99.5。
X轴电机驱动器和Y轴电机驱动器采用HBS3128A高细分步进电机驱动器,用于将主控芯片的输出转换为能够驱动X轴步进电机和Y轴步进电机的脉冲信号。
通过X轴振镜和Y轴振镜的转动完成对激光器发出的激光线束的反射,激光线束打在扫描台上形成激光指向点,进而实现激光指向点在扫描台上的移动。其中,X轴步进电机配合以X轴电机驱动器,Y轴步进电机配合以Y轴电机驱动器,能够使得激光指向点打在扫描台上的位置达到小于等于0.0013mm的定位精度。
X轴电机驱动器和Y轴电机驱动器输出驱动X轴步进电机和Y轴步进电机的脉冲信号,X轴步进电机和Y轴步进电机驱使X轴平面镜和Y轴平面镜转动以使得激光指向点打在其中一个坐标点位上,上述坐标脉冲链表所记录的就是,脉冲信号和坐标点位关联关系。即一个坐标点位对应一个X轴电机驱动器输出的脉冲信号以及Y轴电机驱动器输出的脉冲信号。
即,若x-y坐标系中其中一个坐标点位为(10,10),那么需要将激光指向点打在坐标点位(10,10)上需要X轴电机驱动器输出对应的脉冲信号以及Y轴电机驱动器输出对应的脉冲信号。因此,只需要将图像采集装置保持实时采集状态(激光指向点将会被在图像采集装置采集的图像中出现),通过控制激光指向点从扫描台的其中一个边角开始移动,以移动到坐标点位(10,10)后,得到X轴电机驱动器输出的脉冲信号以及Y轴电机驱动器输出的脉冲信号,将上述X轴电机驱动器和Y轴电机驱动器的脉冲信号与坐标点位进行关联记录即可。由此,遍历x-y坐标系的每个坐标点位,将脉冲信号与每个坐标点位关联记录,即可得到所述坐标脉冲链表。
只需要保持图像采集装置的不产生移动,图像采集装置发出的图像采集范围在扫描台上的位置不产生变化,记录好的坐标脉冲链表即可进行后续使用。若图像采集装置发出的图像采集范围在扫描台上的位置产生变化,则需要重新按照上述方式记录生成坐标脉冲链表。
在另一个实施例中,结合图3和图4所示,激光发生装置包括激光器、摆动驱动机构和主控芯片。摆动驱动机构包括安装架、固定在安装架上的X轴驱动电机、以及固定在X轴驱动电机输出轴上的Y轴驱动电机;安装架固定在支架上。激光器固定在Y轴驱动电机的输出轴上,X轴驱动电机通过X轴电机驱动器连接于主控芯片,Y轴驱动电机通过Y轴电机驱动器连接于主控芯片,激光器连接于主控芯片,主控芯片通过RS232接口连接于计算机。
激光器可采用市售普通小功率激光器,X轴驱动电机和Y轴驱动电机采用行星减速步进电机,减速比为1:99.5。X轴电机驱动器和Y轴电机驱动器采用HBS3128A高细分步进电机驱动器,用于将主控芯片的输出转换为能够驱动X轴驱动电机和Y轴驱动电机的脉冲信号。
通过X轴驱动电机和Y轴驱动电机的转动完成对激光器发出的激光线束的摆动,激光线束打在扫描台上形成激光指向点,进而实现激光指向点在扫描台上的移动。其中,X轴驱动电机配合以X轴电机驱动器,Y轴驱动电机配合以Y轴电机驱动器,能够使得激光指向点打在扫描台上的位置达到小于等于0.0013mm的定位精度。
X轴电机驱动器和Y轴电机驱动器输出驱动X轴驱动电机和Y轴驱动电机的脉冲信号,X轴驱动电机和Y轴驱动电机转动以使得激光指向点打在其中一个坐标点位上,上述坐标脉冲链表所记录的就是,脉冲信号和坐标点位关联关系,即一个坐标点位对应一个X轴电机驱动器输出的脉冲信号以及Y轴电机驱动器输出的脉冲信号。
针对于上述扫描设备的设置,本发明还提出了一种应用上述技术方案中所述的扫描设备的激光指向扫描方法,如图5所示,包括如下步骤:
步骤S100,在扫描台上放置待扫描绘本以位于图像采集装置的图像采集范围中后,获取图像采集装置采集的待扫描绘本的绘本图像。
根据步骤S100所限定的技术方案,具体地,扫描台位方形台体,扫描台水平设置且扫描台表面平整,调整图像采集装置的角度,以使图像采集装置的图像采集范围的中心轴线落在扫描台的中心点上,将待扫描绘本放置在扫描台上压平,进而图像采集装置能够采集到待扫描绘本的绘本图像,进而将绘本图像传输到计算机中。
步骤S200,识别并提取绘本图像中的文字信息。
根据步骤S200所限定的技术方案,具体地,计算机配置有OCR文字识别软件,计算机获取到绘本图像后,能够将绘本图像进行灰度化处理,能够通过OCR文字识别软件识别并提取出绘本图像中的文字信息。
但是由于,图像采集装置设置在扫描台的一侧,图像采集装置以一个倾斜角度对扫描台上的待扫描绘本进行图像采集,将导致图像采集装置采集到的图像存在透视畸变的现象,从而导致提取绘本图像中的文字信息不够准确,因此,需要解决绘本图像的透视畸变的现象后再对绘本图像中的文字信息进行提取。具体的,包括如下步骤:
步骤S210,根据预建立的透视畸变变换矩阵对绘本图像进行拉伸修正;
步骤S220,通过OCR文字识别软件对拉伸修正后的绘本图像进行识别,提取拉伸修正后的绘本图像中的文字信息。
根据步骤S210~步骤S220所限定的技术方案,具体地,对绘本图像进行拉伸修正后,能够解决绘本图像透视畸变的现象,进而拉伸修正后的绘本图像呈现平整的形状,从而通过OCR文字识别软件对拉伸修正后的绘本图像进行识别,提取拉伸修正后的绘本图像中的文字信息,保证了文字信息提取的效率以及提取出的文字信息的准确性。
值得说明的是,预建立的透视畸变变换矩阵,包括如下步骤:
步骤S211,将预先打印好的网格标定图纸放置在水平放置的扫描台上,其中,网格标定图纸在其四个角落分别设置有标定点;
步骤S212,获取网格标定图纸的标定图像,测量标定图像中标定点之间的像素距离;
步骤S213,测量网格标定图纸的标定点之间的实际物理距离;
步骤S214,基于网格标定图纸中标定点之间的实际物理距离,对标定图像进行拉伸和调整,确定拉伸和调整的参数以形成透视畸变变换矩阵。
根据步骤S211~步骤S214所限定地技术方案,具体地,网格标定图纸如图6所示,网格标定图纸的大小覆盖整个图像采集范围。其中,实际物理距离为想要拉伸调整的两个标定点之间的距离,因此,需要将标定点之间的像素距离进行调整以无限趋近于或等于实际物理距离。
步骤S300,将文字信息转换成语音信息进行播放,并根据语音信息的播放进度控制激光发生装置的激光指向点打在待扫描绘本对应的目标文字上。
根据步骤S300所限定地技术方案,具体地,在识别并提取绘本图像中的文字信息之后,包括如下步骤:
基于图像采集装置的图像采集范围建立x-y坐标系;
记录激光指向点打在x-y坐标系中每个坐标点位上激光发生装置所需的脉冲信号,生成每个坐标点位与脉冲信号相对应的坐标脉冲链表;
获取绘本图像中文字信息每个文字所在x-y坐标系中的文字坐标点位。
根据上述技术方案所限定的步骤,具体地,本实施例中,图像采集范围为方形形状,x-y坐标系的原点以图像采集范围的其中一个角为例进行说明。其中,x-y坐标系中每个坐标点位的间隔间距以实际情况进行具体设定,本实施例不做具体限定。
本实施例中,激光发生装置以其中一个实施例为例进行说明。激光发生装置包括安装壳体、以及设置在安装壳体中的主控芯片、激光器、X轴电机驱动器、Y轴电机驱动器、X轴振镜和Y轴振镜。X轴振镜包括X轴步进电机和X轴玻璃平面镜,Y轴振镜包括Y轴步进电机和Y轴玻璃平面镜。
主控芯片受控于计算机的控制指令控制激光器启动射出激光线束,X轴电机驱动器和Y轴电机驱动器将主控芯片的输出转换为能够驱动X轴步进电机和Y轴步进电机的脉冲信号。X轴步进电机和Y轴步进电机驱使X轴平面镜和Y轴平面镜转动改边激光线束的入射角度,激光线束打在扫描台(或放置在扫描台的待扫描绘本上),以使得激光线束形成激光指向点,从而激光指向点将打在其中一个坐标点位上。
上述坐标脉冲链表所记录的就是,脉冲信号和坐标点位关联关系。即一个坐标点位对应一个X轴电机驱动器输出的脉冲信号以及Y轴电机驱动器输出的脉冲信号。
因此,绘本图像中文字信息每个文字都具有一个在x-y坐标系中的文字坐标点位,每个文字坐标点位根据坐标脉冲链表可以得到一个脉冲信号,X轴电机驱动器和Y轴电机驱动器通过该脉冲信号,能够控制X轴步进电机和Y轴步进电机转动,将激光指向点将打在文字坐标点位上,因此,激光指向点指向的即为待扫描绘本上的目标文字。
值得说明的是,在不改变待扫描绘本在扫描台上的位置的情况,绘本图像中的每个文字与待扫描绘本上的目标文字一一对应。因此,将待扫描绘本放置在扫描台上后,在一次文字转换语音信息,激光指向点进行指向的过程中,不能改边待扫描绘本在扫描台上的位置,若待扫描绘本的位置发生改变,将导致激光指向点的指向位置精确度降低。
由此,在将文字信息转换成语音信息进行播放,并根据语音信息的播放进度控制激光发生装置的激光指向点打在待扫描绘本对应的目标文字上之中,包括如下步骤:
步骤S310,基于提取出的绘本图像中的文字信息,通过文字转换语音软件将文字信息转换成语音信息进行播放;
步骤S320,根据语音信息的当前播放进度,判定当前播放进度在文字信息中所对应的目标文字;
步骤S330,基于目标文字的文字坐标点位以在坐标脉冲链表中查询所对应的脉冲信号;
步骤S340,激光发生装置根据脉冲信号控制激光指向点移动以打在待扫描绘本对应的目标文字上。
根据步骤S310~步骤S340所限定地技术方案,具体地,以下举例进行说明,如提取出绘本图像中的文字信息为“一二三四五六七八九十”,在待扫描绘本的对应位置上为“一二三四五六七八九十”。因此,通过文字转换语音软件能够将上述文字信息转换成语音信息通过扬声器进行播放,其中,当语音信息的当前播放进度播放到“六”时,因此,“六”被判断为当前播放进度在文字信息中所对应的目标文字,计算机根据 “六”的文字坐标点位在坐标脉冲链表中查询所对应的脉冲信号(该脉冲信号没有经过转换无法直接被X轴电机驱动器和Y轴电机驱动器使用),进而将脉冲信号传输至激光发生装置的主控芯片,主控芯片将脉冲信号输出至X轴电机驱动器和Y轴电机驱动器,X轴电机驱动器和Y轴电机驱动器将该脉冲信号经过转换后输出,以控制X轴步进电机和Y轴步进电机转动,控制激光指向点移动以打在待扫描绘本对应的目标文字“六”上。
并且在后续随着语音信息的播放进度,激光指向点能够实时跟随播放进度,将激光指向点打在对应的目标文字上,完成对用户的指示,从而方便用户进行学习,提高用户对于扫描设备的使用便利性。
以上所述仅是本发明的示范性实施方式,而非用于限制本发明的保护范围,本发明的保护范围由所附的权利要求确定。
Claims (8)
1.一种扫描设备,包括扫描台、以及设置在扫描台一侧的图像采集装置,其特征在于,所述扫描台一侧靠近图像采集装置处设置有激光发生装置,所述图像采集装置和激光发生装置连接至计算机;
所述图像采集装置用于采集扫描台上的待扫描绘本以获取绘本图像;
所述激光发生装置用于发射激光指向点,并可控制激光指向点打在扫描台的任意位置上;
所述计算机基于绘本图像以提取绘本图像中的文字信息,将文字信息转换成语音信息进行播放,并根据语音信息的播放进度控制激光发生装置的激光指向点打在待扫描绘本对应的目标文字上。
2.根据权利要求1所述的一种扫描设备,其特征在于,所述激光发生装置包括主控芯片、激光器、X轴电机驱动器、Y轴电机驱动器、X轴振镜和Y轴振镜;
所述主控芯片连接于计算机,所述激光器、X轴电机驱动器和Y轴电机驱动器连接于主控芯片,所述X轴振镜和Y轴振镜受控于X轴电机驱动器和Y轴电机驱动器的脉冲信号进行摆动以调整激光器所发出激光指向点在扫描台上的位置。
3.根据权利要求1所述的一种扫描设备,其特征在于,所述激光发生装置包括激光器、摆动驱动机构和主控芯片;
所述摆动驱动机构包括安装架、固定在安装架上的X轴驱动电机、以及固定在X轴驱动电机输出轴上的Y轴驱动电机;
所述激光器固定在Y轴驱动电机的输出轴上,所述X轴驱动电机通过X轴电机驱动器连接于主控芯片,所述Y轴驱动电机通过Y轴电机驱动器连接于主控芯片,所述激光器连接于主控芯片,所述主控芯片连接于计算机。
4.一种应用如权利要求1至3任意一项所述扫描设备的激光指向扫描方法,其特征在于,包括如下步骤:
在扫描台上放置待扫描绘本以位于图像采集装置的图像采集范围中后,获取图像采集装置采集的待扫描绘本的绘本图像;
识别并提取绘本图像中的文字信息;
将文字信息转换成语音信息进行播放,并根据语音信息的播放进度控制激光发生装置的激光指向点打在待扫描绘本对应的目标文字上。
5.根据权利要求4所述的一种激光指向扫描方法,其特征在于,在识别并提取绘本图像中的文字信息中,包括如下步骤:
根据预建立的透视畸变变换矩阵对绘本图像进行拉伸修正;
通过OCR文字识别软件对拉伸修正后的绘本图像进行识别,提取拉伸修正后的绘本图像中的文字信息。
6.根据权利要求5所述的一种激光指向扫描方法,其特征在于,预建立的透视畸变变换矩阵,包括如下步骤:
将预先打印好的网格标定图纸放置在水平放置的扫描台上,其中,网格标定图纸在其四个角落分别设置有标定点;
获取网格标定图纸的标定图像,测量标定图像中标定点之间的像素距离;
测量网格标定图纸的标定点之间的实际物理距离;
基于网格标定图纸中标定点之间的实际物理距离,对标定图像进行拉伸和调整,确定拉伸和调整的参数以形成透视畸变变换矩阵。
7.根据权利要求4所述的一种激光指向扫描方法,其特征在于,在识别并提取绘本图像中的文字信息之后,包括如下步骤:
基于图像采集装置的图像采集范围建立x-y坐标系;
记录激光指向点打在x-y坐标系中每个坐标点位上激光发生装置所需的脉冲信号,生成每个坐标点位与脉冲信号相对应的坐标脉冲链表;
获取绘本图像中文字信息每个文字所在x-y坐标系中的文字坐标点位。
8.根据权利要求7所述的一种激光指向扫描方法,其特征在于,在将文字信息转换成语音信息进行播放,并根据语音信息的播放进度控制激光发生装置的激光指向点打在待扫描绘本对应的目标文字上之中,包括如下步骤:
基于提取出的绘本图像中的文字信息,通过文字转换语音软件将文字信息转换成语音信息进行播放;
根据语音信息的当前播放进度,判定当前播放进度在文字信息中所对应的目标文字;
基于目标文字的文字坐标点位以在坐标脉冲链表中查询所对应的脉冲信号;
激光发生装置根据脉冲信号控制激光指向点移动以打在待扫描绘本对应的目标文字上。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911005914.6A CN110855849B (zh) | 2019-10-22 | 2019-10-22 | 一种扫描设备及其激光指向扫描方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911005914.6A CN110855849B (zh) | 2019-10-22 | 2019-10-22 | 一种扫描设备及其激光指向扫描方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110855849A true CN110855849A (zh) | 2020-02-28 |
CN110855849B CN110855849B (zh) | 2022-03-29 |
Family
ID=69597272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911005914.6A Active CN110855849B (zh) | 2019-10-22 | 2019-10-22 | 一种扫描设备及其激光指向扫描方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110855849B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200641742A (en) * | 2005-05-26 | 2006-12-01 | Jian Ming Tian | Audio playback device with dynamic and synchronous text display |
CN201918037U (zh) * | 2010-11-29 | 2011-08-03 | 北方工业大学 | 台式助视阅读器 |
CN103052979A (zh) * | 2010-07-06 | 2013-04-17 | 星火有限公司 | 用于提升读书体验的方法和系统 |
CN103761892A (zh) * | 2014-01-20 | 2014-04-30 | 广东小天才科技有限公司 | 一种语音播放纸质书籍内容的方法及装置 |
CN104537616A (zh) * | 2014-12-20 | 2015-04-22 | 中国科学院西安光学精密机械研究所 | 鱼眼图像畸变的校正方法 |
CN110187496A (zh) * | 2019-05-13 | 2019-08-30 | 大族激光科技产业集团股份有限公司 | 一种激光扫描装置及方法 |
-
2019
- 2019-10-22 CN CN201911005914.6A patent/CN110855849B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200641742A (en) * | 2005-05-26 | 2006-12-01 | Jian Ming Tian | Audio playback device with dynamic and synchronous text display |
CN103052979A (zh) * | 2010-07-06 | 2013-04-17 | 星火有限公司 | 用于提升读书体验的方法和系统 |
CN201918037U (zh) * | 2010-11-29 | 2011-08-03 | 北方工业大学 | 台式助视阅读器 |
CN103761892A (zh) * | 2014-01-20 | 2014-04-30 | 广东小天才科技有限公司 | 一种语音播放纸质书籍内容的方法及装置 |
CN104537616A (zh) * | 2014-12-20 | 2015-04-22 | 中国科学院西安光学精密机械研究所 | 鱼眼图像畸变的校正方法 |
CN110187496A (zh) * | 2019-05-13 | 2019-08-30 | 大族激光科技产业集团股份有限公司 | 一种激光扫描装置及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110855849B (zh) | 2022-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106903426B (zh) | 一种基于机器视觉的激光焊接定位方法 | |
US20200152168A1 (en) | Document Mode Processing For Portable Reading Machine Enabling Document Navigation | |
EP2311018B1 (en) | Aiding device for reading a printed text | |
TW552791B (en) | Method and system for scanning an image using a look-down linear array scanner | |
US8320708B2 (en) | Tilt adjustment for optical character recognition in portable reading machine | |
US8873890B2 (en) | Image resizing for optical character recognition in portable reading machine | |
US8150107B2 (en) | Gesture processing with low resolution images with high resolution processing for optical character recognition for a reading machine | |
US8249309B2 (en) | Image evaluation for reading mode in a reading machine | |
US8186581B2 (en) | Device and method to assist user in conducting a transaction with a machine | |
US20040215689A1 (en) | Computer and vision-based augmented interaction in the use of printed media | |
US20060017810A1 (en) | Mode processing in portable reading machine | |
US20150043822A1 (en) | Machine And Method To Assist User In Selecting Clothing | |
JPH11505042A (ja) | 自動露出シングルフレーム画像システム | |
CN1457468A (zh) | 根据观看者的位置对显示器进行的自动定位 | |
CN110119208B (zh) | 悬浮显示成像装置及悬浮显示触控方法 | |
CN110855849B (zh) | 一种扫描设备及其激光指向扫描方法 | |
CN113408512A (zh) | 利用机器人进行集装箱查验的方法、系统、装置及介质 | |
CN209363872U (zh) | 一种基于三维扫描的激光打标机 | |
CN105578162A (zh) | 一种优化投影画面动态对比度的激光投影机 | |
CN206181175U (zh) | 一种在书写时扫描书写内容的笔 | |
CN211475595U (zh) | 智能台灯 | |
CN113111828B (zh) | 一种轴承三维缺陷检测方法及系统 | |
CN214202843U (zh) | 一种基于ocr和tts的视障者阅读装置 | |
CN111812120A (zh) | 一种翻转式的镜片缺陷检测装置和方法 | |
CN110705533A (zh) | 一种用于检验报告的ai识别抓取系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |