发明内容
针对上述现有技术的不足,本发明的目的在于提供一种扫描笔文本扫描方法、装置、介质及计算机设备。
根据本发明的实施方案,提供第一个方案为:一种扫描笔文本扫描方法,包括如下步骤:
获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
通过第一播放模块播放所述播放视频。
进一步地,所述依据初始扫描图像获取待扫描文本的文字排布方向的步骤包括:
识别初始扫描图像中的单元文字图像及文字类型;
依据文字类型获取单元文字图像的单元虚拟框;
识别初始扫描图像中单元文字图像的单元虚拟框的底边方向集合;
根据底边方向集合获取文字排布方向。
进一步地,所述依据初始扫描图像的文字排布方向获取扫描终端的扫描方向的步骤包括:
获取文字排布方向对应的多个单元虚拟框;
依据标定规则标记每个单元虚拟框的定位点;
依据初始扫描图像中文字单元图像的单元虚拟框的定位点集合获取扫描曲线及扫描方向。
进一步地,所述获取扫描终端的初始扫描图像的步骤包括:
获取扫描笔移动启动信号,在启动后的第一时间段内以第一固定帧率对待扫描文本进行扫描并获取初始扫描图像。
进一步地,所述依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率的步骤包括,通过帧率计算公式计算扫描帧率:
式中,为扫描模块的扫描帧率,/>为帧率调节参数,/>为第一固定帧率,/>为扫描速度的水平分量;
所述依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像的步骤包括,通过图像切割量公式计算扫描图像在垂直方向的预切割量:
式中,为扫描图像在垂直方向上的切割距离,/>为切割量参数,/>为扫描速度的垂直分量。
进一步地,还包括步骤:依据第一播放模块播放的播放视频进行文字提取,并将提取结果发送到第二播放模块播放。
进一步地,还包括:
通过视频摄像模块对第一播放模块进行视频扫描识别并获取文字扫描图像,依据文字扫描图像进行文字提取;
其中,通过视频播放速度计算公式计算第一播放模块的视频播放速度:
式中,为第一播放模块的视频播放速度,/>为播放调整参数,/>为额定视频播放速度,/>为视频摄像模块的额定帧率,/>为扫描模块的扫描帧率。
根据本发明的实施方案,利用本发明提供的第一个方案中的扫描笔文本扫描方法,提供第二个方案为:
一种扫描笔文本扫描装置,包括:
文字排布方向获取模块,用于获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
扫描方向获取模块,用于获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
分量计算模块,用于根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
扫描图像获取模块,用于依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
预处理图像获取模块,用于依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
播放视频生成模块,用于将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
视频播放模块,用于通过第一播放模块播放所述播放视频。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
通过第一播放模块播放所述播放视频。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
通过第一播放模块播放所述播放视频。
与现有技术相比,本申请提供的技术方案独权的有益效果:通过对文字排布方向的识别将获取的扫描速度重新标定扫描方向,再根据扫描速度的水平分量进行扫描模块的扫描帧率调整,使得扫描图像的识别帧率设定更加准确合理,同时,根据扫描速度的垂直分量对扫描图像进行预切割处理从而减少后续的根据扫描图像生成播放视频时的数据处理量。本方案通过对扫描速度的分量化处理从两个维度同时减少了设备生成播放视频时的数据处理量,实现了设备成本下降的同时提升视频处理质量的优良效果。
具体实施方式
为了使本领域的技术人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
本实施例要解决的技术问题是,现有的扫描笔的移动方向是通过位置传感器来获取移动速度,将文字排布方向默认为移动方向,虽然通常用户在使用扫描笔进行文本识别时会根据文字排布方向进行扫描,扫描笔等识别设备也会对扫描文本的方向进行限定,并在扫描窗口偏离正常的带扫描文本时进行报警,并将获取的无法识别的扫描图像进行废弃处理,但是,无法避免的,用户在依据文字排布方向进行扫描时会有持续的、微小偏移,本质上就是位置传感器的移动方向偏离了文字排布方向,此时,如果仍默认位置传感器的移动方向就是文字排布方向,就需要后续使用更大算力对偏离的扫描图像进行校正,无疑增加了后续的算力及算力门槛,造成设备的成本较高。
为了解决上述技术问题,本实施例提供一种扫描笔文本扫描方法,如图1所示,包括如下步骤:
S101:获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
具体的,在获取扫描笔移动启动信号后,在启动后的第一时间段内通过扫描模块以第一固定帧率对待扫描文本进行扫描并获取初始扫描图像。具体的,第一时间段可设置为0.4-0.6秒,第一固定帧率可设置为60帧率。
S102:获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
具体的,通过位置传感器获取扫描终端的扫描速度的绝对值,基于本申请面对的技术问题,需要依据初始扫描图像的文字排布方向获取扫描终端的扫描方向,即扫描方向受到使用者不精准操作的影响使得扫描方向偏离文字排布方向,进而造成通过默认的位置传感器的移动方向来进行扫描图像的处理,增大了算力及算力门槛的问题。
具体的,所述依据初始扫描图像获取待扫描文本的文字排布方向的步骤包括:
S1021:识别初始扫描图像中的单元文字图像及文字类型;例如,单元文字类型为简体汉字,单元文字图像为单一的汉字字符,文字类型为英文,单元文字图像为字母字符。进一步的,单元文字类型还可以为汉字的艺术体等排列不规整的字体。
S1022:依据文字类型获取单元文字图像的单元虚拟框;例如,汉字字符的单元虚拟框为包含该汉字字符的虚拟的线条框,该虚拟的线条框将汉字字符包含在内,且初始扫描图像中的汉字字符的单元虚拟框默认为面积、形状相同的框体。进一步的,还可以在文字类型中进一步识别为文字类型及文字字体大小,根据文字字体大小不同分别赋予汉字字符不同的单元虚拟框。
S1023:识别初始扫描图像中单元文字图像的单元虚拟框的底边方向集合;
具体的,例如图2所示,初始扫描图像中“抬头仰望是清”可获取6个汉字字符,每个汉字字符匹配一个单元虚拟框,该单元虚拟框为矩形框体,因此,每个单元虚拟框都可以至少提取出1个底边的方向,因此,可获取至少6个底边方向集合。
S1024:根据底边方向集合获取文字排布方向。
在图像分析中,不可避免的收到图像采集、文字变形等细微影响使得每个单元虚拟框的底边方向有微小形变偏离,因此,通过底边方向集合的统计处理可以缩小该偏离量,即通过多个单元虚拟框的底边方向集合将多个底边方向的中间值确定为文字排布方向,可最大程度地得到准确的文字排布方向。
具体的,所述依据初始扫描图像获取待扫描文本的文字排布方向的步骤包括:
S1031:获取文字排布方向对应的多个单元虚拟框;
S1032:依据标定规则标记每个单元虚拟框的定位点;标定规则可为每个单元虚拟框的矩形框体的左下角端点。
S1033:依据初始扫描图像中文字单元图像的单元虚拟框的定位点集合获取扫描曲线及扫描方向。
如图2所示,初始扫描图像中“抬头仰望是清”可获取6个汉字字符,获取6个汉字字符单元虚拟框的定位点为6个矩形框的左下角端点,连接6个端点可获取扫描曲线,该扫描曲线反应了真实的用户使用扫描终端的扫描动作,通过计算扫描曲线的斜率可获取扫描方向,以图2为例,扫描方向为文字排布方向偏上倾斜。在具体图像数据处理总,该扫描曲线并非数学上的斜率一定的曲线,因此需要对该扫描曲线进行拟合处理后形成斜率取中的拟合曲线,根据该拟合曲线的斜率得到扫描方向及扫描夹角,该扫描夹角为扫描方向与文字排布方向的夹角。
S103:根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量。
S104:依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像。
S105:依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像。
具体的,所述依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率的步骤包括,通过帧率计算公式计算扫描帧率:
式中,为扫描模块的扫描帧率,/>为帧率调节参数,/>为第一固定帧率,/>为扫描速度的水平分量;
所述依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像的步骤包括,通过图像切割量公式计算扫描图像在垂直方向的预切割量:
式中,为扫描图像在垂直方向上的切割距离,/>为切割量参数,/>为扫描速度的垂直分量。
S106:将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频。
S107:通过第一播放模块播放所述播放视频。
通过对文字排布方向的识别将获取的扫描速度重新标定扫描方向,再根据扫描速度的水平分量进行扫描模块的扫描帧率调整,使得扫描图像的识别帧率设定更加准确合理,同时,根据扫描速度的垂直分量对扫描图像进行预切割处理从而减少后续的根据扫描图像生成播放视频时的数据处理量。本方案通过对扫描速度的分量化处理从两个维度同时减少了设备生成播放视频时的数据处理量,实现了设备成本下降的同时提升视频处理质量的优良效果。
实施例二
本实施例基于实施例,具体提出一种扫描文本的文字提取方法,包括如下步骤:
获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
通过第一播放模块播放所述播放视频;
依据第一播放模块播放的播放视频进行文字提取,并将提取结果发送到第二播放模块播放。
基于图像拼接技术的文字提取方法,对图像拼接的技术门槛要求较高,造成设备的算力或者与设备连接的云算力要求较高,造成成本较高,同时扫描图像的数据量很容易因为扫描方式不同而重复产生,增大数据处理量,导致文本识别耗时较长,降低用户使用体验。
本方案中由于对扫描图像进行了视频转换,基于视频转换的结果再进行文字提取时,由于播放视频已经经过处理,可以以更加稳定高质量的效果进行播放时,再进行文字提取,可以大幅度减小文字提取的识别难度及计算量。
具体的,通过视频摄像模块对第一播放模块进行视频扫描识别并获取文字扫描图像,依据文字扫描图像进行文字提取;
其中,通过视频播放速度计算公式计算第一播放模块的视频播放速度:
式中,为第一播放模块的视频播放速度,/>为播放调整参数,/>为额定视频播放速度,/>为视频摄像模块的额定帧率,/>为扫描模块的扫描帧率。
具体的,视频摄像模块作为微型摄像机,其额定帧率即该微型摄像机在录像成像的实际帧率。
具体的,视频摄像模块的额定帧率为16时,扫描模块的扫描帧率为48,可知第一播放模块的视频播放速度是额定视频播放速度的1/3,即将第一播放模块的播放速度调整为额定播放速度的1/3倍进行播放,视频摄像模块对完成播放速度调节后的第一播放模块进行视频扫描,将该视频扫描结果发送到文字识别模块中进行文字识别提取。
进一步的,文字识别提取结果还可以发送到第二播放模块总播放,第二播放模块可以对文字识别提取结果进行渲染修改后播放,以增加播放风格提升播放效果。第二播放模块还可以根据文字识别提取结果进行文字朗读等其他功能实现。
本方案的优点还在于,根据视频摄像模块的额定帧率对第一播放模块中的视频播放速度进行调节,通过结合视频摄像模块的额定帧率、扫描模块的扫描帧率调节进行视频播放速度的计算,根据计算结果对第一播放模块中播放视频的速度进行调节,为视频摄像模块的采集图像质量提供有效保障的同时,保证了文字识别提取结果的精度。
实施例三
如图3所示,本实施例提供一种扫描笔文本扫描装置,包括:
文字排布方向获取模块100,用于获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
扫描方向获取模块200,用于获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
分量计算模块300,用于根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
扫描图像获取模块400,用于依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
预处理图像获取模块500,用于依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
播放视频生成模块600,用于将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
视频播放模块700,用于通过第一播放模块播放所述播放视频。
通过对文字排布方向的识别将获取的扫描速度重新标定扫描方向,再根据扫描速度的水平分量进行扫描模块的扫描帧率调整,使得扫描图像的识别帧率设定更加准确合理,同时,根据扫描速度的垂直分量对扫描图像进行预切割处理从而减少后续的根据扫描图像生成播放视频时的数据处理量。本方案通过对扫描速度的分量化处理从两个维度同时减少了设备生成播放视频时的数据处理量,实现了设备成本下降的同时提升视频处理质量的优良效果。
实施例四
图4示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图4所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现扫描笔文本扫描方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行扫描笔文本扫描方法。本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
通过第一播放模块播放所述播放视频。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
通过第一播放模块播放所述播放视频。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。