信息排版方法、装置、设备及计算机存储介质
技术领域
本发明涉及智能设备技术领域,尤其涉及信息排版方法、装置、设备及计算机存储介质。
背景技术
随着智能设备技术的快速发展,电子白板、交互智能平板等支持手写功能的智能设备得到了广泛应用。此类设备配置有触摸屏(书写屏幕),用户可以在触摸屏上进行书写,设备能控制触摸屏实时显示用户的书写轨迹,书写笔迹中可以包括流程图、时序图等。某些书写笔迹比较重要,可以采用截图的方式保存书写笔迹,最终以图片形式输出给用户。由于图片里的书写笔迹可能比较潦草,为了提高展示效果,用户将图片上的书写笔迹逐个输入到计算机中,实现信息录入和排版,最终整理成文档。可见,人工识别和排版导致人力物力浪费,并且处理效率低。
发明内容
本发明提供了信息排版方法、装置、设备及计算机存储介质,以解决现有技术中将书写轨迹进行录入和排版造成人力物力浪费以及处理效率低的缺陷。
根据本发明实施例的第一方面,提供一种信息排版方法,所述方法包括:
获取书写轨迹,所述书写轨迹至少包括触摸点的目标坐标集合;
基于所述目标坐标集合预测所述书写轨迹为文字轨迹或图形轨迹,并根据预测结果调用相应的文字识别算法或图形识别算法对所述书写轨迹进行识别,获得识别结果;
根据所述目标坐标集合对所述识别结果进行排版。
在一个可选的实现方式中,所述基于所述目标坐标集合预测所述书写轨迹为文字轨迹或图形轨迹,包括:
基于所述目标坐标集合确定书写轨迹中连续轨迹点的长度;
将所述长度与长度阈值进行比较,根据比较结果预测所述书写轨迹为文字轨迹或图形轨
迹。
在一个可选的实现方式中,所述根据所述目标坐标集合对所述识别结果进行排版,包括:
根据所述目标坐标集合确定所述书写轨迹的大小和位置;
根据所述书写轨迹的大小以及预设调整比例确定所述识别结果的大小;
基于识别结果的大小以及书写轨迹的位置,将所述识别结果进行排版。
在一个可选的实现方式中,所述根据所述目标坐标集合对所述识别结果进行排版,包括:
若预测结果包括文字轨迹和图形轨迹、且基于文字坐标集合所确定的文字区域在基于图形坐标集合所确定的图形区域内或相邻,根据所述文字坐标集合和图形坐标集合,将所述文字轨迹对应的文字和所述图形轨迹对应的图形进行组合和排版;
其中,所述文字坐标集合是构成所述文字轨迹的轨迹点的坐标集合,所述图形坐标集合是构成所述图形轨迹的轨迹点的坐标集合。
在一个可选的实现方式中,所述方法还包括:
将所述文字和所述图形组合并排版后的结果转换为图片。
在一个可选的实现方式中,所述方法还包括:
若利用文字识别算法或图形识别算法对同一书写轨迹进行识别,获得至少两个识别结果,在排版后的文档中对同一书写轨迹的至少两个识别结果进行提示;
接收确认指令,根据所述确认指令保留其中一个识别结果,删除其他识别结果。
根据本发明实施例的第二方面,提供一种信息排版装置,所述装置包括:
轨迹获取模块,用于获取书写轨迹,所述书写轨迹至少包括触摸点的目标坐标集合;
轨迹识别模块,用于基于所述目标坐标集合预测所述书写轨迹为文字轨迹或图形轨迹,并根据预测结果调用相应的文字识别算法或图形识别算法对所述书写轨迹进行识别,获得识别结果;
排版模块,用于根据所述目标坐标集合对所述识别结果进行排版。
在一个可选的实现方式中,所述排版模块包括:
排版子模块,用于若预测结果包括文字轨迹和图形轨迹、且基于文字坐标集合所确定的文字区域在基于图形坐标集合所确定的图形区域内或相邻,根据所述文字坐标集合和图形坐
标集合,将所述文字轨迹对应的文字和所述图形轨迹对应的图形进行组合和排版;
其中,所述文字坐标集合是构成所述文字轨迹的轨迹点的坐标集合,所述图形坐标集合是构成所述图形轨迹的轨迹点的坐标集合。
根据本发明实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取书写轨迹,所述书写轨迹至少包括触摸点的目标坐标集合;
基于所述目标坐标集合预测所述书写轨迹为文字轨迹或图形轨迹,并根据预测结果调用相应的文字识别算法或图形识别算法对所述书写轨迹进行识别,获得识别结果;
根据所述目标坐标集合对所述识别结果进行排版。
根据本发明实施例的第四方面,提供一种计算机存储介质,所述存储介质中存储有程序指令,所述程序指令包括:
获取书写轨迹,所述书写轨迹至少包括触摸点的目标坐标集合;
基于所述目标坐标集合预测所述书写轨迹为文字轨迹或图形轨迹,并根据预测结果调用相应的文字识别算法或图形识别算法对所述书写轨迹进行识别,获得识别结果;
根据所述目标坐标集合对所述识别结果进行排版。
本发明的实施例提供的技术方案可以包括以下有益效果:
本发明实施例丰富和完善了智能设备的识别功能,根据目标坐标集合预测书写轨迹为文字轨迹或图形轨迹,并根据预测结果调用相应的文字识别算法或图形识别算法对书写轨迹进行识别,从而提高识别效率,并且可以根据目标坐标集合对识别结果进行排版,从而提高排版效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是相关技术中利用智能设备进行书写的示意图。
图2A是本发明根据一示例性实施例示出的一种信息排版方法的流程图。
图2B是本发明根据一示例性实施例示出的一种信息排版示意图。
图2C是本发明根据一示例性实施例示出的一种信息提示和确认的示意图。
图3是本发明根据一示例性实施例示出的另一种信息排版方法的流程图。
图4是本发明根据一示例性实施例示出的一种信息排版装置的框图。
图5是本发明根据一示例性实施例示出的一种信息排版装置所在电子设备的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本发明实施例的智能设备,可以是智能白板、数位板或交互式智能平板等智能书写设备,也可以是具备书写功能的智能手机、智能学习机、平板电脑、PDA(Personal Digital Assistant,个人数字助理)或多媒体播放器等设备,当然,本发明实施例也不排除在PC(Personal
Computer,个人计算机)上的应用。智能设备中通常配置有红外线技术触摸屏、电容式触摸屏或电磁式触摸屏等书写屏幕,当用户在书写屏幕上进行书写时,此类书写屏幕可以基于红外识别技术、电容识别技术或电磁识别技术等技术,识别出用户在书写屏幕上所书写的轨迹信息,并可在书写屏幕上实时显示用户所输入的书写轨迹。
如图1所示,示出了相关技术中利用智能设备进行书写的示意图,图1中的智能设备以平板电脑为例,用户可以使用触控笔在书写屏幕上进行书写,也可以通过手指在书写屏幕上进行书写。
相关技术中,用户在教学、会议等过程中使用智能白板进行书写,书写笔迹中可以包括文字、图形等。某些书写笔迹比较重要,可以采用截图的方式保存书写笔迹,最终以图片形式输出给用户。由于图片里的书写笔迹比较潦草,为了提高展示效果,用户将图片上的书写笔迹逐个输入到计算机中,实现信息录入和排版,最终整理成文档。由此可见,相关技术中需要用户手动将书写笔迹进行录入和排版,导致处理效率低。
本发明实施例所提供的方案,可以获取书写轨迹,基于书写轨迹中的目标坐标集合预测书写轨迹为文字轨迹或图形轨迹,并根据预测结果调用相应的文字识别算法或图形识别算法对书写轨迹进行识别,获得识别结果,智能设备可以根据目标坐标集合对识别结果进行排版。本发明实施例丰富和完善了智能设备的识别功能,根据目标坐标集合预测书写轨迹为文字轨迹或图形轨迹,并根据预测结果调用相应的文字识别算法或图形识别算法对书写轨迹进行识别,从而提高识别效率,并且可以根据目标坐标集合对识别结果进行排版,从而提高排版效率。接下来对本发明方案进行详细说明。
如图2A所示,图2A是本发明根据一示例性实施例示出的一种信息排版方法的流程图,该方法可以包括以下步骤201至步骤203:
在步骤201中,获取书写轨迹,所述书写轨迹至少包括触摸点的目标坐标集合。
在步骤202中,基于所述目标坐标集合预测所述书写轨迹为文字轨迹或图形轨迹,并根据预测结果调用相应的文字识别算法或图形识别算法对所述书写轨迹进行识别,获得识别结果。
在步骤203中,根据所述目标坐标集合对所述识别结果进行排版。
本发明实施例中,用户可以利用手指或触控笔等触摸对象在书写屏幕上进行书写,书写屏幕可以采集用户书写时所产生的轨迹信息,获得用户输入的书写轨迹。用户可以书写文字,也可以书写图形。图形可以是符号(例如箭头、花括号等)、几何图形等,因此会产生相应
的文字轨迹和图形轨迹。书写轨迹由不同的触摸点(轨迹点)构成,本实施例可以根据触摸点的坐标确定书写轨迹,因此至少获取构成书写轨迹的触摸点的坐标,即至少获取目标坐标集合。书写轨迹中还可以包括触摸对象的移动速度、加速度、笔压等信息,具体信息可以根据文字识别算法和图形识别算法的需求设定,以便提高识别的准确性,在此不做限定。
关于书写轨迹的获取时机,可以是书写过程中实时获取,也可以在书写完成后获取。例如,在书写过程中实时获取书写轨迹;又如,在书写完成后,基于预设的按键或按钮接收集合获取指令,则获取已完成的书写轨迹。
由于触摸屏的大小有限,在利用触摸屏进行会议介绍、授课介绍等场景中,往往由于书写内容较多,会擦除版面中的全部或部分书写轨迹,为了保证被擦除前的版面能得以保存,可以在接收到擦除指令或保存指令时,保存当前版面的书写轨迹,以便后续进行信息排版。
在获取书写轨迹后,可以进行信息排版。关于书写轨迹的识别时机,可以实时根据书写轨迹进行识别,也可以在获取到所有书写轨迹后进行信息排版。例如,在获取书写轨迹后间隔预设时间进行信息排版,又如,在接收到信息排版指令时进行信息排版等。
本实施例可以采用文字识别算法或图形识别算法对书写轨迹进行识别,获得识别结果。
其中,文字识别算法是用于将文字轨迹识别为相应文字的算法。例如,可以根据书写轨迹生成书写图案,基于模板匹配算法将文字轨迹识别为具体的文字。具体的,可以在文字数据库中查找与书写图案匹配的文字图案,若找到匹配的文字图案,则将书写图案识别为找到的文字图案对应的文字。其中,在查找与书写图案相匹配的文字图案的过程中,若存在多个匹配的文字图案,则可以计算各匹配文字图案的匹配度,并选取匹配度最高的文字图案作为找到匹配的文字图案。文字图案是由文字轨迹构成的图案,在文字数据库中存储有每个文字对应的至少一个文字图案。文字图案从其他网络数据库中获取,也可以基于智能终端用户的书写笔迹获得。例如,根据用户的历史文字轨迹,建立文字轨迹与文字的对应关系。
图形识别算法是用于将图形轨迹识别为相应图形的算法。例如,通过计算机图形学、模式识别完成识别和重绘制的过程。图形识别不同于文字识别,没有特定的字符集,笔画随意,特征不明显,但图形具有很多几何特征,方向、尺寸、连接、交叉等,可以通过几何特征进行识别。图形识别算法可以包括模糊类方法、几何方法、神经网类方法、图元分类法等。以几何方法为例,把图形作为整体识别,进行平滑处理,提取圆弧段,识别结点,分解出直线段,根据相邻3点的夹角角度作为圆弧和直线段的提取特征,找出阈值,进行分类并识别。又如,当线条的弯曲程度达到预设阈值时视为曲线,将线段分为若干点后绘制贝塞尔曲线,
当线条弯曲程度小于预设阈值时,直接将其转化为直线。
可以理解的是,文字识别算法和图形识别算法不限于本发明所列举的识别算法,还可以是相关技术中的其他算法,在此不再一一赘述。
由于文字识别算法能识别文字,图形识别算法能识别图形,如果按固定顺序依次利用文字识别算法和图形识别算法识别书写轨迹,导致识别效率低,且浪费处理资源,基于此,为了提高书写轨迹的识别效率,避免处理资源的浪费,本实施例在获取书写轨迹后,可以基于目标坐标集合预测书写轨迹为文字轨迹或图形轨迹。由于目标坐标集合是构成书写轨迹的触摸点的坐标集合,因此可以确定出用于区别书写轨迹为文字轨迹或图形轨迹的区别特征,进而利用区别特征推测出书写轨迹为文字轨迹或图形轨迹。
在一个可选的实现方式中,所述基于所述目标坐标集合预测所述书写轨迹为文字轨迹或图形轨迹,包括:
基于所述目标坐标集合确定书写轨迹中连续轨迹点的长度;
将所述长度与长度阈值进行比较,根据比较结果预测所述书写轨迹为文字轨迹或图形轨迹。
在该实施例中,由于文字轨迹中连续轨迹点的长度往往小于图形轨迹中连续轨迹点的长度,因此可以预先设置一个长度阈值,用于区分文字轨迹和图形轨迹。当书写轨迹中连续轨迹点的长度大于或等于长度阈值时,将书写轨迹预测为图形轨迹,当书写轨迹中连续轨迹点的长度小于长度阈值时,将书写轨迹预测为文字轨迹。
其中,书写轨迹中连续轨迹点的长度可以是书写轨迹中第一条连续轨迹的长度,也可以是书写轨迹中最长轨迹的长度等。长度阈值可以是预先设定的固定阈值,也可以根据书写轨迹的大小按预设比例调整基准阈值获得。例如,书写轨迹变大时,将基准阈值按比例变大,书写轨迹变小时,将基准阈值按比例变小,从而可以提高预测的准确性。
由上述实施例可见,通过将书写轨迹中连续轨迹点的长度与长度阈值进行比较,从而预测书写轨迹为文字轨迹或图形轨迹,提高预测效率。
此外,还可以基于目标坐标集合确定书写轨迹中所有轨迹点所确定的区域大小,根据所述区域大小与区域阈值进行比较,并根据比较结果预测所述书写轨迹为文字轨迹或图形轨迹。可以理解的是,还可以采用其他方式基于目标坐标集合对书写轨迹进行预测,在此不一一列举。
在对书写轨迹进行预测后,可以根据预测结果调用相应的文字识别算法或图形识别算法对书写轨迹进行识别,获得识别结果。如果书写轨迹为文字轨迹,先调用文字识别算法对所述书写轨迹进行识别,若识别成功,则不再调用图形识别算法,若识别失败,再调用图形识别算法对所述书写轨迹进行识别;如果书写轨迹为图形轨迹,先调用图形识别算法对所述书写轨迹进行识别,若识别成功,则不再调用文字识别算法,若识别失败,再调用文字识别算法对所述书写轨迹进行识别。
在一个例子中,若预测结果包括图形轨迹,调用图形识别算法对所述图形轨迹进行识别,并绘制获得所述图形轨迹对应的图形。
进一步的,可以将获得的图形转换为图片格式,便于后续排版。
在一个例子中,如果预测结果包括文字轨迹,调用文字识别算法对所述文字轨迹进行识别,获得所述文字轨迹对应的文字。
其中具体识别手段在此不做限定。
在获得识别结果后,可以根据目标坐标集合确定书写轨迹的位置,进而确定识别结果的位置,实现对识别结果进行排版。排版过程中,还可以预设文字的属性信息和图形的属性信息,根据文字的属性信息和图形的属性信息对识别结果进行排版,从而实现识别结果的格式化。以文字为例,属性信息可以包括字体、颜色、大小等。如,<font size="6"color="#FFFFFF"face="微软雅黑">等。另外,还可以预设排版数据,例如,行和段落间距、对齐方式等。根据文字的属性信息、图形的属性信息和排版数据对识别结果进行排版。
在一个可选的实现方式中,还可以根据书写轨迹的大小适当调整识别结果的大小,从而实现排版后的信息不仅在位置上与书写屏幕上的版面相似,还在大小上与书写屏幕上的版面相似,实现排版后的版面更贴近书写屏幕上的版面。
具体的,所述根据所述目标坐标集合对所述识别结果进行排版,包括:
根据所述目标坐标集合确定所述书写轨迹的大小和位置;
根据所述书写轨迹的大小以及预设调整比例确定所述识别结果的大小;
基于识别结果的大小以及书写轨迹的位置,将所述识别结果进行排版。
其中,书写轨迹是识别获得识别结果的轨迹,例如,可以是文字轨迹,也可以是图形轨迹。针对每个独立的书写轨迹,可以按预设调整比例确定该书写轨迹对应的识别结果的大小。
由上述实施例可见,可以根据目标坐标集合确定书写轨迹的大小和位置,进而根据书写
轨迹的大小以及预设调整比例确定识别结果的大小,并根据书写轨迹的位置确定识别结果的位置,从而根据识别结果的位置和大小进行排版,使排版后的版面更贴近书写屏幕上的版面。
在一种应用场景中,还可能出现预测结果包括文字轨迹和图形轨迹、且基于文字坐标集合所确定的文字区域在基于图形坐标集合所确定的图形区域内或相邻的情况,其中,所述文字坐标集合是构成所述文字轨迹的轨迹点的坐标集合,所述图形坐标集合是构成所述图形轨迹的轨迹点的坐标集合。例如,用户在智能白板上绘制流程图、时序图等,针对此类书写轨迹,设备需要区分哪部分书写轨迹为文字轨迹,哪部分书写轨迹为图形轨迹,并利用相应的文字识别算法和图形识别算法进行识别,并将识别结果进行组合和排版。
具体的,所述根据所述目标坐标集合对所述识别结果进行排版,包括:
若预测结果包括文字轨迹和图形轨迹、且基于文字坐标集合所确定的文字区域在基于图形坐标集合所确定的图形区域内或相邻,根据所述文字坐标集合和图形坐标集合,将所述文字轨迹对应的文字和所述图形轨迹对应的图形进行组合和排版。
其中,文字轨迹对应的坐标是构成文字轨迹的轨迹点的坐标集合,为了方便描述,可以简称为文字坐标集合。基于文字坐标集合所确定的文字区域是根据文字坐标集合中坐标确定的区域,文字坐标集合中的坐标可以在文字区域内。例如,可以根据文字坐标集合确定矩形区域,具体的,可以根据文字坐标集合中最小横坐标、最小纵坐标、最大横坐标、最大纵坐标确定一个矩形区域;又如,可以根据文字坐标集合确定圆形区域,具体的,可以根据文字坐标集合中的中间坐标以及距离中间坐标最远的坐标确定一个圆形区域等。由于文字比较方正,因此优选采用矩形区域。
其中,图形轨迹对应的坐标是构成图形轨迹的轨迹点的坐标集合,为了方便描述,可以简称为图形坐标集合。基于图形坐标集合所确定的图形区域是根据图形坐标集合中坐标确定的区域,图形坐标集合中的坐标可以在图形区域内。例如,可以根据图形坐标集合确定矩形区域,如根据图形坐标集合中最小横坐标、最小纵坐标、最大横坐标、最大纵坐标确定一个矩形区域;又如,可以根据图形坐标集合确定圆形区域,具体的,根据图形坐标集合中的中间坐标以及距离中间坐标最远的坐标确定一个圆形区域等。区域划分方式可以根据图形轨迹所对应的图形确定。
如果文字区域在图形区域内,或者文字区域与图形区域相邻,这种情况可以认为是图文并茂的情况。基于此,在调用图形识别算法对图形轨迹进行识别,并绘制获得图形轨迹对应的图形,且调用文字识别算法对文字轨迹进行识别,获得文字轨迹对应的文字后,可以根据
文字坐标集合和图形坐标集合,将文字轨迹对应的文字和图形轨迹对应的图形进行组合和排版。
其中,文字区域与图形区域相邻可以是文字区域与图形区域在书写屏幕上的距离在指定范围内。由于根据文字坐标集合可以确定文字轨迹对应的文字的位置,根据图形坐标集合可以确定图形轨迹对应的图形的位置,又由于基于文字坐标集合所确定的文字区域在基于图形坐标集合所确定的图形区域内或相邻,可知文字在图形内或文字与图形相邻,基于此,可以将文字和图形组合在一起,并可以根据文字的属性信息和图形的属性信息对组合中的文字和图形进行格式统一。
可见,本实施例可以对文字区域在图形区域内或文字区域与图形区域相邻的识别结果进行排版,从而实现对图文结合的书写轨迹进行识别和排版,提高智能设备的智能化水平。
如图2B所示,图2B是本发明根据一示例性实施例示出的一种信息排版示意图。在该示意图中,用户可以在智能白板上书写一个流程图,利用本发明实施例的方案,可以将包括文字和图形的书写轨迹进行识别和排版,可以得到排版结果,由于本实施例可以自动识别和排版,提高了处理效率,避免人力物力浪费。
在一个可选的实现方式中,还可以将所述文字和所述图形组合并排版后的结果转换为图片。
可见,由于图片便于编辑,因此将文字和图形组合并排版后的结果转换为图片,便于将图形在文档中进行编辑,特别是还存在其他文字时,便于图片与文字的编辑。
在一个可选的实现方式中,所述方法还包括:将排版结果的格式转换为指定格式的文档。
其中,指定格式可以是预设的固定格式,也可以是基于接收到用户指令而确定的格式。例如,指定格式可以是PDF、WORD等格式。本实施例中可以利用格式转换工具实现格式转换,并导出转换获得的文档。
在一个可选的实现方式中,所述方法还包括:
若利用文字识别算法或图形识别算法对同一书写轨迹进行识别,获得至少两个识别结果,在排版后的文档中对同一书写轨迹的至少两个识别结果进行提示;
接收确认指令,根据所述确认指令保留其中一个识别结果,删除其他识别结果。
其中,提示方式可以是在文档中突出显示,例如高亮显示,加阴影显示等,还可以通
过标注的方式提醒等。如,可以在文档中高亮显示其中一个识别结果,并在该识别结果被触发时,显示其他识别结果,以避免将全部识别结果显示导致排版混乱。
用户可以根据提示选择正确的识别结果,基于用户操作,设备可以接收确认指令,根据所述确认指令保留其中一个识别结果,删除其他识别结果。可见,实现对识别结果的编辑,从而完善识别结果,获得准确的文档。
在一个例子中,所述方法还包括:接收到图片插入指令时,获取图片的路径信息以及图片的位置信息;根据目标坐标集合对识别结果进行排版时,还根据图片的路径信息获取图片,并基于所述位置信息将所述图片插入到排版的文档中。
如图2C所示,图2C是本发明根据一示例性实施例示出的一种信息提示和确认的示意图。该附图中基于模板坐标集合将识别出的文字和图形进行排版,并根据图片的路径信息获取图片,并基于图片的位置信息将所述图片插入到排版的文档中。由于在识别同一文字轨迹时获得“木”和“不”两个识别结果,因此将其中一个识别结果以阴影的方式展示,用户点击该识别结果时,提示所有识别结果“木”和“不”,如图2C中的状态一。用户可以选择正确的识别结果,最终获得准确的文档,如图2C中的状态二和状态三。
以上实施方式中的各种技术特征可以任意进行组合,只要特征之间的组合不存在冲突或矛盾,但是限于篇幅,未进行一一描述,因此上述实施方式中的各种技术特征的任意进行组合也属于本说明书公开的范围。
本发明还列举其中一种组合进行示例说明。如图3所示,图3是本发明根据一示例性实施例示出的另一种信息排版方法的流程图,所述方法包括以下步骤:
在步骤301中,获取书写轨迹,所述书写轨迹至少包括触摸点的目标坐标集合。
在步骤302中,基于所述目标坐标集合预测所述书写轨迹为文字轨迹或图形轨迹,并根据预测结果调用相应的文字识别算法或图形识别算法对所述书写轨迹进行识别,获得识别结果。
针对这部分书写轨迹结合文字与图形识别算法,如果是文字轨迹可以根据前后语义筛选出最符合当前语境的文字,若存在多个识别结果无法选择,则将该识别结果进行标记,然后直接输出到文件。如果是图形时:当线条的弯曲程度达到一定值时视为曲线,将线段分为若干点后画贝塞尔曲线,当线条弯曲程度小于一定值时直接将其转化为直线,最后将图形以图片形式输出。
在步骤303中,基于预设属性信息和目标坐标集合设置识别结果的属性信息,并基于
预设的排版数据对识别结果进行排版。
其中,可以以一定规则(如HTML标签语言)为每个文字或者图片添加颜色、大小、位置等属性信息。以HTML标签语言为例,添加字体属性信息规则如下:
<font size="6"color="#FFFFFF"face="微软雅黑">设置文本</font>
这段代码决定了"设置文本"4个字的大小、颜色、字体。可以通过这种方式为每一个文字或图片添加属性。
在步骤304中,判断是否结束书写轨迹识别,若否,则返回步骤301;若是,则进入步骤305。
该步骤中,书写轨迹识别结束可以是用户书写完毕,也可以是获取的所有书写轨迹已识别完成。
在步骤305中,将排版结果转换为指定格式的文档。
该步骤中,可以解析步骤303中的代码,将其“翻译”为用户需要的文件格式。
在步骤306中,若利用文字识别算法或图形识别算法对同一书写轨迹进行识别,获得至少两个识别结果,在排版后的文档中对同一书写轨迹的至少两个识别结果进行提示。
在步骤307中,接收确认指令,根据所述确认指令保留其中一个识别结果,删除其他识别结果,导出修改后的文档。
其中,若步骤302中文字识别过程中出现一些形状相似且无法根据语义去选择的文字,可以在步骤306和307中将这些标记过的文字列出来让用户进行选择,最后用户修改完毕后再导出文件。
由上述实施例可见,该实施例根据目标坐标集合预测书写轨迹为文字轨迹或图形轨迹,并根据预测结果调用相应的文字识别算法或图形识别算法对书写轨迹进行识别,从而提高识别效率,并且可以根据目标坐标集合对识别结果进行排版,从而提高排版效率,同时实现对识别结果的编辑,从而完善识别结果,获得准确的文档。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成。所述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,包括上述方法所述的步骤。所述的存储介质,包括:ROM/RAM、磁碟、光盘等。
与前述信息排版方法的实施例相对应,本发明还提供了信息排版装置及其所应用的电子设备、以及计算机存储介质的实施例。
如图4所示,图4是本发明根据一示例性实施例示出的一种信息排版装置的框图,所述装置包括:轨迹获取模块410、轨迹识别模块420和排版模块430。
其中,轨迹获取模块410,用于获取书写轨迹,所述书写轨迹至少包括触摸点的目标坐标集合;
轨迹识别模块420,用于基于所述目标坐标集合预测所述书写轨迹为文字轨迹或图形轨迹,并根据预测结果调用相应的文字识别算法或图形识别算法对所述书写轨迹进行识别,获得识别结果;
排版模块430,用于根据所述目标坐标集合对所述识别结果进行排版。
在一个可选的实现方式中,所述轨迹识别模块420包括(图4未示出):
长度确定子模块,用于基于所述目标坐标集合确定书写轨迹中连续轨迹点的长度;
轨迹预测子模块,用于将所述长度与长度阈值进行比较,根据比较结果预测所述书写轨迹为文字轨迹或图形轨迹。
在一个可选的实现方式中,所述排版模块430包括(图4未示出):
信息确定子模块,用于根据所述目标坐标集合确定所述书写轨迹的大小和位置;
大小确定子模块,用于根据所述书写轨迹的大小以及预设调整比例确定所述识别结果的大小;
排版处理子模块,用于基于识别结果的大小以及书写轨迹的位置,将所述识别结果进行排版。
在一个可选的实现方式中,所述排版模块430包括(图4未示出):
排版子模块,用于若预测结果包括文字轨迹和图形轨迹、且基于文字坐标集合所确定的文字区域在基于图形坐标集合所确定的图形区域内或相邻,根据所述文字坐标集合和图形坐标集合,将所述文字轨迹对应的文字和所述图形轨迹对应的图形进行组合和排版;
其中,所述文字坐标集合是构成所述文字轨迹的轨迹点的坐标集合,所述图形坐标集合是构成所述图形轨迹的轨迹点的坐标集合。
在一个可选的实现方式中,所述排版模块430,还用于:将所述文字和所述图形组合并排版后的结果转换为图片。
在一个可选的实现方式中,所述装置还包括(图4未示出):
信息提示模块,用于若利用文字识别算法或图形识别算法对同一书写轨迹进行识别,获得至少两个识别结果,在排版后的文档中对同一书写轨迹的至少两个识别结果进行提示;
信息编辑模块,用于接收确认指令,根据所述确认指令保留其中一个识别结果,删除其他识别结果。
相应的,本发明还提供一种电子设备,所述设备包括有处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:
获取书写轨迹,所述书写轨迹至少包括触摸点的目标坐标集合;
基于所述目标坐标集合预测所述书写轨迹为文字轨迹或图形轨迹,并根据预测结果调用相应的文字识别算法或图形识别算法对所述书写轨迹进行识别,获得识别结果;
根据所述目标坐标集合对所述识别结果进行排版。
相应的,本发明实施例一种计算机存储介质,所述存储介质中存储有程序指令,所述程序指令包括:
获取书写轨迹,所述书写轨迹至少包括触摸点的目标坐标集合;
基于所述目标坐标集合预测所述书写轨迹为文字轨迹或图形轨迹,并根据预测结果调用相应的文字识别算法或图形识别算法对所述书写轨迹进行识别,获得识别结果;
根据所述目标坐标集合对所述识别结果进行排版。
本发明可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可用存储介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述装置中各个模块的功能和作用的实现过程具体详情见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例
的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本发明信息排版装置的实施例可以应用在电子设备上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在电子设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图5所示,为本发明信息排版装置532所在电子设备的一种硬件结构图,除了图5所示的处理器510、内存530、网络接口520、以及非易失性存储器540之外,实施例中装置532所在的电子设备通常根据该电子设备的实际功能,还可以包括其他硬件,对此不再赘述。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。