CN104536946A - 一种表格生成方法及终端 - Google Patents

一种表格生成方法及终端 Download PDF

Info

Publication number
CN104536946A
CN104536946A CN201410746322.0A CN201410746322A CN104536946A CN 104536946 A CN104536946 A CN 104536946A CN 201410746322 A CN201410746322 A CN 201410746322A CN 104536946 A CN104536946 A CN 104536946A
Authority
CN
China
Prior art keywords
data
data message
data information
information units
message group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410746322.0A
Other languages
English (en)
Other versions
CN104536946B (zh
Inventor
李陈
刘博�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201410746322.0A priority Critical patent/CN104536946B/zh
Publication of CN104536946A publication Critical patent/CN104536946A/zh
Application granted granted Critical
Publication of CN104536946B publication Critical patent/CN104536946B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例涉及电子技术领域,公开了一种表格生成方法及终端。其中,该方法包括:终端首先可以获取目标图像中的数据信息集合,然后判断该数据信息集合中是否包括第一特征标识,如果包括,终端就根据第一特征标识对该数据信息集合进行分割并得到多个数据信息组,并分别对该数据信息组进行分割得到数据信息单元,最后将每一个数据信息组包括的数据信息单元输入到目标表格中。通过实施本发明实施例,终端可以将图像中显示的内容自动生成表格,提高了制作表格的效率。

Description

一种表格生成方法及终端
技术领域
本发明涉及一种电子技术领域,具体涉及一种表格生成方法及终端。
背景技术
如今,表格的应用越来越广泛,许多数据都需要通过表格呈现出来,这样可以方便用户对数据进行分析。现有的表格制作方法是用户手动的将数据录入到表格中,但是这种制作表格的方式往往效率比较低,而且手动录入数据比较容易出现错误,用户也不容易检查出来。如果数据量比较大,这种制作表格的方式就比较占用时间。可见,现有的表格制作方式的效率比较低。
发明内容
本发明实施例公开了一种表格生成方法及终端,可以提高制作表格的效率。
本发明实施例公开了一种表格生成方法,包括:
获取目标图像中的数据信息集合,并判断所述数据信息集合中是否包括第一特征标识,所述第一特征标识用于指示位于所述第一特征标识之前的数据信息与位于所述第一特征标识之后的数据信息属于两个不同的数据信息组;
若包括,则根据所述第一特征标识对所述数据信息集合进行分割,得到多个数据信息组;
分别对每一个所述数据信息组进行分割,得到该数据信息组的数据信息单元;
将每一个所述数据信息组包括的数据信息单元输入到目标表格中,其中,一个所述数据信息组包括的数据信息单元被输入到同一行的不同单元格中。
相应的,本发明实施例公开了一种表格生成终端,包括:
获取模块,用于获取目标图像中的数据信息集合;
判断模块,用于判断所述数据信息集合中是否包括第一特征标识,其中,所述第一特征标识用于指示位于所述第一特征标识之前的数据信息与位于所述第一特征标识之后的数据信息属于两个不同的数据信息组;
第一分割模块,用于在所述判断模块的判断结果为是时,根据所述第一特征标识对所述数据信息集合进行分割,得到多个数据信息组;
第二分割模块,用于分别对每一个所述数据信息组进行分割,得到该数据信息组的数据信息单元;
输入模块,用于将每一个所述数据信息组包括的数据信息单元输入到目标表格中,其中,一个数据信息组包括的数据信息单元被输入到同一行的不同单元格中。
实施本发明实施例,具有如下有益效果:
本发明实施例中,终端首先可以获取目标图像中的数据信息集合,并判断该数据信息集合中是否包括第一特征标识,如果包括,就根据第一特征标识对该数据信息集合进行分割并得到多个数据信息组;然后分别对该数据信息组进行分割得到数据信息单元;最后将每一个数据信息组包括的数据信息单元输入到目标表格中。通过实施本发明实施例,终端可以将图像中显示的内容自动生成表格,提高了制作表格的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种表格生成方法的流程示意图;
图2是本发明实施例公开的另一种表格生成方法的流程示意图;
图3是本发明实施例公开的一种表格生成终端的结构示意图;
图4是本发明实施例公开的另一种表格生成终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种表格生成方法及终端,可以提高制作表格的效率。以下分别进行详细说明。
请参阅图1,图1是本发明实施例公开的一种表格生成方法的流程示意图。其中,图1所示的方法可以应用于智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等具备文档处理功能的终端中。如图1所示,该表格生成方法可以包括以下步骤:
S101、终端获取目标图像中的数据信息集合。
本发明实施例中,终端首先会对目标图像中的数据信息进行扫描,生成文本文档,该文本文档中可以显示该目标图像中所显示的所有数据信息内容之外,并且终端还可以识别文本文档中的空格符号、回车符号等操作符号。因此,该数据信息集合可以包括汉字、数字、标点符号、外文字母以及操作符号,本发明实施例不做限定。
本发明实施例中,终端可以直接获取已经存在的目标图像中的数据信息集合,也可以通过摄像装置拍摄目标对象得到的目标图像,然后再获取该目标图像中的数据信息集合,本发明实施例不做限定。
本发明实施例中,目标图像中的原始数据信息集合可以是表格形式,也可以是文本形式,本发明实施例不做限定。
S102、终端判断该数据信息集合中是否包括第一特征标识。
本发明实施例中,当判断出该数据信息集合中包括第一特征标识时,终端就会执行步骤S103根据该第一特征标识对该数据信息集合进行分割,得到多个数据信息组。
本发明实施例中,第一特征标识用于指示位于该第一特征标识之前的数据信息与位于该第一特征标识之后的数据信息属于两个不同的数据信息组。其中,第一特征标识可以包括回车符号、逗号、顿号或句号本发明实施例不做限定。
举例来说,当获取的目标图像中的数据信息集合为:“小张123、小李765、小强367”时,终端就可以判断出该数据信息集合中包括了预先设置的第一特征标识—“、”,因此该终端会根据“、”将该数据信息集合进行分割。
S103、当步骤S102中判断出该数据信息集合包括第一特征标识时,终端根据第一特征标识对该数据信息集合进行分割,得到多个数据信息组。
本发明实施例中,当判断出该数据信息集合中包括第一特征标识时,终端就会根据该第一特征标识对该数据信息集合进行分割,从而得到多个数据信息组。
举例来说,在上一步骤S102的例子中,在判断出该数据信息集合中包括了预先设置的第一特征标识—“、”时,终端会根据“、”这个第一特征标识将该数据信息集合进行分割,得到分割结果:“小张123”,“小李765”以及“小强367”这三个数据信息组。
S104、终端分别对每一个数据信息组进行分割,得到该数据信息组的数据信息单元。
本发明实施例中,终端将该数据信息集合进行分割得到的每一个数据信息组进行再次分割,从而得到该数据信息组中的至少一个数据信息单元。例如,当数据信息集合根据第一特征标识分割得到的数据信息组的形式为:第一组:“小张123”、第二组:“小李765”、第三组:“小强367”以及第四组:“小文”时,终端对每一个数据信息组进行分割可以得到的以下结果:第一组:“小张”、“123”,第二组:“小李”、“765”,第三组:“小强”、“367”以及第四组:“小文”,此时如“小张”以及“123”均为第一数据信息组中的不同数据信息单元。
作为一种可选的实施方式,分别对每一个数据信息组进行分割,得到该数据信息组的数据信息单元的具体方式可以为:
针对每一个包括第二特征标识的数据信息组,终端会根据该数据信息组包括的第二特征标识对该数据信息组进行分割,得到该数据信息组的数据信息单元。
本发明实施例中,该第二特征标识用于指示位于该第二特征标识之前的数据信息元素与位于该第二特征标识之后的数据信息元素属于两个不同的数据信息单元。
举例来说,当终端根据第一特征标识将数据信息集合进行分割得到的数据信息组为:第一组:“小张123”、第二组:“小李765”以及第三组:“小强367”时,针对每一个数据信息组,终端会识别出该数据信息组包括有空格符号即第二特征标识,终端以此判断出该数据信息组中每一个空格符号前后的两个数据信息元素属于两个不同的数据信息单元,因此,该终端会以空格符号为依据,将每一个数据信息组进行分割。如判断出“张”与“1”之间有空格符号,因此“张”与“1”属于第一数据信息组中两个不同的数据信息单元。最后可以得到分割后的结果:第一组:“小张”、“123”,第二组:“小李”、“765”以及第三组:“小强”、“367”。
S105、终端将每一个数据信息组包括的数据信息单元输入到目标表格中。
本发明实施例中,在对每一个数据信息组进行分割得到数据信息单元之后,终端会将每一个数据信息组输入到目标表格中的不同行中,其中,同一个数据信息组包括的数据信息单元会被输入到目标表格中同一行的不同单元格中。因此,终端完成了将目标图像中显示的内容制作成目标表格的操作。
相应的,终端完成目标表格制作之后,会将该目标表格存储在终端中,用户可以打开该目标表格,并且可以对生成的目标表格进行操作。如,检查生成的目标表格是否与目标图像中显示的内容一致,当不一致时,用户可以对该目标表格进行修改,这样可以防止终端在生成表格的时候对少部分的数据信息识别的不准确。
本发明实施例中,终端首先可以获取目标图像中的数据信息集合,并判断该数据信息集合中是否包括第一特征标识,如果包括,就根据第一特征标识对该数据信息集合进行分割并得到多个数据信息组,然后分别对该数据信息组进行分割得到数据信息单元,最后将每一个数据信息组包括的数据信息单元输入到目标表格中。通过实施本发明实施例,终端可以将图像中显示的内容自动生成表格,提高了制作表格的效率。
请参阅图2,图2是本发明实施例公开的一种表格生成方法的流程示意图。其中,图2所示的方法可以应用于智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等具备文档处理功能的终端中。如图2所示,该表格生成方法可以包括以下步骤:
S201、终端获取目标图像中的数据信息集合。
本发明实施例中,终端首先会对目标图像中的数据信息进行扫描,生成文本文档,该文本文档中可以显示该目标图像中所显示的所有数据信息内容之外,并且终端还可以识别文本文档中的空格符号、回车符号等操作符号。因此,该数据信息集合可以包括汉字、数字、标点符号、外文字母以及操作符号,本发明实施例不做限定。
本发明实施例中,终端可以直接获取已经存在的目标图像中的数据信息集合,也可以通过摄像装置拍摄得到的目标图像,然后再获取该目标图像中的数据信息集合,本发明实施例不做限定。
本发明实施例中,目标图像中的原始数据信息集合可以是表格形式,也可以文本形式,本发明实施例不做限定。
S202、终端判断该数据信息集合中是否包括第一特征标识。
本发明实施例中,当判断出该数据信息集合中包括第一特征标识时,终端就会根据该第一特征标识对该数据信息集合进行分割,得到多个数据信息组,其中,第一特征标识用于指示位于该第一特征标识之前的数据信息与位于该第一特征标识之后的数据信息属于两个不同的数据信息组,第一特征标识可以包括回车符号、逗号、顿号或句号本发明实施例不做限定。当判断出该数据信息集合中不包括第一特征标识时,终端就会执行步骤S203按照该数据信息集合中包括的第二特征标识将该数据信息集合进行分割,得到多个数据信息单元。
S203、在步骤S202判断出该数据信息集合中不包括第一特征标识时,终端按照该数据信息集合包括的第二特征标识将该数据信息集合进行分割,得到多个数据信息单元。
本发明实施例中,当判断出该数据信息集合中不包括第一特征标识时,终端就会按照该数据信息集合包括的第二特征标识将该数据信息集合进行分割,得到多个数据信息单元。其中,第二特征标识用于指示位于该第二特征标识之前的数据信息元素与位于该第二特征标识之后的数据信息元素属于两个不同的数据信息单元,该第二特征标识可以包括空格符号,本发明实施例不做限定。
举例来说,当获取到的目标图像中的数据信息集合为:“王丽22female梅梅16female小勇18male渣渣5male”时,终端可以判断出该数据信息集合不包括第一特征标识,并判断出该数据信息集合中包括有“空格符号”即第二特征标识,因此,终端会根据空格符号将该数据信息集合分割为多个数据信息单元,分割后得到的结果为:“王丽”、“22”、“female”、“梅梅”、“16”、“female”、“小勇”、“18”、“male”、“渣渣”、“5”、“male”。
S204、终端对各个数据信息单元进行分析,得到各个数据信息单元的数据类型。
本发明实施例中,当得到分割后的该数据信息集合中的所有数据信息单元之后,终端会对每一个数据信息单元进行分析,并得到每一个数据信息单元对应的数据类型。
作为一种可选的实施方式,终端对各个数据信息单元进行分析,得到各个数据信息单元的数据类型的具体方式可以为:
步骤2041)终端针对每一个数据信息单元,获取该数据信息单元中的任意一个数据信息元素。
步骤2042)终端将该数据信息元素的各个部分的形状以及相对位置关系分别于存储在数据库中的原始数据信息元素的各个部分的形状以及相对位置关系进行匹配,识别出该数据信息元素的数据类型。
步骤2043)终端将该数据信息元素所属的数据信息单元的数据类型标记为该数据信息元素的数据类型。
本发明实施例中,数据库可以是终端的本地存储单元,可以预先存储多种类型的文字信息,如汉字、英文字母、数字、韩语、日语等,本发明实施例不做限定,该数据库也可以是远端的数据存储单元,用户可以通过网络查询远端数据存储单元中存储的多种类型的文字信息,本发明实施例不做限定。
本发明实施例中,终端会对每一个数据信息单元随机抽取出一个数据信息元素,并将该数据信息元素的各个部分的形状以及相对位置关系分别与存储在数据库中的原始数据信息元素的各个部分的形状以及相对位置关系进行对比匹配,当匹配到原始数据信息元素,终端就可以识别出该数据信息元素的数据类型为该原始数据信息元素的数据类型,从而标记该数据信息元素所属的数据信息单元的数据类型为该数据信息元素的数据类型。
举例来说,抽取“female”中的任意一个数据信息元素“m”,经过匹配,识别出该数据信息元素的数据类型为英文,因此,终端可以标记“m”所属的“female”的数据类型为英文,进而可以得出上一步骤S203中的例子的数据信息单元的数据类型分别为:汉字、数字、英文、汉字、数字、英文、汉字、数字、英文、汉字、数字、英文。
S205、终端根据各个数据信息单元的数据类型,将该数据信息集合中的各个数据信息单元划分为多个数据信息组。
本发明实施例中,每一个数据信息组中的数据信息单元的数量相同,每一个数据信息组中包括的数据信息单元是连续的,并且任意两个数据信息组中位于相同位置处的数据信息单元的数据类型也相同。
举例来说,终端将数据信息集合进行分割得到多个数据信息单元为:“王丽”、“22”、“female”、“梅梅”、“16”、“female”、“小勇”、“18”、“male”、“渣渣”、“5”、“male”,并识别出每一个数据信息单元的数据类型,分别为:汉字、数字、英文、汉字、数字、英文、汉字、数字、英文、汉字、数字、英文。因此,终端就可以根据各个数据信息单元的数据类型将这些数据信息单元划分为多个数据信息组,如:“王丽22female”,“梅梅16female”,“小勇18male”,“渣渣5male”,由此分组可以看出,每一个的数据信息组中的数据信息单元的数据类型的分布规律均为汉字-数字-英文,并且每一个数据信息单元相邻的两个数据信息单元与划分之前的数据信息集合中的分布是一致的。
S206、终端将每一个数据信息组包括的数据信息单元输入到目标表格中。
本发明实施例中,在根据各个数据信息单元的数据类型,将该数据信息集合中的各个数据信息单元进行划分得到多个数据信息组之后,终端会将每一个数据信息组输入到目标表格中的不同行中,其中,同一个数据信息组包括的数据信息单元会被输入到目标表格中同一行的不同单元格中。因此,终端完成了将目标图像中显示的内容制作成目标表格的操作。
相应的,终端完成目标表格制作之后,会将该目标表格存储在终端中,用户可以打开该目标表格,并且可以对生成的目标表格进行操作。如,检查生成的目标表格是否与目标图像中显示的内容一致,当不一致时,用户可以对该目标表格进行修改,这样可以防止终端在生成表格的时候对少部分的数据信息识别的不准确。
本发明实施例中,当数据信息集合中不包括能区分不同数据信息组的第一特征标识时,终端会先将该数据信息集合分割为多个数据信息单元,然后判断每一个数据信息单元的数据类型,并根据数据信息单元的数据类型的分布规律将数据信息集合中的数据信息单元划分到不同的数据信息组中,从而生成目标表格。通过这种方式可以将不具有明显的表格特性的数据信息,如文本信息生成表格,从而提高了制作表格的效率。
请参阅图3,图3是本发明实施例公开的一种表格生成终端的结构示意图。如图3所示,该终端300可以包括:获取模块301、判断模块302、第一分割模块303、第二分割模块304以及输入模块305,其中:
获取模块301,用于获取目标图像中的数据信息集合。
本发明实施例中,获取模块301首先会对目标图像中的数据信息进行扫描,生成文本文档,该文本文档中可以显示该目标图像中所显示的所有数据信息内容之外,并且终端300还可以识别文本中的空格符号、回车符号等操作符号。因此,该数据信息集合可以包括汉字、数字、标点符号、外文字母以及操作符号,本发明实施例不做限定。
本发明实施例中,获取模块301可以直接获取已经存在的目标图像中的数据信息集合,也可以通过摄像装置拍摄目标对象得到的目标图像,然后获取模块301再获取该目标图像中的数据信息集合,本发明实施例不做限定。
本发明实施例中,目标图像中的原始数据信息集合可以是表格形式,也可以是文本形式,本发明实施例不做限定。
判断模块302,用于判断上述获取模块301获取到的数据信息集合中是否包括第一特征标识。
本发明实施例中,当判断模块302判断出该数据信息集合中包括第一特征标识时,第一分割模块303就会根据该第一特征标识对该数据信息集合进行分割,得到多个数据信息组。
本发明实施例中,第一特征标识用于指示位于该第一特征标识之前的数据信息与位于该第一特征标识之后的数据信息属于两个不同的数据信息组。其中,第一特征标识可以包括回车符号、逗号、顿号或句号本发明实施例不做限定。
举例来说,当获取模块301获取的目标图像中的数据信息集合为:“小张123、小李765、小强367”时,判断模块302就可以判断出该数据信息集合中包括了预先设置的第一特征标识—“、”,因此第一分割模块303会根据“、”将该数据信息集合进行分割。
第一分割模块303,用于在上述判断模块302判断出该数据信息集合中包括第一特征标识时,根据第一特征标识对该数据信息集合进行分割,得到多个数据信息组。
本发明实施例中,当判断模块302判断出该数据信息集合中包括第一特征标识时,第一分割模块303就会根据该第一特征标识对该数据信息集合进行分割,从而得到多个数据信息组。
举例来说,在上述例子中,在判断模块302判断出该数据信息集合中包括了预先设置的第一特征标识—“、”时,第一分割模块303会根据“、”这个第一特征标识将该数据信息集合进行分割,得到分割结果:“小张123”,“小李765”以及“小强367”这三个数据信息组。
第二分割模块304,用于分别对每一个数据信息组进行分割,得到该数据信息组的数据信息单元。
本发明实施例中,第二分割模块304将该数据信息集合进行分割得到的每一个数据信息组进行再次分割,从而得到该数据信息组中的至少一个数据信息单元。例如,当数据信息集合根据第一特征标识分割得到的数据信息组的形式为:第一组:“小张123”、第二组:“小李765”、第三组:“小强367”以及第四组:“小文”时,第二分割模块304对每一个数据信息组进行分割可以得到的以下结果:第一组:“小张”、“123”,第二组:“小李”、“765”,第三组:“小强”、“367”以及第四组:“小文”,此时如“小张”以及“123”均为第一数据信息组中的不同数据信息单元。
作为一种可选的实施方式,上述第二分割模块304分别对每一个数据信息组进行分割,得到该数据信息组的数据信息单元的具体方式可以为:
针对每一个包括第二特征标识的数据信息组,第二分割模块304会根据该数据信息组包括的第二特征标识对该数据信息组进行分割,得到该数据信息组的数据信息单元。
本发明实施例中,该第二特征标识用于指示位于该第二特征标识之前的数据信息元素与位于该第二特征标识之后的数据信息元素属于两个不同的数据信息单元。
举例来说,当第一分割模块303根据第一特征标识将数据信息集合进行分割得到的数据信息组为:第一组:“小张123”、第二组:“小李765”以及第三组:“小强367”时,针对每一个数据信息组,第二分割模块304会识别出该数据信息组包括有空格符号即第二特征标识,第二分割模块304以此判断出该数据信息组中每一个空格符号前后的两个数据信息元素属于两个不同的数据信息单元,因此,第二分割模块304会以空格符号为依据,将每一个数据信息组进行分割。如判断出“张”与“1”之间有空格符号,因此“张”与“1”属于第一数据信息组中两个不同的数据信息单元。最后可以得到分割后的结果:第一组:“小张”、“123”,第二组:“小李”、“765”以及第三组:“小强”、“367”。
输入模块305,用于将每一个数据信息组包括的数据信息单元输入到目标表格中。
本发明实施例中,在上述第二分割单元304对每一个数据信息组进行分割得到数据信息单元之后,输入模块305会将每一个数据信息组输入到目标表格中的不同行中,其中,同一个数据信息组包括的数据信息单元会被输入到目标表格中同一行的不同单元格中。因此,终端300完成了将目标图像中显示的内容制作成目标表格的操作。
相应的,终端300完成目标表格制作之后,会将该目标表格存储在终端中,用户可以打开该目标表格,并且可以对生成的目标表格进行操作。如,检查生成的目标表格是否与目标图像中显示的内容一致,当不一致时,用户可以对该目标表格进行修改,这样可以防止终端300在生成表格的时候对少部分的数据信息识别的不准确。
本发明实施例中,终端首先可以获取目标图像中的数据信息集合,并判断该数据信息集合中是否包括第一特征标识,如果包括,就根据第一特征标识对该数据信息集合进行分割并得到多个数据信息组,然后分别对该数据信息组进行分割得到数据信息单元,最后将每一个数据信息组包括的数据信息单元输入到目标表格中。通过实施本发明实施例,终端可以将图像中显示的内容自动生成表格,提高了制作表格的效率。
请参阅图4,图4是本发明实施例公开的另一种表格生成终端的结构示意图。如图4所示,该终端400可以包括:获取模块401、判断模块402、第一粉各模块403、第二分割模块404、第三分割模块405、分析模块406、划分模块407以及输入模块408,其中:
获取模块401,用于获取目标图像中的数据信息集合。
判断模块402,用于判断上述获取模块401获取到的数据信息集合中是否包括第一特征标识。
本发明实施例中,当判断模块402判断出该数据信息集合中包括第一特征标识时,第一分割模块403就会根据该第一特征标识对该数据信息集合进行分割,得到多个数据信息组。第一特征标识用于指示位于该第一特征标识之前的数据信息与位于该第一特征标识之后的数据信息属于两个不同的数据信息组。其中,第一特征标识可以包括回车符号、逗号、顿号或句号本发明实施例不做限定。
当判断模块402判断出该数据信息集合中不包括第一特征标识时,第三分割模块405就会按照该数据信息集合中包括的第二特征标识将该数据信息集合进行分割,得到多个数据信息单元。
第一分割模块403,用于在上述判断模块402判断出该数据信息集合中包括第一特征标识时,根据第一特征标识对该数据信息集合进行分割,得到多个数据信息组。
第二分割模块404,用于分别对每一个数据信息组进行分割,得到该数据信息组的数据信息单元。
第三分割模块405,用于在上述判断模块402判断出该数据信息集合中不包括第一特征标识时,按照该数据信息集合包括的第二特征标识将该数据信息集合进行分割,得到多个数据信息单元。
本发明实施例中,当判断模块402判断出该数据信息集合中不包括第一特征标识时,第三粉各模块405就会按照该数据信息集合包括的第二特征标识将该数据信息集合进行分割,得到多个数据信息单元。其中,第二特征标识用于指示位于该第二特征标识之前的数据信息元素与位于该第二特征标识之后的数据信息元素属于两个不同的数据信息单元,该第二特征标识可以包括空格符号,本发明实施例不做限定。
举例来说,当获取模块401获取到的目标图像中的数据信息集合为:“王丽22female梅梅16female小勇18male渣渣5male”时,判断模块402可以判断出该数据信息集合不包括第一特征标识,并判断出该数据信息集合中包括第二特征标识“空格符号”即第二特征标识,因此,第三分割模块405会根据空格符号将该数据信息集合分割为多个数据信息单元,分割后得到的结果为:“王丽”、“22”、“female”、“梅梅”、“16”、“female”、“小勇”、“18”、“male”、“渣渣”、“5”、“male”。
分析模块406,用于对上述第三分割模块405对该数据信息集合进行分割得到的各个数据信息单元进行分析,得到各个数据信息单元的数据类型。
本发明实施例中,当得到分割后的该数据信息集合中的所有数据信息单元时,分析模块406会对每一个数据信息单元进行分析,并得到每一个数据信息单元对应的数据类型。
作为一种可选的实施方式,该分析模块可以包括:
获取单元4061,用于针对每一个数据信息单元,获取该数据信息单元中的任意一个数据信息元素。
匹配单元4062,用于将获取单元4061获取到的数据信息元素的各个部分的形状以及相对位置关系分别于存储在数据库中的原始数据信息元素的各个部分的形状以及相对位置关系进行匹配,识别出该数据信息元素的数据类型。
标记单元4063,用于将该数据信息元素所属的数据信息单元的数据类型标记为该数据信息元素的数据类型。
本发明实施例中,数据库可以是终端400的本地存储单元,可以预先存储多种类型的文字信息,如汉字、英文字母、数字、韩语、日语等,本发明实施例不做限定,该数据库也可以是远端的数据存储单元,用户可以通过网络查询远端数据存储单元中存储的多种类型的文字信息,本发明实施例不做限定。
本发明实施例中,获取单元4061会对每一个数据信息单元随机抽取出一个数据信息元素,匹配单元4062将该数据信息元素的各个部分的形状以及相对位置关系分别与存储在数据库中的原始数据信息元素的各个部分的形状以及相对位置关系进行对比匹配,当匹配到原始数据信息元素,匹配单元就可以识别出该数据信息元素的数据类型为该原始数据信息元素的数据类型,从而标记单元4063就可以标记出该数据信息元素所属的数据信息单元的数据类型为该数据信息元素的数据类型。
举例来说,获取单元4061抽取“female”中的任意一个数据信息元素“m”,经过匹配单元4062匹配,识别出该数据信息元素的数据类型为英文,因此,标记单元4063可以标记“m”所属的“female”的数据类型为英文,进而可以得出上述例子的数据信息单元的数据类型分别为:汉字、数字、英文、汉字、数字、英文、汉字、数字、英文、汉字、数字、英文。
划分模块407,用于根据上述分析模块406分析出的各个数据信息单元的数据类型,将该数据信息集合中的各个数据信息单元划分为多个数据信息组。
本发明实施例中,每一个数据信息组中的数据信息单元的数量相同,每一个数据信息组中包括的数据信息单元是连续的,并且任意两个数据信息组中位于相同位置处的数据信息单元的数据类型也相同。
举例来说,第三分割模块405将数据信息集合进行分割得到多个数据信息单元为:“王丽”、“22”、“female”、“梅梅”、“16”、“female”、“小勇”、“18”、“male”、“渣渣”、“5”、“male”,分析模块406识别出每一个数据信息单元的数据类型,分别为:汉字、数字、英文、汉字、数字、英文、汉字、数字、英文、汉字、数字、英文。因此,划分模块407就可以根据各个数据信息单元的数据类型将这些数据信息单元划分为多个数据信息组,如:“王丽22female”,“梅梅16female”,“小勇18male”,“渣渣5male”,由此分组可以看出,每一个数据信息组中的数据信息单元数据类型的分布规律均为汉字-数字-英文,并且每一个数据信息单元相邻的两个数据信息单元与划分之前的数据信息集合中的分布是一致的。
输入模块408,用于将每一个数据信息组包括的数据信息单元输入到目标表格中。
本发明实施例中,在划分模块407根据各个数据信息单元的数据类型,将该数据信息集合中的各个数据信息单元进行划分得到多个数据信息组之后,或在第二分割单元404对每一个数据信息组进行分割得到数据信息单元之后,输入模块408会将每一个数据信息组中的数据信息单元输入到目标表格中的不同行中,其中,同一个数据信息组包括的数据信息单元会被输入到目标表格中同一行的不同单元格中。因此,终端400完成了将目标图像中显示的内容制作成目标表格的操作。
相应的,终端400完成目标表格制作之后,会将该目标表格存储在终端中,用户可以打开该目标表格,并且可以对生成的目标表格进行操作。如,检查生成的目标表格是否与目标图像中显示的内容一致,当不一致时,用户可以对该目标表格进行修改,这样可以防止终端400在生成表格的时候对个别的数据信息识别的不准确。
通过实施本发明实施例,终端既可以将原本是就表格形式的目标图像的显示数据信息生成表格,还可以将不具有明显的表格特性的数据信息,如文本信息生成表格,能够提高了制作表格的效率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (10)

1.一种表格生成方法,其特征在于,所述方法包括:
获取目标图像中的数据信息集合,并判断所述数据信息集合中是否包括第一特征标识,所述第一特征标识用于指示位于所述第一特征标识之前的数据信息与位于所述第一特征标识之后的数据信息属于两个不同的数据信息组;
若包括,则根据所述第一特征标识对所述数据信息集合进行分割,得到多个数据信息组;
分别对每一个所述数据信息组进行分割,得到该数据信息组的数据信息单元;
将每一个所述数据信息组包括的数据信息单元输入到目标表格中,其中,一个所述数据信息组包括的数据信息单元被输入到同一行的不同单元格中。
2.根据权利要求1所述的方法,其特征在于,所述分别对每一个所述数据信息组进行分割,得到该数据信息组的数据信息单元,包括:
针对每一个包括第二特征标识的数据信息组,根据该数据信息组包括的所述第二特征标识对该数据信息组进行分割,得到该数据信息组的数据信息单元,其中,所述第二特征标识用于指示位于所述第二特征标识之前的数据信息元素与位于所述第二特征标识之后的数据信息元素属于两个不同的数据信息单元。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
若判断出所述数据信息集合中未包括所述第一特征标识,则按照所述数据信息集合包括的第二特征标识将所述数据信息集合进行分割,得到多个数据信息单元;
根据各个所述数据信息单元的数据类型,将所述数据信息集合中的各个所述数据信息单元划分为多个数据信息组,其中,每个所述数据信息组中具有相同数量的数据信息单元,每个所述数据信息组中包括的数据信息单元是连续的,且任意两个所述数据信息组中位于相同位置处的数据信息单元的数据类型相同;
将每一个所述数据信息组包括的数据信息单元输入到目标表格中,其中,一个数据信息组包括的数据信息单元被输入到同一行的不同单元格中。
4.根据权利要求3所述的方法,其特征在于,所述若判断出所述数据信息集合中未包括所述第一特征标识,则按照所述数据信息集合包括的第二特征标识将所述数据信息集合进行分割,得到多个数据信息单元之后,所述方法还包括:
对各个所述数据信息单元进行分析,得到各个所述数据信息单元的数据类型;
执行所述根据各个所述数据信息单元的数据类型,将所述数据信息集合中的各个所述数据信息单元划分为多个数据信息组的步骤。
5.根据权利要求4所述的方法,其特征在于,所述对各个所述数据信息单元进行分析,得到各个所述数据信息单元的数据类型,包括:
针对每一个所述数据信息单元,获取该数据信息单元中的任意一个数据信息元素;
将该数据信息元素的各个部分的形状及相对位置关系分别与存储在数据库中的原始数据信息元素的各个部分的形状及相对位置关系进行匹配,识别出该数据信息元素的数据类型;
将该数据信息元素所属的数据信息单元的数据类型标记为该数据信息元素的数据类型。
6.一种表格生成终端,其特征在于,所述终端包括:
获取模块,用于获取目标图像中的数据信息集合;
判断模块,用于判断所述数据信息集合中是否包括第一特征标识,其中,所述第一特征标识用于指示位于所述第一特征标识之前的数据信息与位于所述第一特征标识之后的数据信息属于两个不同的数据信息组;
第一分割模块,用于在所述判断模块的判断结果为是时,根据所述第一特征标识对所述数据信息集合进行分割,得到多个数据信息组;
第二分割模块,用于分别对每一个所述数据信息组进行分割,得到该数据信息组的数据信息单元;
输入模块,用于将每一个所述数据信息组包括的数据信息单元输入到目标表格中,其中,一个数据信息组包括的数据信息单元被输入到同一行的不同单元格中。
7.根据权利要求6所述的终端,其特征在于,所述第二分割模块分别对每一个所述数据信息组进行分割,得到该数据信息组的数据信息单元的具体方式为:
针对每一个包括第二特征标识的数据信息组,根据该数据信息组包括的所述第二特征标识对该数据信息组进行分割,得到该数据信息组的数据信息单元,其中,所述第二特征标识用于指示位于所述第二特征标识之前的数据信息元素与位于所述第二特征标识之后的数据信息元素属于两个不同的数据信息单元。
8.根据权利要求6或7所述的终端,其特征在于,所述终端还包括:
第三分割模块,用于在所述判断模块的判断结果为否时,按照所述数据信息集合包括的第二特征标识将所述数据信息集合进行分割,得到多个数据信息单元;
划分模块,用于根据各个所述数据信息单元的数据类型,将所述数据信息集合中的各个所述数据信息单元划分为多个数据信息组,其中,每个所述数据信息组中具有相同数量的数据信息单元,每个所述数据信息组中包括的数据信息单元是连续的,且任意两个所述数据信息组中位于相同位置处的数据信息单元的数据类型相同;
所述输入模块具体用于将每一个所述数据信息组包括的数据信息单元输入到目标表格中,其中,一个所述数据信息组包括的数据信息单元被输入到同一行的不同单元格中。
9.根据权利要求8所述的终端,其特征在于,所述终端还包括:
分析模块,用于在所述划分模块根据各个所述数据信息单元的数据类型,将所述数据信息集合中的各个所述数据信息单元划分为多个数据信息组之前,所述第二分割模块按照所述数据信息集合包括的第二特征标识将所述数据信息集合进行分割,得到多个数据信息单元之后,对各个所述数据信息单元进行分析,得到各个所述数据信息单元的数据类型。
10.根据权利要求9所述的终端,其特征在于,所述分析模块包括:
获取单元,用于针对每一个所述数据信息单元,获取该数据信息单元中的任意一个数据信息元素;
匹配单元,用于将该数据信息元素的各个部分的形状及相对位置关系分别与存储在数据库中的原始数据信息元素的各个部分的形状及相对位置关系进行匹配,识别出该数据信息元素的数据类型;
标记单元,用于将该数据信息元素所属的数据信息单元的数据类型标记为该数据信息元素的数据类型。
CN201410746322.0A 2014-12-08 2014-12-08 一种表格生成方法及终端 Active CN104536946B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410746322.0A CN104536946B (zh) 2014-12-08 2014-12-08 一种表格生成方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410746322.0A CN104536946B (zh) 2014-12-08 2014-12-08 一种表格生成方法及终端

Publications (2)

Publication Number Publication Date
CN104536946A true CN104536946A (zh) 2015-04-22
CN104536946B CN104536946B (zh) 2018-03-27

Family

ID=52852474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410746322.0A Active CN104536946B (zh) 2014-12-08 2014-12-08 一种表格生成方法及终端

Country Status (1)

Country Link
CN (1) CN104536946B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1188929A (zh) * 1996-11-20 1998-07-29 松下电器产业株式会社 发送数据的方法、发送数据的设备以及媒体
CN101099166A (zh) * 2005-01-24 2008-01-02 环球评估株式会社 字符串符号生成装置和字符串符号生成方法及贮存字符串符号生成程序的存储媒体
CN101859309A (zh) * 2009-04-07 2010-10-13 慧科讯业有限公司 重复文本识别系统及方法
CN102387200A (zh) * 2011-10-20 2012-03-21 中国科学院上海微系统与信息技术研究所 基于labview和数据库的传感器网络后端数据处理方法
CN102567299A (zh) * 2010-12-14 2012-07-11 微软公司 使用文本消息与电子表格交互
CN102622195A (zh) * 2011-01-13 2012-08-01 联发科技股份有限公司 信息浏览方法
CN102637190A (zh) * 2011-01-24 2012-08-15 微软公司 将已捕捉图像数据与电子表格相关联
US20120222000A1 (en) * 2001-08-16 2012-08-30 Smialek Michael R Parser, Code Generator, and Data Calculation and Transformation Engine for Spreadsheet Calculations
CN102799574A (zh) * 2012-06-29 2012-11-28 无锡永中软件有限公司 电子表格的数据分割和合并方法
CN102937948A (zh) * 2012-10-31 2013-02-20 广东欧珀移动通信有限公司 一种移动终端的图文数据编辑方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1188929A (zh) * 1996-11-20 1998-07-29 松下电器产业株式会社 发送数据的方法、发送数据的设备以及媒体
US20120222000A1 (en) * 2001-08-16 2012-08-30 Smialek Michael R Parser, Code Generator, and Data Calculation and Transformation Engine for Spreadsheet Calculations
CN101099166A (zh) * 2005-01-24 2008-01-02 环球评估株式会社 字符串符号生成装置和字符串符号生成方法及贮存字符串符号生成程序的存储媒体
CN101859309A (zh) * 2009-04-07 2010-10-13 慧科讯业有限公司 重复文本识别系统及方法
CN102567299A (zh) * 2010-12-14 2012-07-11 微软公司 使用文本消息与电子表格交互
CN102622195A (zh) * 2011-01-13 2012-08-01 联发科技股份有限公司 信息浏览方法
CN102637190A (zh) * 2011-01-24 2012-08-15 微软公司 将已捕捉图像数据与电子表格相关联
CN102387200A (zh) * 2011-10-20 2012-03-21 中国科学院上海微系统与信息技术研究所 基于labview和数据库的传感器网络后端数据处理方法
CN102799574A (zh) * 2012-06-29 2012-11-28 无锡永中软件有限公司 电子表格的数据分割和合并方法
CN102937948A (zh) * 2012-10-31 2013-02-20 广东欧珀移动通信有限公司 一种移动终端的图文数据编辑方法

Also Published As

Publication number Publication date
CN104536946B (zh) 2018-03-27

Similar Documents

Publication Publication Date Title
CN106484266B (zh) 一种文本处理方法及装置
CN106815192B (zh) 模型训练方法及装置和语句情感识别方法及装置
CN103020619B (zh) 一种自动切分电子化笔记本中手写条目的方法
CN105184126A (zh) 一种密码设置方法、验证方法和终端
CN103488482A (zh) 一种生成测试用例的方法和装置
CN104866308A (zh) 一种场景图像的生成方法及装置
CN104750791A (zh) 一种图像检索方法及装置
CN105426944A (zh) 方形点阵防伪标签组、以及对其进行识读的方法与系统
CN102929394B (zh) 一种基于手势识别的盲文输入法
CN106294480A (zh) 一种文件格式转换方法、装置及试题导入系统
CN106650720A (zh) 基于文字识别技术的网上评卷方法、装置及系统
CN105184595A (zh) 基于移动互联大数分析技术的二维码防伪云系统及使用方法
CN114170468B (zh) 文本识别方法、存储介质及计算机终端
CN108932434B (zh) 一种基于机器学习技术的数据加密方法及装置
JP2019522847A (ja) データを抽出するための方法、デバイス及び端末デバイス
CN105094562A (zh) 一种信息处理方法及终端
CN104463419A (zh) 课堂中实现多维评价数据记录的方法
CN109145879B (zh) 一种打印字体识别的方法、设备及存储介质
CN104850819B (zh) 信息处理方法及电子设备
CN111027533A (zh) 一种点读坐标的变换方法、系统、终端设备及存储介质
CN116052195A (zh) 文档解析方法、装置、终端设备和计算机可读存储介质
CN107169517B (zh) 判断重复笔画的方法、终端设备及计算机可读存储介质
CN104536946A (zh) 一种表格生成方法及终端
CN106372223B (zh) 一种内容快速搜索方法和装置
CN104899309B (zh) 展示事件评论观点的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18

Patentee after: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd.

Address before: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18

Patentee before: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd.