CN112632929B - 一种基于表格数据智能推荐图表的方法、装置和电子设备 - Google Patents

一种基于表格数据智能推荐图表的方法、装置和电子设备 Download PDF

Info

Publication number
CN112632929B
CN112632929B CN201910895041.4A CN201910895041A CN112632929B CN 112632929 B CN112632929 B CN 112632929B CN 201910895041 A CN201910895041 A CN 201910895041A CN 112632929 B CN112632929 B CN 112632929B
Authority
CN
China
Prior art keywords
column
category
chart
columns
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910895041.4A
Other languages
English (en)
Other versions
CN112632929A (zh
Inventor
辛洋
苏奕虹
皮霞林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201910895041.4A priority Critical patent/CN112632929B/zh
Publication of CN112632929A publication Critical patent/CN112632929A/zh
Application granted granted Critical
Publication of CN112632929B publication Critical patent/CN112632929B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种基于表格数据智能推荐图表的方法、装置和电子设备。该方法包括:确定待创建图表的表格数据;按照预定的列确定方式,从所述表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列;针对每一所述类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果;基于所确定的推荐结果,输出所述表格数据对应的图表推荐信息。通过本方案可以达到减少用户反复的修改操作,从而提升图表创建效率的目的。

Description

一种基于表格数据智能推荐图表的方法、装置和电子设备
技术领域
本发明涉及计算机技术领域,特别是涉及一种基于表格数据智能推荐图表的方法、装置和电子设备。
背景技术
图表能将表格数据以可视化的方式展示,因此在办公中扮演重要角色。其中,图表包括两部分:图像区域和标签区域,图像区域中的图像基于系列值列绘制,标签区域中的标签基于类别列命名,系列值列和类别列为从待创建图表的表格数据的各列中所确定的。同时,图表的类型分为柱形图、折线图、散点图、饼图等,系列值列数目和类别列内数据的类型的不同会导致适合绘制的图表类型不同。比如:系列值列数大于一,则该表格数据不适合绘制饼图;类别列内数据为数字类型,则该表格数据适合绘制散点图。
现有技术中,在创建图表时,用户选中所需的图表类型,表格处理客户端按照用户所选中的图表类型,创建表格数据对应的图表。具体的,创建表格数据对应的图表时,表格处理客户端按照与所选中图表类型相对应的列确定方式,从表格数据的各列中确定系列值列和类别列,进而,利用所确定的系列值列和类别列,创建表格数据的图表。
但是,表格数据存在多列时,适合做系列值列和类别列的列并不是固定的列,同时,不同的表格数据所适用于的图表类型也可能不同,这样导致用户通过选中图表类型所形成的图表经常不符合用户所需的展示效果。而为了达到用户所需的展示效果,用户需要通过反复修改数据源并尝试各种不同图表类型,无疑导致图表创建的效率较低。
发明内容
本发明实施例的目的在于提供一种基于表格数据智能推荐图表的方法、装置和电子设备,以通过为用户提供图表推荐信息,达到减少用户反复的修改操作,从而提升图表创建效率的目的。具体技术方案如下:
本发明实施例提供一种基于表格数据智能推荐图表的方法,包括:
确定待创建图表的表格数据;
按照预定的列确定方式,从所述表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列;
针对每一所述类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果,其中,所述目标列包括各个所述系列值列中的一列或多列;
基于所确定的推荐结果,输出所述表格数据对应的图表推荐信息,所述图表推荐信息用于表示针对每一所述类别列,以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果。
可选地,按照预定的列确定方式,从所述表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列,包括:
遍历所述表格数据的各列,当遍历到每一列时,如果该列为纯数值的列,将该列确定为系列值列,并将所确定出的第一个系列值列之前的各列均作为类别列;
并在未确定出类别列时,补充一列,作为类别列,所补充的一列中单元格的内容用于对系列值列的单元格的内容进行标识。
可选地,所述方法还包括:
在未确定出类别列时,当所述表格数据的列数为两列时,将第一列确定为类别列,并将第二列确定为系列值列。
可选地,按照预定的列确定方式,从所述表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列,包括:
若所述表格数据的列数为两列,将第一列确定为类别列,并将第二列确定为系列值列;
若所述表格数据的列数大于两列,遍历所述表格数据的各列,当遍历到每一列时,如果该列为纯数值的列,将该列确定为系列值列,并将所确定出的第一个系列值列之前的各列均作为类别列。
可选地,所述方法还包括:
若所述表格数据的列数大于两列但未确定出类别列,或者,所述表格数据的列为一列,则补充一列,作为类别列,所补充的一列中单元格的内容用于对系列值列的单元格的内容进行标识。
可选地,针对每一所述类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果,包括:
针对每一所述类别列,将该类别列的特征数据和目标列的特征数据作为输入数据,输入至预先训练完成的分类模型,得到以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果;
其中,所述分类模型为基于样本类别列的特征数据和各个样本系列值列的特征数据,以及所述样本类别对应的标注信息,所训练的模型,所述样本类别列对应的标注信息包括:以所述样本类别列和各个所述系列值列创建图表时对应的图表类型的推荐结果。
可选地,针对每一所述类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果之前,所述方法还包括:
确定各个系列值列的数量、系列值列中单元格的数量和/或各个类别列是否为纯数值类型的列的判断结果;
基于所述各个系列值列的数量、系列值列中单元格数量和/或各个类别列是否为纯数值类型的列判断结果,确定关于图表的各个可创建类型;
所述各个图表类型为所述各个可创建类型。
可选地,所述特征数据,包括如下数据中的一种或多种:
数据类型、最长字符长度、最长字符长度的单元格内中文/英文的字符长度、内容不为空的单元格个数、内容为数字且比列的平均值大的单元格个数、内容为数字且比列的平均值的一半小的单元格个数、整列数据类型是否非数字类型,以及,在整列数据类型为数字类型的情况下,是否整列数据之和为特定值、是否整列数据组成的列为递增序列、是否整列数据组成的列为递减序列。
本发明实施例还提供一种基于表格数据智能推荐图表的装置,包括:
表格数据确定模块,用于确定待创建图表的表格数据;
列类型确定模块,用于按照预定的列确定方式,从所述表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列;
图表类型推荐模块,用于针对每一所述类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果,其中,所述目标列包括各个所述系列值列中的一列或多列;
推荐结果输出模块,用于基于所确定的推荐结果,输出所述表格数据对应的图表推荐信息,所述图表推荐信息用于表示针对每一所述类别列,以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果。
可选地,所述列类型确定模块,具体用于:
遍历所述表格数据的各列,当遍历到每一列时,如果该列为纯数值的列,将该列确定为系列值列,并将所确定出的第一个系列值列之前的各列均作为类别列;
并在未确定出类别列时,补充一列,作为类别列,所补充的一列中单元格的内容用于对系列值列的单元格的内容进行标识。
可选地,所述列类型确定模块,还用于:
在未确定出类别列时,当所述表格数据的列数为两列时,将第一列确定为类别列,并将第二列确定为系列值列。
可选地,所述列类型确定模块,具体用于:
若所述表格数据的列数为两列,将第一列确定为类别列,并将第二列确定为系列值列;
若所述表格数据的列数大于两列,遍历所述表格数据的各列,当遍历到每一列时,如果该列为纯数值的列,将该列确定为系列值列,并将所确定出的第一个系列值列之前的各列均作为类别列。
可选地,所述列类型确定模块,还用于:
若所述表格数据的列数大于两列但未确定出类别列,或者,所述表格数据的列为一列,则补充一列,作为类别列,所补充的一列中单元格的内容用于对系列值列的单元格的内容进行标识。
可选地,所述图表类型推荐模块,具体用于:
针对每一所述类别列,将该类别列的特征数据和目标列的特征数据作为输入数据,输入至预先训练完成的分类模型,得到以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果;
其中,所述分类模型为基于样本类别列的特征数据和各个样本系列值列的特征数据,以及所述样本类别对应的标注信息,所训练的模型,所述样本类别列对应的标注信息包括:以所述样本类别列和各个所述系列值列创建图表时对应的图表类型的推荐结果。
可选地,所述图表类型推荐模块还用于:针对每一所述类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果之前,
确定各个系列值列的数量、系列值列中单元格的数量和/或各个类别列是否为纯数值类型的列的判断结果;
基于所述各个系列值列的数量、系列值列中单元格数量和/或各个类别列是否为纯数值类型的列判断结果,确定关于图表的各个可创建类型;
所述各个图表类型为所述各个可创建类型。
可选地,所述特征数据,包括如下数据中的一种或多种:
数据类型、最长字符长度、最长字符长度的单元格内中文/英文的字符长度、内容不为空的单元格个数、内容为数字且比列的平均值大的单元格个数、内容为数字且比列的平均值的一半小的单元格个数、整列数据类型是否非数字类型,以及,在整列数据类型为数字类型的情况下,是否整列数据之和为特定值、是否整列数据组成的列为递增序列、是否整列数据组成的列为递减序列。
本发明实施例还提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的基于表格数据智能推荐图表的方法步骤。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的基于表格数据智能推荐图表的方法步骤。
本发明实施例有益效果:
本发明实施例提供的一种基于表格数据智能推荐图表的方法,其实现步骤如下:表格处理客户端基于待创建图表的表格数据的数据内容,输出表格数据对应的图表推荐信息,使得用户在创建图表之前,可以基于图表推荐信息,选择建立图表时的较为合适的类型,以及图表中的类别列和系列值列,避免了用户反复操作。因此,通过本方案可以达到减少用户反复的修改操作,从而提升图表创建效率的目的。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于表格数据智能推荐图表的方法的流程图;
图2A为本发明实施例示例性提供的列数为一列的表格;
图2B为本发明实施例示例性提供的列数为两列的表格;
图3为本发明实施例提供的步骤102的一种具体实现方式的流程图;
图4为本发明实施例提供的步骤103的另一种实现方式的流程图;
图5A为本发明实施例示例性提供的列数为多列的表格;
图5B为本发明实施例示例性提供的列数为两列的表格;
图6为本发明实施例提供的基于表格数据智能推荐图表的装置的结构图;
图7为本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为减少用户在实际创建过程中,反复修改数据源与尝试不同的图表类型,本发明实施例提供一种基于表格数据智能推荐图表的方法,能实现通过为用户提供图表推荐信息,达到减少用户反复的修改操作,从而提升图表创建效率的目的。
其中,本发明实施例所提供的一种基于表格数据智能推荐图表的方法适用于电子设备中,例如:智能手机、平板电脑、计算机等。具体的,本发明实施例所提供的一种基于表格数据智能推荐图表的方法的执行主体可以为运行于电子设备中的表格处理客户端。
如图1所示,本发明实施例所提供的一种基于表格数据智能推荐图表的方法,可以包括如下步骤:
步骤101、确定待创建图表的表格数据。
在具体应用中,待创建图表的表格数据为表格中用户选中区域内的数据,并且,该待创建图表的表格数据为以纵向排列的数据。可以理解的是,后续为识别出待创建图表的表格数据的列的类型,需要遍历每一列数据进行确定,因此,所述待创建图表的表格数据需以纵向排列。其中,纵向排列即每一列代表一类数据。
步骤102、按照预定的列确定方式,从表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列。
在确定出待创建图表的表格数据后,由于创建图表时需要依赖系列值列来绘制图表的图像区域,而依赖类别列来绘制图表的标签区域,因此,为了实现图表信息的推荐,本步骤中,按照预定的列确定方式,从表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列。
关于按照预定的列确定方式,从表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列的具体实现方式存在多种。为了方案清楚及布局清晰,后续对所述按照预定的列确定方式,从表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列的具体实现方式进行举例介绍。
步骤103、针对每一类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个系列值列创建图表时对应的各个图表类型的推荐结果,其中,目标列包括各个系列值列中的一列或多列。
在确定出各个系列值列和各个类别列之后,由于确定针对各个图表类型的推荐结果需要输入系列值列的特征数据和类别列的特征数据,因此要先确定出各个类别列的特征数据和目标列的特征数据。
其中,本步骤所述的特征数据包括以下数据中的一种或多种:
数据类型、最长字符长度、最长字符长度的单元格内中文/英文的字符长度、内容不为空的单元格个数、内容为数字且比列的平均值大的单元格个数、内容为数字且比列的平均值的一半小的单元格个数、整列数据类型是否非数字类型,以及,在整列数据类型为数字类型的情况下,是否整列数据之和为特定值、是否整列数据组成的列为递增序列、是否整列数据组成的列为递减序列。
其中,数据类型、最长字符长度、最长字符长度的单元格内中文/英文的字符长度、内容不为空的单元格个数,为表格处理客户端遍历整列的单元格内容而确定的;
内容为数字且比列的平均值大的单元格个数的确定过程为:表格处理客户端遍历整列单元格内容,判断整列单元格内容是否包含非数字内容;若包含非数字内容,则结果为0;若不包含非数字内容,则计算整列单元格内容的平均值,并根据每个单元格内容计算比该平均值大的单元格个数,将所计算得到的个数作为结果;
内容为数字且比列的平均值的一半小的单元格个数的确定过程为:表格处理客户端遍历整列单元格内容,判断整列单元格内容是否包含非数字内容;若包含非数字内容,则结果为0;若不包含非数字内容,则计算整列单元格内容的平均值的一半,并根据每个单元格内容计算比该平均值的一半小的单元格个数,将所计算得到的个数作为结果;
在整列数据类型为数字类型的情况下,是否整列数据之和为特定值、是否整列数据组成的列为递增序列、是否整列数据组成的列为递减序列为表格处理客户端遍历整列单元格内容,并确定出整列单元格内容全为数字内容的情况下,计算整列单元格之和是否为特定值、整列单元格内容组成的列是否为递增序列、整列单元格内容组成的列是否为递减序列。
示例性的,数据类型可以为文本、数值、日期、时间等等;而特定值可以为1,10,100,1000等,具体值可以根据实际情况设定。
另外,在确定各个类别列的特征数据与目标列的特征数据的过程中,该目标列可以是系列值列中的一列或者多列。示例性的,确定的特征数据可以是各个类别列的特征数据和第一列系列值的特征数据,也可以是各个类别列的特征数据和第一列系列值、第二列系列值列的特征数据。
另外,所确定的对于各个图表类型的推荐结果的具体展示形式存在多种。示例性的,推荐结果的具体展示形式可以是表征推荐程度的百分数,表征推荐程度的小数,推荐/不推荐的结果内容,最推荐/较推荐/不推荐的结果内容。等形式展示。
所述针对每一类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个系列值列创建图表时对应的各个图表类型的推荐结果的具体实现方式,下文进行示例性的介绍。
步骤104、基于所确定的推荐结果,输出表格数据对应的图表推荐信息。
其中,图表推荐信息用于表示针对每一类别列,以该类别列和各个系列值列创建图表时对应的各个图表类型的推荐结果。
在一个具体的实施例中,图表推荐信息可以以弹窗,表格,提示框,可选选项的功能入口等形式展示。
上述实施例实现了基于表格处理客户端确定的待创建图表的表格数据,确定了该表格数据中的系列值列与类别列,从而输出针对各个类别列和系列值列的图表推荐信息,使得用户可以基于该图表推荐信息,选择建立图表时较为合适的类型,以及图表中的类别列和系列值列,避免了用户的反复操作,从而提升了图表创建的效率。
在一个具体的实施例中,如图3所示,上述步骤102可以通过以下方式实现:
步骤301、遍历表格数据的各列,当遍历到每一列时,如果该列为纯数值的列,将该列确定为系列值列,并将所确定出的第一个系列值列之前的各列均作为类别列。
本步骤中,纯数值的列是指,本列中除了第一行单元格内容,其他单元格内容均为数字类型。由于系列值列的单元格内容除第一行外为纯数值,因此,在确定表格数据的各列是否为系列值列与类别列,可以通过遍历各列的单元格内容的类型以确定。其实现过程如下:遍历表格数据的各列,当遍历到每一列时,若该列的单元格内容除第一行外包含非数字内容,则继续遍历下一列,若该列的单元格内容除第一行外均包含数值类型的内容,确定该列为纯数值的列,并将该列作为系列值列;并且,将第一个系列值列之前的列均作为类别列。
步骤302、在未确定出类别列时,补充一列,作为类别列,所补充的一列中单元格的内容用于对系列值列的单元格的内容进行标识。
由于存在仅仅具有纯数值的列的表格数据,此时,第一个系列值列为表格数据的第一列,因此,为了使得表格数据能够被转换为图表,可以在未确定出类别列的情况下,补充一列,作为类别列,该补充的一列中的单元格的内容用于对系列值列的单元格的内容进行标识。示例性的,所述补充的一列可以是一种从一开始的递增列,以对系列值列的单元格的内容进行标识。为了方便理解方案,参见图2A所示,表格处理客户端确定出的待创建图表的表格数据区域仅有一列“人数”列,无类别列,因此在此处可以补充一列类别列,以用于对“人数”列中的单元格内容进行标识。
基于以上提出的实现方式,通过遍历步骤101中所确定的待创建图表的表格数据的每一列,实现了系列值列和类别列的确定,同时在没有确定出类别列的情况下,补充一个类别列,实现了针对无类别列的待创建图表的表格数据的列类型的确定。
此外,在具体的实施例中,在上述步骤301和302的基础上,若未确定出类别列,同时表格数据的列数为两列,将第一列确定为类别列,并将第二列确定为系列值列。为了方便理解方案,参见图2B,图2B所示的表格数据仅有两列,一列为“人数”列,一列为“未打卡人数”列,经表格处理客户端确认该两列均为系列值列,不存在类别列,因此,表格处理客户端将“人数”列确认为类别列,并将“未打卡人数”列确认为系列值列。
在未确定出类别列,同时表格的列数为两列的情况下,基于以上方式,使得纯数值的列也可作为类别列,使得推荐结果更加丰富。
此外,为了快速确定系列值列和类别列,可以根据表格列数选择确定方式,针对不同列数,根据不同的确定方式确定系列值列和类别列。基于上述描述,在另一种具体的实施例中,如图4所示,上述步骤102可以通过以下方式实现:
步骤401、若表格数据的列数为两列,将第一列确定为类别列,并将第二列确定为系列值列;
步骤402、若表格数据的列数大于两列,遍历表格数据的各列,当遍历到每一列时,如果该列为纯数值的列,将该列确定为系列值列,并将所确定出的第一个系列值列之前的各列均作为类别列。
此外,考虑到表格数据可以存在多列也可以仅仅存在一列,或者,即便存在多列也未查找到类别列的情况,为了适用于各种表格数据,在步骤401和402的基础上,
若表格数据的列数大于两列但未确定出类别列,或者,表格数据的列为一列,则补充一列,作为类别列,所补充的一列中单元格的内容用于对系列值列的单元格的内容进行标识。
可见,针对步骤401、402结合补充列的补充步骤,步骤102的具体实现方式具体为:表格处理客户端首先对表格数据进行列数的判断,根据不同的列数选择不同的列类型确定方式,若表格数据为两列,则确定第一列为类别列,第二列为系列值列;若表格数据大于两列,则遍历每一列,确定纯数值的列为系列值列,该列之前的各列作为类别列;此外,当表格数据仅为一列系列值列时,表格处理客户端为该表格补充一列作为类别列,当表格数据大于两列并未确定出类别列时,补充一列作为类别列。
在一种的具体实施例中,步骤104的具体实现方式可以如下:
针对每一类别列,将该类别列的特征数据和目标列的特征数据作为输入数据,输入至预先训练完成的分类模型,得到以该类别列和各个系列值列创建图表时对应的各个图表类型的推荐结果;
其中,分类模型为基于样本类别列的特征数据和各个样本系列值列的特征数据,以及样本类别对应的标注信息,所训练的模型,样本类别列对应的标注信息包括:以样本类别列和各个系列值列创建图表时对应的图表类型的推荐结果。
具体的,将该类别列的特征数据和目标列的特征数据作为输入数据,输入至预先训练完成的分类模型,得到以该类别列和各个系列值列创建图表时对应的各个图表类型的推荐结果具体可以为:将该类别列的特征数据转换为向量数据,以及将目标列的特征数据转换为向量数据,并将所转换得到的向量数据进行向量拼接,得到拼接向量,进而,将拼接向量输入至分类模型中,得到以该类别列和各个系列值列创建图表时对应的各个图表类型的推荐结果。
并且,类似的,在分类模型的训练过程中,将样本类别列的特征数据和各个样本系列值列的特征数据分别转换为向量数据,并转换得到的向量数据进行拼接,得到拼接向量;将拼接向量输入训练中的分类模型,得到预测的推荐结果;进而,基于预测的推荐结果与样本类别对应的标注信息的差异,计算损失值;如果所计算的损失值小于预设阈值时,分类模型训练完成,否则,调整分类模型的模型参数,并继续训练该分类模型,即返回将样本类别列的特征数据和各个样本系列值列的特征数据分别转换为向量数据的步骤。
可以理解的是,分类模型的数量可以为一个,此时,该分类模型是针对各个图表类型所训练的模型;当然,该分类模型的数量可以为多个,此时,每一分类模型为针对一个图表类型所训练的。示例性的,假设各个图表类型包括:折线图、柱形图、散点图、饼图,那么,如果每一分类模型为针对一个图表类型所训练,那么,此时,分类模型包括:折线图分类模型,柱形图分类模型,散点图分类模型,饼图分类模型。
针对为每一图表类型训练的一个分类模型而言,示例性的,确定推荐结果的过程可以如下:确定第一列类别列的特征数据与第一列系列值列的特征数据;将该第一列类别列的特征数据与第一列系列值列的特征数据输入到各个分类模型中;从各个分类模型中输出以第一列类别列和第二列系列值列创建图表时,针对各个分类模型的推荐分数;将第一列类别列的特征数据变更为第二列类别列的特征数据,执行以上步骤,直到确定完所有的类别列的特征数据。
可以理解的是,上述的通过分类模型来确定推荐结果的实现方式仅仅是一种示例。例如:在具体应用中,还可以通过计算特征数据与预设特征数据的匹配度的方式,来确定推荐结果。
另外,在具体应用中,对于一个表格数据而言,并不是所有图表类型均适用于该表格数据。为了进一步提升推荐结果的有效性,并减少针对不必要的图表类型的推荐结果的计算,所述针对每一所述类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果之前,所述方法还包括:
确定各个系列值列的数量、系列值列中单元格的数量和/或各个类别列是否为纯数值类型的列的判断结果;
基于各个系列值列的数量、系列值列中单元格数量和/或各个类别列是否为纯数值类型的列判断结果,确定关于图表的各个可创建类型;
本步骤中,所确定的各个类别列是否为纯数值类型的列的判断结果,是在以下步骤后进行确定:步骤301和302的基础上,未确定出类别列,同时表格数据为两列,此时将第一列确定为类别列,第二列确定为系列值列。也可是在步骤401的基础上,当表格数据为两列,确定第一列为系列值列,第二列为类别列。
在一个具体的实施例中,系列值列的单元格内容用于绘制图表的图像区域,类别列的单元格内容用于绘制图表的标签区域。而针对各个图表类型,不同类型的图表的图像区域不相同,标签区域也不相同,因此各个类型的图表对创建该类型图表的系列值列和类别列的要求不同。实际中,系列值列的数量决定可创建的图表类型是否包含饼图,系列值列中单元格数量影响创建出的饼图的展示效果,类别列是否为纯数值类型的列决定可创建的图表类型是否包含散点图。具体的,当系列值列的数量大于等于二,由于饼图的图像区域为根据一列系列值列进行创建的,系列值列数过多导致无法创建饼图;当系列值列为一列且列中单元格的数量过多,导致饼图的图像被切割为过多的小块,创建出的饼图展示效果不佳;当类别列不为纯数值列,由于散点图的标签区域是基于纯数值的类别列创建的,类别列不为纯数值的列导致无法创建出散点图。
示例性的,针对同时确定出各个系列值列的数量、系列值列中单元格数量以及各个类别列是否为纯数值类型的列判断结果的情况而言,基于各个系列值列的数量、系列值列中单元格数量和/或各个类别列是否为纯数值类型的列判断结果,确定关于图表的各个可创建类型,可以包括:
若系列值列满足第一预定条件但类别列不满足第二预定条件,则可创建的图表类型为除饼图以外的图表类型;
若系列值列不满足第一预定条件但类别列满足第二预定条件,则可创建的图表类型为除散点图以外的图表类型;
若系列值列满足第一预定条件且类别列满足第二预定条件,则可创建的图表类型为除饼图和散点图以外的图表类型;
其中,第一预定条件为:列数量大于等于二,或,系列值列为一列但单元格数量大于预定阈值;第二预定条件为:各个类别列包括不为纯数值的列。
需要说明的是,在包含关于图表的各个可创建类型的确定步骤的方法中,步骤103中所提及的各个图表类型为该各个可创建类型。
下面结合一个具体实施例,对本发明实施例所提供的基于表格数据智能推荐图表的方法进行介绍。
一种基于表格数据智能推荐图表的方法,可以包括如下步骤:
步骤一,针对表格处理客户端已确定的待创建图表的表格数据,表格处理客户端遍历表格数据的各列,当遍历到每一列时,如果该列为纯数值的列,将该列确定为系列值列,并将所确定出的第一个系列值列之前的各列均作为类别列;并且,若已获取到系列值列,未获取到类别列,则补充一列从一开始的递增序列作为类别列;若未确定出类别列,且当表格数据的列数为两列时,将第一列确定为类别列,并将第二列确定为系列值列;
步骤二,表格处理客户端基于以上确定出的类别列和系列值列,确定一个系列值列与各个类别列的特征数据。具体的,确定各个类别列的特征数据与第一列系列值列的特征数据。
步骤三,表格处理客户端确定关于待创建图表的可创建类型。具体的:若系列值列满足第一预定条件但类别列不满足第二预定条件,则可创建的图表类型为除饼图以外的图表类型;若系列值列不满足第一预定条件但类别列满足第二预定条件,则可创建的图表类型为除散点图以外的图表类型;若系列值列满足第一预定条件且类别列满足第二预定条件,则可创建的图表类型为除饼图和散点图以外的图表类型;其中,第一预定条件为:列数量大于等于二,或,系列值列为一列但单元格数量大于预定阈值;第二预定条件为:各个类别列包括不为纯数值的列。
步骤四,表格处理客户端针对以上所确定的关于待创建图表的可创建类型,确定出针对各个可创建类型的分类模型;并将以上所确定出的类别列的特征数据和系列值列的特征数据,分别输入所确定的分类模型中,获得推荐结果。
步骤五,表格处理客户端将推荐结果,以表格的形式展示在界面上,从而用户可以基于该推荐结果,根据合适的图表类型,类别列创建图表。
针对以上所述方法,以下将提出实例进行说明:
图5A所示的表格数据的列表为“名称”列、“A股代码”列、“A股最新”列、“H股代码”列、“H股最新”列,共五列。
表格处理客户端确定该五列的数据作为待创建图表的表格数据。并且,“A股最新”列、“H股最新”列的为纯数值的列,经确定为系列值列,“名称”列、“A股代码”列、“H股代码”列为类别列。
表格处理客户端确定表格数据的可创建类型可以包括:折线图和柱形图。具体的判断方式为:表格数据中系列值列数量为二,且系列值列中单元格数为十九,不适合做饼图,并且,表格数据中“名称”列、“A股代码”列、“H股最新”列不为纯数值的列不适合做散点图,因此,可创建类型包括饼图和散点图以外的折线图和柱形图。
表格处理客户端确定“名称”列与“A股最新”列的特征数据,将所确定的特征数据输入至折线图分类模型和柱形图分类模型,得到推荐结果:通过折线图分类模型确定不适合做折线图,通过柱形图分类模型确定柱形图的分数为0.8,适合做柱形图;
表格处理客户端确定“A股代码”列与“A股最新”列的特征数据,并将所确定出的特征数据输入至:折线图分类模型和柱形图分类模型,得到推荐结果:通过折线图分类模型确定折线图的分数为0.53,通过柱形图分类模型确定柱形图的分数为0.38。
表格处理客户端基于所确定的推荐结果,输出所述表格数据对应的图表推荐信息,可以如下:
当“名称”列为类别列,“A股最新”列和“H股最新”列为系列值列,推荐柱形图时,图表推荐结果为0.8分;
当A股代码”列为类别列,“A股最新”列和“H股最新”列为系列值列,推荐折线图时,图表推荐结果为0.53分;
当“A股代码”列为类别列,“A股最新”列、“H股最新”列为系列值列,推荐柱形图时,图表推荐结果为0.38分。
图5B所示的表格数据的列表为“部门”列、“人数”列,共两列。
表格处理客户端确定该两列的数据作为待创建图表的表格数据。并且,“人数”列为纯数值的列,经确定为系列值列,“部门”列为类别列。
表格处理客户端确定表格数据的可创建类型可以包括:饼图、折线图和柱形图。具体的判断方式为:表格数据中系列值列数量为一,且系列值列中单元格数为十,适合做饼图,并且,表格数据中“部门”不为纯数值的列,不适合做散点图,因此,可创建类型包括饼图、折线图和柱形图。
表格处理客户端确定“部门”列和“人数”列的特征数据,将所确定的特征数据输入至饼图分类模型、折线图分类模型和柱形图分类模型,得到推荐结果:,通过饼图分类模型确定饼图分数为0.83,通过折线图分类模型确定不适合做折线图,通过柱形图分类模型确定柱形图分数为0.2,适合做饼图;
表格处理客户端基于所确定的推荐结果,输出所述表格数据对应的图表推荐信息,可以如下:
当“部门”列为类别列,“人数”列为系列值列,推荐饼图时,图表推荐结果为0.83分;
当“部门”列为类别列,“人数”列为系列值列,推荐折线图是,图表推荐结果为“不推荐”;
当“部门”列为类别列,“人数”列为系列值列,推荐柱形图时,图表推荐结果为0.2分。
本发明实施例还提供一种基于表格数据智能推荐图表的装置,如图6所示,可以包括:
表格数据确定模块601,用于确定待创建图表的表格数据;
列类型确定模块602,用于按照预定的列确定方式,从表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列;
图表类型推荐模块603,用于针对每一类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个系列值列创建图表时对应的各个图表类型的推荐结果;其中,目标列包括各个系列值列中的一列或多列;
推荐结果输出模块604,用于基于所确定的推荐结果,输出表格数据对应的图表推荐信息,图表推荐信息用于表示针对每一类别列,以该类别列和各个系列值列创建图表时对应的各个图表类型的推荐结果。
可选地,列类型确定模块,具体用于:
遍历表格数据的各列,当遍历到每一列时,如果该列为纯数值的列,将该列确定为系列值列,并将所确定出的第一个系列值列之前的各列均作为类别列;
并在未确定出类别列时,补充一列,作为类别列,所补充的一列中单元格的内容用于对系列值列的单元格的内容进行标识。
可选地,列类型确定模块,还用于:
在未确定出类别列时,当表格数据的列数为两列时,将第一列确定为类别列,并将第二列确定为系列值列。
可选地,列类型确定模块,具体用于:
若表格数据的列数为两列,将第一列确定为类别列,并将第二列确定为系列值列;
若表格数据的列数大于两列,遍历表格数据的各列,当遍历到每一列时,如果该列为纯数值的列,将该列确定为系列值列,并将所确定出的第一个系列值列之前的各列均作为类别列。
可选地,列类型确定模块,还用于:
若表格数据的列数大于两列但未确定出类别列,或者,表格数据的列为一列,则补充一列,作为类别列,所补充的一列中单元格的内容用于对系列值列的单元格的内容进行标识。
可选地,图表类型推荐模块,具体用于:
针对每一类别列,将该类别列的特征数据和目标列的特征数据作为输入数据,输入至预先训练完成的分类模型,得到以该类别列和各个系列值列创建图表时对应的各个图表类型的推荐结果;
其中,分类模型为基于样本类别列的特征数据和各个样本系列值列的特征数据,以及样本类别对应的标注信息,所训练的模型,样本类别列对应的标注信息包括:以样本类别列和各个系列值列创建图表时对应的图表类型的推荐结果。
可选地,图表类型推荐模块还用于:针对每一类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个系列值列创建图表时对应的各个图表类型的推荐结果之前,
确定各个系列值列的数量、系列值列中单元格的数量和/或各个类别列是否为纯数值类型的列的判断结果;
基于所述各个系列值列的数量、系列值列中单元格数量和/或各个类别列是否为纯数值类型的列判断结果,确定关于图表的各个可创建类型;
各个图表类型为各个可创建类型。
可选地,特征数据,包括如下数据中的一种或多种:
数据类型、最长字符长度、最长字符长度的单元格内中文/英文的字符长度、内容不为空的单元格个数、内容为数字且比列的平均值大的单元格个数、内容为数字且比列的平均值的一半小的单元格个数、整列数据类型是否非数字类型,以及,在整列数据类型为数字类型的情况下,是否整列数据之和为特定值、是否整列数据组成的列为递增序列、是否整列数据组成的列为递减序列。
本发明实施例还提供了一种电子设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,实现如下步骤:
确定待创建图表的表格数据;
按照预定的列确定方式,从表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列;
针对每一类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个系列值列创建图表时对应的各个图表类型的推荐结果,其中,目标列包括各个系列值列中的一列或多列;
基于所确定的推荐结果,输出表格数据对应的图表推荐信息,图表推荐信息用于表示针对每一类别列,以该类别列和各个系列值列创建图表时对应的各个图表类型的推荐结果。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一基于表格数据智能推荐图表的方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一基于表格数据智能推荐图表的方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (16)

1.一种基于表格数据智能推荐图表的方法,其特征在于,包括:
确定待创建图表的表格数据;
按照预定的列确定方式,从所述表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列;
确定各个系列值列的数量、系列值列中单元格的数量和/或各个类别列是否为纯数值类型的列的判断结果;
基于所述各个系列值列的数量、系列值列中单元格数量和/或各个类别列是否为纯数值类型的列的判断结果,确定关于图表的各个可创建类型;各个图表类型为所述各个可创建类型;
针对每一所述类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果,其中,所述目标列包括各个所述系列值列中的一列或多列;
基于所确定的推荐结果,输出所述表格数据对应的图表推荐信息,所述图表推荐信息用于表示针对每一所述类别列,以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果;
所述针对每一所述类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果,包括:针对每一所述类别列,将该类别列的特征数据和目标列的特征数据作为输入数据,输入至预先训练完成的分类模型,得到以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果。
2.根据权利要求1所述的方法,其特征在于,所述按照预定的列确定方式,从所述表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列,包括:
遍历所述表格数据的各列,当遍历到每一列时,如果该列为纯数值的列,将该列确定为系列值列,并将所确定出的第一个系列值列之前的各列均作为类别列;
并在未确定出类别列时,补充一列,作为类别列,所补充的一列中单元格的内容用于对系列值列的单元格的内容进行标识。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在未确定出类别列时,当所述表格数据的列数为两列时,将第一列确定为类别列,并将第二列确定为系列值列。
4.根据权利要求1所述的方法,其特征在于,所述按照预定的列确定方式,从所述表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列,包括:
若所述表格数据的列数为两列,将第一列确定为类别列,并将第二列确定为系列值列;
若所述表格数据的列数大于两列,遍历所述表格数据的各列,当遍历到每一列时,如果该列为纯数值的列,将该列确定为系列值列,并将所确定出的第一个系列值列之前的各列均作为类别列。
5.根据权利要求4所述的方法,其特征在于,还包括:
若所述表格数据的列数大于两列但未确定出类别列,或者,所述表格数据的列为一列,则补充一列,作为类别列,所补充的一列中单元格的内容用于对系列值列的单元格的内容进行标识。
6.根据权利要求1所述的方法,其特征在于,所述分类模型为基于样本类别列的特征数据和各个样本系列值列的特征数据,以及所述样本类别对应的标注信息,所训练的模型,所述样本类别列对应的标注信息包括:以所述样本类别列和各个所述系列值列创建图表对应的图表类型的推荐结果。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述特征数据,包括如下数据中的一种或多种:
数据类型;
最长字符长度;
最长字符长度的单元格内中文/英文的字符长度;
内容不为空的单元格个数;
内容为数字且比列的平均值大的单元格个数;
内容为数字且比列的平均值的一半小的单元格个数;
整列数据类型是否非数字类型;
在整列数据类型为数字类型的情况下,是否整列数据之和为特定值;
在整列数据类型为数字类型的情况下,是否整列数据组成的列为递增序列;
在整列数据类型为数字类型的情况下,是否整列数据组成的列为递减序列。
8.一种基于表格数据智能推荐图表的装置,其特征在于,包括:
表格数据确定模块,用于确定待创建图表的表格数据;
列类型确定模块,用于按照预定的列确定方式,从所述表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列;
图表类型推荐模块,用于确定各个系列值列的数量、系列值列中单元格的数量和/或各个类别列是否为纯数值类型的列的判断结果;基于所述各个系列值列的数量、系列值列中单元格数量和/或各个类别列是否为纯数值类型的列的判断结果,确定关于图表的各个可创建类型;各个图表类型为所述各个可创建类型;针对每一所述类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果,其中,所述目标列包括各个所述系列值列中的一列或多列;
推荐结果输出模块,用于基于所确定的推荐结果,输出所述表格数据对应的图表推荐信息,所述图表推荐信息用于表示针对每一所述类别列,以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果;
所述图表类型推荐模块,具体用于:针对每一所述类别列,将该类别列的特征数据和目标列的特征数据作为输入数据,输入至预先训练完成的分类模型,得到以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果。
9.根据权利要求8所述的装置,其特征在于,所述列类型确定模块,具体用于:
遍历所述表格数据的各列,当遍历到每一列时,如果该列为纯数值的列,将该列确定为系列值列,并将所确定出的第一个系列值列之前的各列均作为类别列;
并在未确定出类别列时,补充一列,作为类别列,所补充的一列中单元格的内容用于对系列值列的单元格的内容进行标识。
10.根据权利要求9所述的装置,其特征在于,所述列类型确定模块,还用于:
在未确定出类别列时,当所述表格数据的列数为两列时,将第一列确定为类别列,并将第二列确定为系列值列。
11.根据权利要求8所述的装置,其特征在于,所述列类型确定模块,具体用于:
若所述表格数据的列数为两列,将第一列确定为类别列,并将第二列确定为系列值列;
若所述表格数据的列数大于两列,遍历所述表格数据的各列,当遍历到每一列时,如果该列为纯数值的列,将该列确定为系列值列,并将所确定出的第一个系列值列之前的各列均作为类别列。
12.根据权利要求11所述的装置,其特征在于,所述列类型确定模块,还用于:
若所述表格数据的列数大于两列但未确定出类别列,或者,所述表格数据的列为一列,则补充一列,作为类别列,所补充的一列中单元格的内容用于对系列值列的单元格的内容进行标识。
13.根据权利要求8所述的装置,其特征在于,其中,所述分类模型为基于样本类别列的特征数据和各个样本系列值列的特征数据,以及所述样本类别对应的标注信息,所训练的模型,所述样本类别列对应的标注信息包括:以所述样本类别列和各个所述系列值列创建图表时对应的图表类型的推荐结果。
14.根据权利要求8-12任一项所述的装置,其特征在于,所述特征数据,包括如下数据中的一种或多种:
数据类型;
最长字符长度;
最长字符长度的单元格内中文/英文的字符长度;
内容不为空的单元格个数;
内容为数字且比列的平均值大的单元格个数;
内容为数字且比列的平均值的一半小的单元格个数;
整列数据类型是否非数字类型;
在整列数据类型为数字类型的情况下,是否整列数据之和为特定值;
在整列数据类型为数字类型的情况下,是否整列数据组成的列为递增序列;
在整列数据类型为数字类型的情况下,是否整列数据组成的列为递减序列。
15.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的方法步骤。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法步骤。
CN201910895041.4A 2019-09-20 2019-09-20 一种基于表格数据智能推荐图表的方法、装置和电子设备 Active CN112632929B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910895041.4A CN112632929B (zh) 2019-09-20 2019-09-20 一种基于表格数据智能推荐图表的方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910895041.4A CN112632929B (zh) 2019-09-20 2019-09-20 一种基于表格数据智能推荐图表的方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN112632929A CN112632929A (zh) 2021-04-09
CN112632929B true CN112632929B (zh) 2023-12-26

Family

ID=75282635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910895041.4A Active CN112632929B (zh) 2019-09-20 2019-09-20 一种基于表格数据智能推荐图表的方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN112632929B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968436A (zh) * 2011-09-26 2013-03-13 微软公司 图表推荐
US10372807B1 (en) * 2015-11-11 2019-08-06 Addepar, Inc. Systems and user interfaces for dynamic and interactive table generation and editing based on automatic traversal of complex data structures in a distributed system architecture

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9135233B2 (en) * 2011-10-13 2015-09-15 Microsoft Technology Licensing, Llc Suggesting alternate data mappings for charts
US9224217B2 (en) * 2012-01-06 2015-12-29 Apple Inc. Analytical charting

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968436A (zh) * 2011-09-26 2013-03-13 微软公司 图表推荐
US10372807B1 (en) * 2015-11-11 2019-08-06 Addepar, Inc. Systems and user interfaces for dynamic and interactive table generation and editing based on automatic traversal of complex data structures in a distributed system architecture

Also Published As

Publication number Publication date
CN112632929A (zh) 2021-04-09

Similar Documents

Publication Publication Date Title
CN110457581B (zh) 一种资讯推荐方法、装置、电子设备及存储介质
US20190287142A1 (en) Method, apparatus for evaluating review, device and storage medium
CN109190049B (zh) 关键词推荐方法、系统、电子设备和计算机可读介质
CN112733042B (zh) 推荐信息的生成方法、相关装置及计算机程序产品
CN109325121B (zh) 用于确定文本的关键词的方法和装置
CN112966081B (zh) 处理问答信息的方法、装置、设备和存储介质
CN109948160B (zh) 短文本分类方法及装置
CN109918499A (zh) 一种文本分类方法、装置、计算机设备及存储介质
CN113360711B (zh) 视频理解任务的模型训练和执行方法、装置、设备及介质
CN112926308B (zh) 匹配正文的方法、装置、设备、存储介质以及程序产品
US20200364216A1 (en) Method, apparatus and storage medium for updating model parameter
CN112507098B (zh) 问题处理方法、装置、电子设备、存储介质及程序产品
CN111680165A (zh) 信息匹配方法、装置、可读存储介质和电子设备
CN112417121A (zh) 客户意图识别方法、装置、计算机设备及存储介质
CN113127621A (zh) 对话模块的推送方法、装置、设备及存储介质
CN110909768B (zh) 一种标注数据获取方法及装置
CN112528703B (zh) 一种识别表格结构的方法、装置及电子设备
CN113361240B (zh) 用于生成目标文章的方法、装置、设备和可读存储介质
CN112784549A (zh) 一种生成图表的方法、装置、及存储介质
CN109033082B (zh) 语义模型的学习训练方法、装置及计算机可读存储介质
CN110609927B (zh) 一种可视化家谱布局方法、终端设备及存储介质
CN112632929B (zh) 一种基于表格数据智能推荐图表的方法、装置和电子设备
CN114880498B (zh) 事件信息展示方法及装置、设备和介质
CN107656627B (zh) 信息输入方法和装置
CN108595395B (zh) 一种昵称的生成方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant