CN116049294A - 一种Excel的操作方法、装置、设备及存储介质 - Google Patents
一种Excel的操作方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116049294A CN116049294A CN202310304592.5A CN202310304592A CN116049294A CN 116049294 A CN116049294 A CN 116049294A CN 202310304592 A CN202310304592 A CN 202310304592A CN 116049294 A CN116049294 A CN 116049294A
- Authority
- CN
- China
- Prior art keywords
- excel
- user demand
- column
- demand description
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
- G06F40/18—Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本申请公开了一种Excel的操作方法、装置、设备及存储介质,在该方法中,首先,对Excel表格信息和用户需求描述进行机器学习,可以获得操作语句。然后,通过操作组件可以将Excel表格转换为数据库。最后,根据操作语句操作数据库,将操作后的数据库转换为Excel表格,即可获得响应于用户需求描述的Excel表格。可见,通过上述方法可以直接获取表格和用户需求描述,即可获得响应于用户需求描述的Excel表格,不需要对表格的内容进行描述,也不需要通过Excel公式才能获得最终的分析结果,相较于现有技术,本方法的操作过程更加简便,输入方式更加的自由化。
Description
技术领域
本申请涉及机器学习技术领域,尤其涉及一种Excel的操作方法、装置、设备及存储介质。
背景技术
Excel是一种基础的数据分析工具,广泛应用于众多领域,例如金融财务分析、企业资源统计以及教育等各个行业。但是对于数据的分析处理是相对机械且繁琐的,需要操作人员了解Excel函数并且在每一次具体的需求中重复实现相似的功能。
目前对于Excel表格进行自动化数据分析可以通过ChatGPT(聊天机器人程序)实现,实现的具体方式是在ChatGPT上输入对表格进行分析的操作文本,能够得到Excel公式,然后再将Excel公式输入到Excel表格中获得表格的分析结果。
比如有一张表格记录每天的支出费用,操作人员想要计算支出超过100元的天数。操作人员向ChatGPT输入以下内容“我有一张记录每日开支的表格范围从A1到B30,计算单元格B2到B30中大于100的次数”。ChatGPT的返回结果为“=COUNTIF(B2:B30,’>100000’)”,即 Excel公式,操作员将该公式输入Excel中可以得到支出超过100元的天数。但是这种方法得到的输出结果只是Excel函数公式,不能够获得最终的分析结果,操作过程繁琐。
发明内容
有鉴于此,本申请实施例提供了一种Excel的操作方法及装置,旨在通过简便的方式获得Excel表格的分析结果。
第一方面,本申请实施例提供了一种Excel的操作方法,所述方法包括:
对Excel表格信息和用户需求描述进行机器学习,获得操作语句;
通过操作组件将所述Excel表格转换为数据库;
根据所述操作语句操作所述数据库,将操作后的数据库转换为Excel表格,获得响应于所述用户需求描述的Excel表格。
可选地,所述对Excel表格信息和用户需求描述进行机器学习,获得操作语句,包括:
对所述Excel表格信息和所述用户需求描述进行编码,获得编码后的输入特征;
对所述编码后的输入特征进行特征提取,获得特征表示;
根据所述特征表示、所述用户需求描述和操作组件进行机器学习,获得所述操作语句。
可选地,所述对所述Excel表格信息和所述用户需求描述进行编码,获得编码后的输入特征,包括:
对所述Excel表格的表头信息进行编码,获得表头信息编码;
对所述用户需求描述进行编码,获得用户需求描述编码;
对所述Excel表格的数据类型进行编码,获得数据类型编码;
将每列表头信息编码拼接在所述用户需求描述编码后;
将每列数据类型编码拼接在对应的表头信息编码后;
与表头信息不对应的数据类型编码和所述表头信息编码之间通过编码字符分隔;
将占位符补充在所述用户需求描述编码前,获得所述编码后的输入特征。
可选地,所述根据所述特征表示、所述用户需求描述和操作组件进行机器学习,获得所述操作语句,包括:
根据所述特征表示中的占位符对所述用户需求描述的类型进行分类,确定所述操作语句的类型;
根据所述特征表示中的占位符对所述操作组件进行机器学习,获得条件连接词、条件数量和访问列数量;
根据所述特征表示中的表头信息编码和用户需求描述编码对所述操作组件进行机器学习,获得是否访问该列的条件、聚合操作和条件内容;
根据所述访问列数量对所述聚合操作进行排序,将所述访问列数量的最高项作为目标访问列;
根据所述条件数量对所述是否访问该列的条件进行排序,将所述条件数量的最高项作为目标条件列;
根据所述操作语句的类型、所述目标访问列、所述目标条件列和所述目标条件列的条件内容,获得所述操作语句。
可选地,所述根据所述操作语句操作所述数据库,将操作后的数据库转换为Excel表格,获得响应于所述用户需求描述的Excel表格,包括:
根据所述操作语句操作所述数据库,将所述操作后的数据库以表格型数据存储,将所述表格型数据转换为所述Excel表格,获得响应于所述用户需求描述的Excel表格。
可选地,所述对Excel表格信息和用户需求描述进行训练,获得操作语句之前,还包括:
获得所述用户需求描述的语音,将所述语音转换成所述用户需求描述的文本。
第二方面,本申请实施例提供了一种Excel的操作装置,所述装置包括:
学习模块,用于对Excel表格信息和用户需求描述进行机器学习,获得操作语句;
转换模块,用于通过操作组件将所述Excel表格转换为数据库;
操作模块,用于根据所述操作语句操作所述数据库,将操作后的数据库转换为Excel表格,获得响应于所述用户需求描述的Excel表格。
可选地,所述学习模块,包括:
第一编码单元,用于对所述Excel表格信息和所述用户需求描述进行编码,获得编码后的输入特征;
特征提取单元,用于对所述编码后的输入特征进行特征提取,获得特征表示;
第一学习单元,用于根据所述特征表示、所述用户需求描述和操作组件进行机器学习,获得所述操作语句。
可选地,所述第一编码单元,包括:
第二编码单元,用于对所述Excel表格的表头信息进行编码,获得表头信息编码;
第三编码单元,用于对所述用户需求描述进行编码,获得用户需求描述编码;
第四编码单元,用于对所述Excel表格的数据类型进行编码,获得数据类型编码;
第一拼接单元,用于将每列表头信息编码拼接在所述用户需求描述编码后;
第二拼接单元,用于将每列数据类型编码拼接在对应的表头信息编码后;
分隔单元,用于与表头信息不对应的数据类型编码和所述表头信息编码之间通过编码字符分隔;
补充单元,用于将占位符补充在所述用户需求描述编码前,获得所述编码后的输入特征。
可选地,所述第一学习单元,包括:
分类单元,用于根据所述特征表示中的占位符对所述用户需求描述的类型进行分类,确定所述操作语句的类型;
第二学习单元,用于根据所述特征表示中的占位符对所述操作组件进行机器学习,获得条件连接词、条件数量和访问列数量;
第三学习单元,用于根据所述特征表示中的表头信息编码和用户需求描述编码对所述操作组件进行机器学习,获得是否访问该列的条件、聚合操作和条件内容;
第一排序单元,用于根据所述访问列数量对所述聚合操作进行排序,将所述访问列数量的最高项作为目标访问列;
第二排序单元,用于根据所述条件数量对所述是否访问该列的条件进行排序,将所述条件数量的最高项作为目标条件列;
获得单元,用于根据所述操作语句的类型、所述目标访问列、所述目标条件列和所述目标条件列的条件内容,获得所述操作语句。
可选地,所述操作模块,具体用于:
根据所述操作语句操作所述数据库,将所述操作后的数据库以表格型数据存储,将所述表格型数据转换为所述Excel表格,获得响应于所述用户需求描述的Excel表格。
可选地,所述装置,还包括:
转换单元,用于获得所述用户需求描述的语音,将所述语音转换成所述用户需求描述的文本。
第三方面,本申请实施例提供了一种Excel的操作设备,所述设备包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以使所述设备执行前述第一方面所述的Excel的操作方法。
第四方面,本申请实施例提供了一种计算机存储介质,所述计算机可读存储介质上存储有计算机程序,当所述计算机程序被运行时,运行所述计算机程序的设备实现前述第一方面所述的Excel的操作方法。
相较于现有技术,本申请实施例具有以下有益效果:
本申请实施例提供了一种Excel的操作方法及装置,首先,对Excel表格信息和用户需求描述进行机器学习,可以获得操作语句。然后,通过操作组件可以将Excel表格转换为数据库。最后,根据操作语句操作数据库,将操作后的数据库转换为Excel表格,即可获得响应于用户需求描述的Excel表格。可见,通过上述方法可以直接获取表格和用户需求描述,即可获得响应于用户需求描述的Excel表格,不需要对表格的内容进行描述,也不需要通过Excel公式才能获得最终的分析结果,相较于现有技术,本方法的操作过程更加简便,输入方式更加的自由化。
附图说明
为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种Excel的操作方法的应用场景;
图2为本申请实施例提供的一种Excel的操作方法的流程图;
图3为本申请实施例提供的编码后的输入特征的结构示意图;
图4为本申请实施例提供的获得查询操作语句的结构示意图;
图5为本申请实施例提供的获得修改操作语句的结构示意图;
图6为本申请实施例提供的获得删除操作语句的结构示意图;
图7为本申请实施例提供的获得增加操作语句的结构示意图;
图8为本申请实施例提供的一种Excel的操作装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前对于Excel表格进行自动化数据分析可以通过ChatGPT(聊天机器人程序)实现,实现的具体方式是在ChatGPT上输入对表格进行分析的操作文本,能够得到Excel公式,然后再将Excel公式输入到Excel表格中获得表格的分析结果。
比如有一张表格记录每天的支出费用,操作人员想要计算支出超过100元的天数。操作人员向ChatGPT输入以下内容“我有一张记录每日开支的表格范围从A1到B30,计算单元格B2到B30中大于100的次数”。ChatGPT的返回结果为“=COUNTIF(B2:B30,’>100000’)”,即 Excel公式,操作员将该公式输入Excel中可以得到支出超过100元的天数。但是这种方法得到的输出结果只是Excel函数公式,不能够获得最终的分析结果,操作过程繁琐。
基于此,为了解决上述问题,在本申请实施例中,首先,对Excel表格信息和用户需求描述进行机器学习,可以获得操作语句。然后,通过操作组件可以将Excel表格转换为数据库。最后,根据操作语句操作数据库,将操作后的数据库转换为Excel表格,即可获得响应于用户需求描述的Excel表格。可见,通过上述方法可以直接获取表格和用户需求描述,即可获得响应于用户需求描述的Excel表格,不需要对表格的内容进行描述,也不需要通过Excel公式才能获得最终的分析结果,相较于现有技术,本方法的操作过程更加简便,输入方式更加的自由化。
举例来说,本申请实施例的场景之一,可以是应用到如图1所示的场景中。该场景包括终端101和服务器102,其中,服务器102采用本申请实施例提供的实施方式,从终端101获取Excel表格和用户需求描述。
首先,在上述应用场景中,虽然将本申请实施例提供的实施方式的动作描述由服务器102执行;但是,本申请实施例在执行主体方面不受限制,只要执行了本申请实施例提供的实施方式所公开的动作即可。
其次,上述场景仅是本申请实施例提供的一个场景示例,本申请实施例并不限于此场景。
下面结合附图,通过实施例来详细说明本申请实施例中Excel的操作方法及装置的具体实现方式。
参见图2,该图为本申请实施例提供的一种Excel的操作方法的流程图,结合图2所示,具体可以包括:
S201:对Excel表格信息和用户需求描述进行机器学习,获得操作语句。
作为一种示例,用户需求描述可以是统计表格中天数超过100天的数据。在一种可能的实施方式中,具体可以包括,对Excel表格信息和用户需求描述的文本进行编码,获得编码后的输入特征,然后对编码后的输入特征进行特征提取,获得特征表示。最后根据特征表示、用户需求描述和操作组件进行机器学习,可以获得操作语句。其中,操作语句可以是SQL操作语句。
在一种可能的实施方式中,对用户需求描述的文本和表格信息进行编码,具体的,参见图3,图3为编码后的输入特征的结构示意图,可以通过词位编码表对用户需求描述进行编码,获得用户需求描述编码Tokenlized Text;对Excel表格中的表头信息进行编码,可以获得表头信息编码Column;对Excel表格的数据类型进行编码,可以获得数据类型编码ColType。作为一种示例,当这列表格的表头为人口时,这列表格的数据类型可以是int整型,当这列表格的表头为GDP时,这列表格的数据类型可以是float浮点型。
在一种可能的实施方式中,将目标表中每一列的表头信息编码Column拼接在用户需求描述编码Tokenlized Text后,将每列数据类型编码ColType以特殊占位符的方式拼接在对应的表头信息编码Column后,由于文本信息以及表格中每列数据包含的语义信息不同,因此与表头信息不对应的数据类型编码ColType和表头信息编码Column之间可以通过特殊编码字符SEP分隔,即数据类型编码ColType和下一个表头信息编码Column之间通过编码字符SEP分隔。最后,在所有特征词位的开始,即在用户需求描述编码Tokenlized Text前补充占位符CLS,用于表达整个特征结构的全局语义信息,由此可以获得编码后的输入特征,由一串编码向量构成。
在一种可能的实施方式中,对编码后的输入特征进行特征提取,可以获得特征表示,具体可以通过特征提取器将编码后的输入特征中的编码输入到x特征空间,可以通过公式一来表示。
(公式一)
其中,为特征提取器,z为一个矩阵,即特征表示,,n和d分别为本次输入token的数量和特征表示的维度,R表示实数空间记号,token是指提取表格中的表头信息和数据类型。
在一种可能的实施方式中,通过特征表示中的占位符CLS对用户需求描述的类型进行分类,主要包括增删改查,可以确定出操作语句的类型,此时可以采用交叉熵损失。参见图4,图4为获得查询操作语句的结构示意图,由于结构图类似,下面以图4为例进行介绍,图4-图7中左边为获得编码后的输入特征的过程,Encoder为特征提取获得特征表示的过程,Embedding表示将特征表示向量化的过程,可以利用特征表示z学习操作语句SQL语句中各个不同的操作组件,具体地,由于CLS占位符具备全局语义信息,因此可以根据特征表示中的占位符CLS学习SQL组件,可以获得条件连接谓词connect op、条件数量num conds以及访问列数量select num等;对于每列表格可能有不同的条件以及聚合运算,可以根据特征表示中的表头信息编码和用户需求描述编码学习SQL组件,可以获得是否访问该列的条件col-logits、访问时的聚合操作col-agg和条件内容conditions;其中,条件内容conditions指的是句子中的限定条件,聚合操作col-agg指的是SQL语句中的运算操作,作为一种示例,中国的人口总和为多少,中国是对于地区的限定,中国即为条件内容conditions,总和指的是对中国人口求和的聚算,是指SQL语句中的聚合运算,即聚合操作col-agg。
以上内容可以由多层感知机学习得到,同时由于聚合操作col-agg是有限操作,因此可以采用多分类交叉熵损失;对于每列表格是否访问col-logits为二分类,可以采用二值交叉熵损失;由于条件内容conditions则是在用户需求描述编码Tokenlized text上的连续分布,可以采用相对熵作为损失。
参见图5,图5为获得修改操作语句的结构示意图,与获得查询操作语句的结构图类似,可以根据特征表示中的占位符CLS学习SQL组件,可以获得条件连接谓词connect op、条件数量num conds以及修改列数量update num等;
可以根据特征表示中的表头信息编码和用户需求描述编码学习SQL组件,可以获得是否访问该列的条件col-logits、是否修改该列的条件update-logits和条件内容conditions。
参见图6,图6为获得删除操作语句的结构示意图,与获得查询操作语句的结构图类似,可以根据特征表示中的占位符CLS学习SQL组件,可以获得条件连接谓词connect op以及条件数量num conds等;可以根据特征表示中的表头信息编码和用户需求描述编码学习SQL组件,可以获得是否访问该列的条件col-logits和条件内容conditions。另外,在一种可能的实施方式中,可以同时串联多个表格,对多个表格执行合并,删除重复项等操作。
参见图7,图7为获得增加操作语句的结构示意图,与获得删除操作语句的结构图类似,可以根据特征表示中的表头信息编码和用户需求描述编码学习SQL组件,可以获得是否访问该列的条件col-logits和条件内容conditions。
在一种可能的实施方式中,当操作语句的类型为查询时,计算测试对象的所有SQL组件的输出值,具体包括条件连接谓词connect op、条件数量num conds、访问列数量select num、是否访问该列的条件col-logits、访问时的聚合操作col-agg和条件内容conditions,可以根据访问列数量select num(K)对所有的访问时的聚合操作col-agg进行排序,将访问列数量select num(K)的最高项作为目标访问列,然后可以根据条件数量numconds(M)对所有的是否访问该列的条件col-logits进行排序,将条件数量num conds(M)的最高项作为目标条件列,最后将目标条件列的条件内容conditions的输出作为条件列内容,由此根据操作语句的类型、目标访问列、目标条件列和目标条件列的条件内容,可以获得SQL操作语句。作为一种示例,访问列数量select num为5,访问时的聚合操作col-agg为10,表格有20列,共有200种组合方式,从中选择最大的5项作为目标访问列,然后当条件数量num conds为2时,对目标访问列中的是否访问该列的条件col-logits进行排序,从中选择最大的2项作为目标条件列,最后可以将目标条件列的条件内容conditions的输出作为操作语句中的条件内容,由此即可根据操作语句的类型、目标访问列、目标条件列和目标条件列的条件内容,获得SQL操作语句。
通过SQL操作语句能够实现Excel内置函数不能实现的功能,同时通过SQL语言可以灵活自由读取表格中的信息,对表格的形式和内容没有限定要求,不需要手动输入对表格信息的描述,使得操作过程更加方便快捷。
S202:通过操作组件将Excel表格转换为数据库。
在一种可能的实施方式中,可以根据本地虚拟的数据库引擎,作为一种示例,作为一种示例,可以是SQLite数据库,读取用户传入的Excel的表格数据并建立临时数据库。
S203:根据操作语句操作数据库,将操作后的数据库转换为Excel表格,获得响应于用户需求描述的Excel表格。
在一种可能的实施方式中,可以通过虚拟数据库引擎对数据库执行操作语句,可以通过表格型数据DataFrame的形式将返回结果存储在内存中,最后将表格型数据DataFrame转换为Excel表格,即可获得响应于用户需求描述的Excel表格。通过这种方式可以直接获得表格,无需其他的冗余操作,实现了表格形式与用户需求描述完全自由的输入/输出I/O的特性,使得输入方式更加的自由化。
另外,还可以通过语音输入的方式获得用户需求描述,将用户需求描述的语音转换为用户需求描述的文本。在一种可能的实施方式中,可以通过调用应用程序编程接口(英文:Application Programming Interface, API),将语音数据发送给第三方,通过第三方将语音转化为文本,从而获得用户需求描述的文本。通过语音输入的方式,使得用户可以避免手动输入用户需求描述,输入方式的多样化,使得整个流程更加方便快捷,应用性强。
以上为本申请实施例提供的一种Excel的操作方法,首先,对Excel表格信息和用户需求描述进行机器学习,可以获得操作语句。然后,通过操作组件可以将Excel表格转换为数据库。最后,根据操作语句操作数据库,将操作后的数据库转换为Excel表格,即可获得响应于用户需求描述的Excel表格。可见,通过上述方法可以直接获取表格和用户需求描述,即可获得响应于用户需求描述的Excel表格,不需要对表格的内容进行描述,也不需要通过Excel公式才能获得最终的分析结果,相较于现有技术,本方法的操作过程更加简便,输入方式更加的自由化。
以上为本申请实施例提供Excel的操作方法的一些具体实现方式,基于此,本申请还提供了对应的装置。下面将从功能模块化的角度对本申请实施例提供的装置进行介绍。
参见图8,该图为本申请实施例提供的一种Excel的操作装置800的结构示意图,该装置800可以包括:
学习模块801,用于对Excel表格信息和用户需求描述进行机器学习,获得操作语句;
转换模块802,用于通过操作组件将Excel表格转换为数据库;
操作模块803,用于根据操作语句操作数据库,将操作后的数据库转换为Excel表格,获得响应于用户需求描述的Excel表格。
在本申请实施例中,通过学习模块801、转换模块802和操作模块803的配合,通过上述方法可以直接获取表格和用户需求描述,即可获得响应于用户需求描述的Excel表格,不需要对表格的内容进行描述,也不需要通过Excel公式才能获得最终的分析结果,相较于现有技术,本方法的操作过程更加简便,输入方式更加的自由化。
作为一种实施方式,学习模块801,包括:
第一编码单元,用于对Excel表格信息和用户需求描述进行编码,获得编码后的输入特征;
特征提取单元,用于对编码后的输入特征进行特征提取,获得特征表示;
第一学习单元,用于根据特征表示、用户需求描述和操作组件进行机器学习,获得操作语句。
作为一种实施方式,第一编码单元,包括:
第二编码单元,用于对Excel表格的表头信息进行编码,获得表头信息编码;
第三编码单元,用于对用户需求描述进行编码,获得用户需求描述编码;
第四编码单元,用于对Excel表格的数据类型进行编码,获得数据类型编码;
第一拼接单元,用于将每列表头信息编码拼接在用户需求描述编码后;
第二拼接单元,用于将每列数据类型编码拼接在对应的表头信息编码后;
分隔单元,用于与表头信息不对应的数据类型编码和表头信息编码之间通过编码字符分隔;
补充单元,用于将占位符补充在用户需求描述编码前,获得编码后的输入特征。
作为一种实施方式,第一学习单元,包括:
分类单元,用于根据特征表示中的占位符对用户需求描述的类型进行分类,确定操作语句的类型;
第二学习单元,用于根据特征表示中的占位符对操作组件进行机器学习,获得条件连接词、条件数量和访问列数量;
第三学习单元,用于根据特征表示中的表头信息编码和用户需求描述编码对操作组件进行机器学习,获得是否访问该列的条件、聚合操作和条件内容;
第一排序单元,用于根据访问列数量对聚合操作进行排序,将访问列数量的最高项作为目标访问列;
第二排序单元,用于根据条件数量对是否访问该列的条件进行排序,将条件数量的最高项作为目标条件列;
获得单元,用于根据操作语句的类型、目标访问列、目标条件列和目标条件列的条件内容,获得操作语句。
作为一种实施方式,操作模块803,具体用于:
根据操作语句操作数据库,将操作后的数据库以表格型数据存储,将表格型数据转换为Excel表格,获得响应于用户需求描述的Excel表格。
作为一种实施方式,Excel的操作装置800,还包括:
转换单元,用于获得用户需求描述的语音,将语音转换成用户需求描述的文本。
本申请实施例还提供了对应的设备以及计算机存储介质,用于实现本申请实施例提供的方案。
其中,所述设备包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序,以使所述设备执行本申请任一实施例所述的Excel的操作方法。
所述计算机存储介质中存储有计算机程序,当所述代码被运行时,运行所述计算机程序的设备实现本申请任一实施例所述的Excel的操作方法。
本申请实施例中提到的“第一”、“第二”(若存在)等名称中的“第一”、“第二”只是用来做名字标识,并不代表顺序上的第一、第二。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如只读存储器(英文:read-only memory,ROM)/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如路由器等网络通信设备)执行本申请各个实施例或者实施例的某些部分所述的方法。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元提示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (10)
1.一种Excel的操作方法,其特征在于,所述方法包括:
对Excel表格信息和用户需求描述进行机器学习,获得操作语句;
通过操作组件将所述Excel表格转换为数据库;
根据所述操作语句操作所述数据库,将操作后的数据库转换为Excel表格,获得响应于所述用户需求描述的Excel表格。
2.根据权利要求1所述的方法,其特征在于,所述对Excel表格信息和用户需求描述进行机器学习,获得操作语句,包括:
对所述Excel表格信息和所述用户需求描述进行编码,获得编码后的输入特征;
对所述编码后的输入特征进行特征提取,获得特征表示;
根据所述特征表示、所述用户需求描述和操作组件进行机器学习,获得所述操作语句。
3.根据权利要求2所述的方法,其特征在于,所述对所述Excel表格信息和所述用户需求描述进行编码,获得编码后的输入特征,包括:
对所述Excel表格的表头信息进行编码,获得表头信息编码;
对所述用户需求描述进行编码,获得用户需求描述编码;
对所述Excel表格的数据类型进行编码,获得数据类型编码;
将每列表头信息编码拼接在所述用户需求描述编码后;
将每列数据类型编码拼接在对应的表头信息编码后;
与表头信息不对应的数据类型编码和所述表头信息编码之间通过编码字符分隔;
将占位符补充在所述用户需求描述编码前,获得所述编码后的输入特征。
4.根据权利要求2所述的方法,其特征在于,所述根据所述特征表示、所述用户需求描述和操作组件进行机器学习,获得所述操作语句,包括:
根据所述特征表示中的占位符对所述用户需求描述的类型进行分类,确定所述操作语句的类型;
根据所述特征表示中的占位符对所述操作组件进行机器学习,获得条件连接词、条件数量和访问列数量;
根据所述特征表示中的表头信息编码和用户需求描述编码对所述操作组件进行机器学习,获得是否访问该列的条件、聚合操作和条件内容;
根据所述访问列数量对所述聚合操作进行排序,将所述访问列数量的最高项作为目标访问列;
根据所述条件数量对所述是否访问该列的条件进行排序,将所述条件数量的最高项作为目标条件列;
根据所述操作语句的类型、所述目标访问列、所述目标条件列和所述目标条件列的条件内容,获得所述操作语句。
5.根据权利要求1所述的方法,其特征在于,所述根据所述操作语句操作所述数据库,将操作后的数据库转换为Excel表格,获得响应于所述用户需求描述的Excel表格,包括:
根据所述操作语句操作所述数据库,将所述操作后的数据库以表格型数据存储,将所述表格型数据转换为所述Excel表格,获得响应于所述用户需求描述的Excel表格。
6.根据权利要求1所述的方法,其特征在于,所述对Excel表格信息和用户需求描述进行训练,获得操作语句之前,还包括:
获得所述用户需求描述的语音,将所述语音转换成所述用户需求描述的文本。
7.一种Excel的操作装置,其特征在于,所述装置包括:
学习模块,用于对Excel表格信息和用户需求描述进行机器学习,获得操作语句;
转换模块,用于通过操作组件将所述Excel表格转换为数据库;
操作模块,用于根据所述操作语句操作所述数据库,将操作后的数据库转换为Excel表格,获得响应于所述用户需求描述的Excel表格。
8.根据权利要求7所述的装置,其特征在于,所述学习模块,包括:
编码单元,用于对所述Excel表格信息和所述用户需求描述进行编码,获得编码后的输入特征;
特征提取单元,用于对所述编码后的输入特征进行特征提取,获得特征表示;
第一学习单元,用于根据所述特征表示、所述用户需求描述和操作组件进行机器学习,获得所述操作语句。
9.一种Excel的操作设备,其特征在于,所述设备包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以使所述设备执行如权利要求1至6任一项所述的Excel的操作方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的Excel的操作方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310304592.5A CN116049294B (zh) | 2023-03-27 | 2023-03-27 | 一种Excel的操作方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310304592.5A CN116049294B (zh) | 2023-03-27 | 2023-03-27 | 一种Excel的操作方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116049294A true CN116049294A (zh) | 2023-05-02 |
CN116049294B CN116049294B (zh) | 2023-06-27 |
Family
ID=86118441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310304592.5A Active CN116049294B (zh) | 2023-03-27 | 2023-03-27 | 一种Excel的操作方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116049294B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090193039A1 (en) * | 2008-01-28 | 2009-07-30 | Apollo Data Technologies, Llc | Data driven system for data analysis and data mining |
CN103020089A (zh) * | 2011-09-27 | 2013-04-03 | 深圳市金蝶友商电子商务服务有限公司 | 一种将excel文件中的数据导入数据库的方法及装置 |
CN107832466A (zh) * | 2017-11-28 | 2018-03-23 | 清远市云商科技有限公司 | 一种模拟邮件收发的方法 |
CN108664236A (zh) * | 2018-05-08 | 2018-10-16 | 山东浪潮通软信息科技有限公司 | 一种基于Excel的自动转换执行参数化SQL的实现方法 |
CN109408526A (zh) * | 2018-10-12 | 2019-03-01 | 平安科技(深圳)有限公司 | Sql语句生成方法、装置、计算机设备及存储介质 |
CN110060674A (zh) * | 2019-03-15 | 2019-07-26 | 重庆小雨点小额贷款有限公司 | 表格管理方法、装置、终端和存储介质 |
CN112232033A (zh) * | 2020-10-12 | 2021-01-15 | 衡阳云汇科技有限公司 | 一种通用数据转excel导入导出的方法 |
CN113127105A (zh) * | 2021-03-18 | 2021-07-16 | 福建马恒达信息科技有限公司 | 一种excel自动语音工具调用方法 |
CN113434130A (zh) * | 2021-06-25 | 2021-09-24 | 平安科技(深圳)有限公司 | Sql自动生成方法及装置 |
CN115033643A (zh) * | 2022-06-17 | 2022-09-09 | 中国平安人寿保险股份有限公司 | 数据同步方法、电子设备及计算机可读存储介质 |
CN115062070A (zh) * | 2022-05-30 | 2022-09-16 | 中国电子科技集团公司第十研究所 | 一种基于问答的文本表格数据查询方法 |
CN115495563A (zh) * | 2022-09-16 | 2022-12-20 | 重庆长安汽车股份有限公司 | 基于表格数据检索的智能会话方法及服务器 |
-
2023
- 2023-03-27 CN CN202310304592.5A patent/CN116049294B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090193039A1 (en) * | 2008-01-28 | 2009-07-30 | Apollo Data Technologies, Llc | Data driven system for data analysis and data mining |
CN103020089A (zh) * | 2011-09-27 | 2013-04-03 | 深圳市金蝶友商电子商务服务有限公司 | 一种将excel文件中的数据导入数据库的方法及装置 |
CN107832466A (zh) * | 2017-11-28 | 2018-03-23 | 清远市云商科技有限公司 | 一种模拟邮件收发的方法 |
CN108664236A (zh) * | 2018-05-08 | 2018-10-16 | 山东浪潮通软信息科技有限公司 | 一种基于Excel的自动转换执行参数化SQL的实现方法 |
CN109408526A (zh) * | 2018-10-12 | 2019-03-01 | 平安科技(深圳)有限公司 | Sql语句生成方法、装置、计算机设备及存储介质 |
CN110060674A (zh) * | 2019-03-15 | 2019-07-26 | 重庆小雨点小额贷款有限公司 | 表格管理方法、装置、终端和存储介质 |
CN112232033A (zh) * | 2020-10-12 | 2021-01-15 | 衡阳云汇科技有限公司 | 一种通用数据转excel导入导出的方法 |
CN113127105A (zh) * | 2021-03-18 | 2021-07-16 | 福建马恒达信息科技有限公司 | 一种excel自动语音工具调用方法 |
CN113434130A (zh) * | 2021-06-25 | 2021-09-24 | 平安科技(深圳)有限公司 | Sql自动生成方法及装置 |
CN115062070A (zh) * | 2022-05-30 | 2022-09-16 | 中国电子科技集团公司第十研究所 | 一种基于问答的文本表格数据查询方法 |
CN115033643A (zh) * | 2022-06-17 | 2022-09-09 | 中国平安人寿保险股份有限公司 | 数据同步方法、电子设备及计算机可读存储介质 |
CN115495563A (zh) * | 2022-09-16 | 2022-12-20 | 重庆长安汽车股份有限公司 | 基于表格数据检索的智能会话方法及服务器 |
Non-Patent Citations (3)
Title |
---|
YONGJOO PARK 等: "Database Learning: Toward a Database that Becomes Smarter Every Time", 《SIGMOD \'17: PROCEEDINGS OF THE 2017 ACM INTERNATIONAL CONFERENCE ON MANAGEMENT OF DATA》, pages 587 - 602 * |
彭敦诚: "基于Python机器学习的大气环境下材料失效数据分析", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》, pages 020 - 27 * |
明敏 PINE: "北大团队搞出ChatExcel,说人话自动处理表格,免费且不限次使用", vol. 1, pages 155 - 157, Retrieved from the Internet <URL:https://www.thepaper.cn/newsDetail_forward_22203409> * |
Also Published As
Publication number | Publication date |
---|---|
CN116049294B (zh) | 2023-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111222305B (zh) | 一种信息结构化方法和装置 | |
CN111695352A (zh) | 基于语义分析的评分方法、装置、终端设备及存储介质 | |
CN112035599B (zh) | 基于垂直搜索的查询方法、装置、计算机设备及存储介质 | |
CN110309511B (zh) | 基于共享表示的多任务语言分析系统及方法 | |
CN110825827B (zh) | 一种实体关系识别模型训练、实体关系识别方法及装置 | |
CN111221936B (zh) | 一种信息匹配方法、装置、电子设备及存储介质 | |
CN116719520B (zh) | 代码生成方法及装置 | |
CN113190702A (zh) | 用于生成信息的方法和装置 | |
CN113221553A (zh) | 一种文本处理方法、装置、设备以及可读存储介质 | |
CN111507108B (zh) | 别名生成方法、装置、电子设备及计算机可读存储介质 | |
CN117194616A (zh) | 一种垂域知识图谱的知识查询方法、装置、计算机设备和存储介质 | |
CN113239698A (zh) | 基于rpa及ai的信息提取方法、装置、设备及介质 | |
CN117520503A (zh) | 基于llm模型的金融客服对话生成方法、装置、设备及介质 | |
CN116049294B (zh) | 一种Excel的操作方法、装置、设备及存储介质 | |
CN110852066B (zh) | 一种基于对抗训练机制的多语言实体关系抽取方法及系统 | |
CN115203206A (zh) | 数据内容搜索方法、装置、计算机设备及可读存储介质 | |
CN115470232A (zh) | 模型训练和数据查询方法、装置、电子设备和存储介质 | |
CN114861630A (zh) | 信息获取及相关模型的训练方法、装置、电子设备和介质 | |
CN110232328A (zh) | 一种征信报告解析方法、装置及计算机可读存储介质 | |
CN111782781A (zh) | 一种语义分析方法、装置、计算机设备及存储介质 | |
CN115840808B (zh) | 科技项目咨询方法、装置、服务器及计算机可读存储介质 | |
CN115391569B (zh) | 一种从研报自动构建产业链图谱的方法及相关设备 | |
CN117609264A (zh) | 用于金融服务的知识库更新方法、装置、设备及介质 | |
CN117473995A (zh) | 文本处理方法、装置、产品、设备和介质 | |
CN116992018A (zh) | 数据处理方法、装置、设备、可读存储介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |