CN113254698A - 一种具备辅助填写功能的表格设计方法及系统 - Google Patents
一种具备辅助填写功能的表格设计方法及系统 Download PDFInfo
- Publication number
- CN113254698A CN113254698A CN202110695565.6A CN202110695565A CN113254698A CN 113254698 A CN113254698 A CN 113254698A CN 202110695565 A CN202110695565 A CN 202110695565A CN 113254698 A CN113254698 A CN 113254698A
- Authority
- CN
- China
- Prior art keywords
- information
- keyword
- data set
- error correction
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/61—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/65—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种具备辅助填写功能的表格设计方法及系统,其中,所述方法包括:获得第一表格内容采集导向性信息;获得第一用户的第一语音输入信息;获得第一转换文字信息;并进行第一关键词特征的提取、分类,生成第一关键词特征数据集;采集第一用户的目标图像信息;对目标图像信息进行图像解析,获得第一图像解析结果;并进行第二关键词特征的提取、分类,生成第二关键词特征数据集;将第一关键词特征数据集和第二关键词特征数据集输入内容纠错模型进行训练,获得第一纠错结果;对所述表格设计系统进行修正。解决了现有技术中的无法为表格设计赋予辅助填写功能,使得无法快速准确的录入数据,进而降低工作效率的技术问题。
Description
技术领域
本发明涉及表格设计技术领域,尤其涉及一种具备辅助填写功能的表格设计方法及系统。
背景技术
随着计算机应用的普及,各行各业都进入了计算机办公时代,利用表格可以将大量重复操作变得简单,从而有效的提高工作效率,同时,因需要输入大量统计数据,对数据的快速准确录入提出了更高的要求。
但本申请发明人在实现本申请实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
现有技术中存在无法为表格设计赋予辅助填写功能,使得无法快速准确的录入数据,进而降低工作效率的技术问题。
发明内容
本申请实施例通过提供一种具备辅助填写功能的表格设计方法及系统,解决了现有技术中的无法为表格设计赋予辅助填写功能,使得无法快速准确的录入数据,进而降低工作效率的技术问题,通过基于表格设计的内容采集导向对用户的语音和图像进行采集、特征提取以及分类,同时使得语音信息采集和图像信息采集同步进行,当两者采集结果一致时,可确保输入数据准确无误,在赋予表格设计辅助填写功能的同时,确保了输入数据准确无误,确保数据统计的高效准确性,进而达到了确保基于表格设计系统设计出的具备辅助填写功能的表格可快速准确的录入数据,进而提高工作效率的技术效果。
本申请实施例提供一种具备辅助填写功能的表格设计方法,其中,所述方法应用于表格设计系统,且所述系统与一图像采集装置、语音识别装置通信连接,所述方法还包括:获得第一表格内容采集导向性信息;根据所述第一表格内容采集导向性信息,获得第一用户的第一语音输入信息;基于所述语音识别装置,获得与所述第一语音输入信息相匹配的第一转换文字信息;对所述第一转换文字信息进行第一关键词特征的提取、分类,生成第一关键词特征数据集;基于所述第一表格内容采集导向性信息和所述图像采集装置,采集所述第一用户的目标图像信息;对所述目标图像信息进行图像解析,获得第一图像解析结果;对所述第一图像解析结果进行第二关键词特征的提取、分类,生成第二关键词特征数据集;将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练,获得第一纠错结果,其中,所述内容纠错模型包含于所述表格设计系统;根据所述第一纠错结果对所述表格设计系统进行修正。
另一方面,本申请还提供了一种具备辅助填写功能的表格设计系统,其中,所述系统包括:第一获得单元:所述第一获得单元用于获得第一表格内容采集导向性信息;第二获得单元:所述第二获得单元用于根据所述第一表格内容采集导向性信息,获得第一用户的第一语音输入信息;第三获得单元:所述第三获得单元用于基于所述语音识别装置,获得与所述第一语音输入信息相匹配的第一转换文字信息;第一生成单元:所述第一生成单元用于对所述第一转换文字信息进行第一关键词特征的提取、分类,生成第一关键词特征数据集;第一采集单元:所述第一采集单元用于基于所述第一表格内容采集导向性信息和所述图像采集装置,采集所述第一用户的目标图像信息;第一解析单元:所述第一解析单元用于对所述目标图像信息进行图像解析,获得第一图像解析结果;第二生成单元:所述第二生成单元用于对所述第一图像解析结果进行第二关键词特征的提取、分类,生成第二关键词特征数据集;第一输入单元:所述第一输入单元用于将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练,获得第一纠错结果,其中,所述内容纠错模型包含于所述表格设计系统;第一修正单元:所述第一修正单元用于根据所述第一纠错结果对所述表格设计系统进行修正。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
通过基于表格设计的内容采集导向对用户的语音和图像进行采集、特征提取以及分类,同时使得语音信息采集和图像信息采集同步进行,当两者采集结果一致时,可确保输入数据准确无误,在赋予表格设计辅助填写功能的同时,确保了输入数据准确无误,确保数据统计的高效准确性,进而达到了确保基于表格设计系统设计出的具备辅助填写功能的表格可快速准确的录入数据,进而提高工作效率的技术效果。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
图1为本申请实施例一种具备辅助填写功能的表格设计方法的流程示意图;
图2为本申请实施例一种具备辅助填写功能的表格设计系统的结构示意图;
图3为本申请实施例示例性电子设备的结构示意图。
附图标记说明:第一获得单元11,第二获得单元12,第三获得单元13,第一生成单元14,第一采集单元15,第一解析单元16,第二生成单元17,第一输入单元18,第一修正单元19,总线300,接收器301,处理器302,发送器303,存储器304,总线接口305。
具体实施方式
本申请实施例通过提供一种具备辅助填写功能的表格设计方法及系统,解决了现有技术中的无法为表格设计赋予辅助填写功能,使得无法快速准确的录入数据,进而降低工作效率的技术问题,通过基于表格设计的内容采集导向对用户的语音和图像进行采集、特征提取以及分类,同时使得语音信息采集和图像信息采集同步进行,当两者采集结果一致时,可确保输入数据准确无误,在赋予表格设计辅助填写功能的同时,确保了输入数据准确无误,确保数据统计的高效准确性,进而达到了确保基于表格设计系统设计出的具备辅助填写功能的表格可快速准确的录入数据,进而提高工作效率的技术效果。
下面,将参考附图详细的描述根据本申请的示例实施例。显然,所描述的实施例仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
随着计算机应用的普及,各行各业都进入了计算机办公时代,利用表格可以将大量重复操作变得简单,从而有效的提高工作效率,同时,因需要输入大量统计数据,对数据的快速准确录入提出了更高的要求。现有技术中存在无法为表格设计赋予辅助填写功能,使得无法快速准确的录入数据,进而降低工作效率的技术问题。
针对上述技术问题,本申请提供的技术方案总体思路如下:
本申请实施例提供一种具备辅助填写功能的表格设计方法,其中,所述方法应用于表格设计系统,且所述系统与一图像采集装置、语音识别装置通信连接,所述方法还包括:获得第一表格内容采集导向性信息;根据所述第一表格内容采集导向性信息,获得第一用户的第一语音输入信息;基于所述语音识别装置,获得与所述第一语音输入信息相匹配的第一转换文字信息;对所述第一转换文字信息进行第一关键词特征的提取、分类,生成第一关键词特征数据集;基于所述第一表格内容采集导向性信息和所述图像采集装置,采集所述第一用户的目标图像信息;对所述目标图像信息进行图像解析,获得第一图像解析结果;对所述第一图像解析结果进行第二关键词特征的提取、分类,生成第二关键词特征数据集;将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练,获得第一纠错结果,其中,所述内容纠错模型包含于所述表格设计系统;根据所述第一纠错结果对所述表格设计系统进行修正。
为了更好地理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例一
如图1所示,本申请实施例提供了一种具备辅助填写功能的表格设计方法,其中,所述方法应用于表格设计系统,且所述系统与一图像采集装置、语音识别装置通信连接,所述方法还包括:
步骤S100:获得第一表格内容采集导向性信息;
具体而言,随着计算机应用的普及,各行各业都进入了计算机办公时代,利用表格可以将大量重复操作变得简单,从而有效的提高工作效率,同时,因需要输入大量统计数据,在本申请实施例中,通过对表格赋予辅助填写功能,可简化数据输入操作,给统计者带来极大的便利,提高了表格设计的普遍适用性。所述第一表格内容采集导向性信息可理解为需要进行填写的表格主题,即基于什么主题进行数据采集,包括但不局限于工资条统计、人口普查等需要利用表格进行统计的手段。
步骤S200:根据所述第一表格内容采集导向性信息,获得第一用户的第一语音输入信息。
步骤S300:基于所述语音识别装置,获得与所述第一语音输入信息相匹配的第一转换文字信息。
具体而言,所述第一用户为需要进行信息采集的对象,所述第一语音信息为所述第一用户基于需要采集的主题信息的语音输入,所述第一语音输入信息为表格设计辅助功能的第一功能,通过采集所述第一用户的第一语音信息,进而基于所述语音识别装置,对输入的语音信息进行文字转换,所述第一转换文字信息即为语音转换的结果,进而对所述第一转换文字信息进行进一步的操作。
进一步,语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术,语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。
步骤S400:对所述第一转换文字信息进行第一关键词特征的提取、分类,生成第一关键词特征数据集。
进一步,步骤S400还包括:
步骤S410:对所述第一转换文字信息进行语句结构分析,获得第一结构信息、第二结构信息以及第三结构信息;
步骤S420:基于所述第一结构信息,提取第一关键词信息,基于所述第二结构信息,提取第二关键词信息,基于所述第三结构信息,提取第三关键词信息,其中,所述第一关键词信息、所述第二关键词信息以及所述第三关键词信息均包含于所述第一关键词特征;
步骤S430:基于关键词词义,对所述第一关键词特征进行分类。
具体而言,基于所述语音识别装置,可对输入的语音进行识别,进而转换为可编辑的文字信息,需要注意的是,在语音转换过程中,可对所述第一转换文字信息进行语句结构分析,即对每一句话的语句成分进行分析,即对语句的主语成分、谓语成分、宾语成分以及其他成分进行语句结构分析,所述第一结构信息、所述第二结构信息以及所述第三结构信息即为对应的各个成分内容等,举例而言,若所述第一转换文字信息为“员工甲在第一个工作日因生病请假一天”,则所述第一结构信息即为表示主语的员工甲,所述第二结构信息即为表示谓语的生病请假,所述第三结构信息即为表示时间状语的第一个工作日,进而进行特征提取,所述第一关键词信息即为“员工甲”,所述第二关键词即为“生病请假”,所述第三关键词即为“第一个工作日”,进而基于关键词词意的不同,对提取的各关键词进行分类,使得各关键词对号入座,即当财务人员做工资表时,可对“请假人员”“请假原因”“请假时间”进行对号入座,依次填写,节省了数据输入时间,提高了工作效率。
步骤S500:基于所述第一表格内容采集导向性信息和所述图像采集装置,采集所述第一用户的目标图像信息。
具体而言,为了确保采集的表格信息准确无误,还可基于所述图像采集装置,自动采集相关的图像信息,所述目标图像信息即为表格设计辅助功能的第二功能,举例而言,某企业的请假系统与财务系统后台通信连接,当财务人员统计工资表时,可自动调用请假系统的请假审批列表,所述目标图像信息即为员工甲的请假申请以及审批等信息,进而对目标图像信息进行进一步的操作。
步骤S600:对所述目标图像信息进行图像解析,获得第一图像解析结果。
步骤S700:对所述第一图像解析结果进行第二关键词特征的提取、分类,生成第二关键词特征数据集。
具体而言,为了有效利用所述目标图像信息的有用信息,可对所述目标图像信息进行图像解析,即利用数学模型并结合图像处理的技术来分析底层特征和上层结构,从而提取具有一定智能性的信息,所述第一图像解析结果即为对所述目标图像信息分布、分区域解析的结果,进而对所述第一图像解析结果进行基于所述第二关键词特征的提取、分类,所述第二关键词特征包括姓名、请假类别、请假事由以及备注等,进而基于所述第二关键词特征及其对应的内容生成所述第二关键词特征数据集。
步骤S800:将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练,获得第一纠错结果,其中,所述内容纠错模型包含于所述表格设计系统。
步骤S900:根据所述第一纠错结果对所述表格设计系统进行修正。
具体而言,所述第一语音输入信息和所述目标图像信息为表格设计的双重保证,通过使得语音信息采集和图像信息采集同步进行,当两者结果一致时,进而确保输入数据准确无误,在赋予表格设计辅助 填写功能的同时,确保了输入数据准确无误,确保数据统计的高效准确性。需要注意的是,为了进一步确保两者采集结果一致,可通过将所述第一关键词特征数据集和所述第二关键词特征数据集输入所述内容纠错模型进行训练,所述内容纠错模型为一数据训练模型,可对输入数据进行纠错训练,使得获得所述第一纠错结果,若所述第一纠错结果显示采集结果不一致,可基于所述第一纠错结果,对所述表格设计系统进行修正,进一步可理解为,如果是语音识别结果出现问题,则对所述语音识别装置进行修正和完善,如果是图像采集结果出现问题,则对图像采集过程中的采集、解析、提取、分类过程进行修正和完善,最终确保基于所述表格设计系统设计出的具备辅助填写功能的表格可快速准确的录入数据,进而提高工作效率。
进一步,本申请实施例还包括:
步骤S1010:根据所述第一表格内容采集导向性信息,获得预设表格列表数据集;
步骤S1020:基于所述预设表格列表数据集,构建表格列表归纳模型;
步骤S1030:将所述第一关键词特征和所述第二关键词特征上传至所述表格列表归纳模型,并进行遍历检索分析,获得第一损失数据集和第一盈余数据集;
步骤S1040:将所述第一损失数据集输入至所述内容纠错模型,生成第二内容纠错模型;
步骤S1050:基于所述第二内容纠错模型,对所述第一损失数据集进行增量学习。
具体而言,为了确保表格信息采集的完整性,进一步,所述预设表格列表数据集可理解为基于表格的内容采集导向确定的采集列表,举例而言,需要对企业的员工工资进行表格统计,所述预设表格列表数据集可包括工号、部门、姓名、身份证号、出勤情况统计、应发工资、应扣/代扣工资、其他扣款项以及实发工资等,所述表格列表归纳模型即为基于所述预设表格列表数据集构建的模型,通过将所述第一关键词特征和所述第二关键词特征上传至所述表格列表归纳模型进行遍历检索分析,可判断关键词特征是否达到所述预设表格列表数据集的要求,进而获得所述第一损失数据和所述第一盈余数据集,所述第一损失数据集可理解为预设表格列表要求的分类特征,而实际没有检索到的特征,所述第一盈余数据集可理解为预设表格列表没有要求的分类特征,而实际中检索到的特征,基于所述第一损失数据是所述预设表格列表数据集要求的分类特征,可将所述第一损失数据集输入至所述内容纠错模型,生成所述第二内容纠错模型,所述第二内容纠错模型由所述第一损失数据集训练集合而成,可基于所述第二内容纠错模型,对所述第一损失数据集进行增量学习,举例而言,若所述第一关键词特征和所述第二关键词特征仅包含姓名、请假类别、请假时长和请假事由等,不包含延时加班费以及周末加班费等,可对延时加班费以及周末加班费进行增量学习,确保表格信息采集的完整性。
进一步,本申请实施例还包括:
步骤S1110:基于所述第一盈余数据集,获得第一附加特征、第二附加特征直至第N附加特征;
步骤S1120:获得所述预设表格列表数据集的目标卷积特征;
步骤S1130:根据所述目标卷积特征,对所述第一附加特征、所述第二附加特征直至所述第N附加特征进行遍历的卷积运算,获得第一卷积结果;
步骤S1140:基于所述第一卷积结果和第一处理逻辑,对所述第一附加特征、所述第二附加特征直至所述第N附加特征进行保留和剔除。
具体而言,为了对所述第一盈余数据集进行有效处理,进一步,可基于所述第一盈余特征,获得第一附加特征直至第N附加特征,所述第一附加特征直至所述第N附加特征构成了所述第一盈余数据集,举例而言,可以是员工甲的实际出勤天数、调休等附加特征,为了对所述第一附加特征直至所述第N附加特征进行选择性的删减,可对其进行卷积运算的处理,进一步,卷积神经网络,从字面上包括两个部分:卷积+神经网络。其中,卷积就是特征提取器,而神经网络,可以看作分类器。训练一个卷积神经网络,就是同时训练了特征提取器 (卷积) 和后面的分类器 (神经网络)。基于所述目标卷积特征,对所述第一附加特征、所述第二附加特征直至所述第N附加特征进行遍历的卷积运算,可获得第一卷积结果,所述第一卷积结果是通过卷积神经网络进行特征训练后的结果,并通过所述第一卷积结果和所述第一处理逻辑,对所述第一附加特征、所述第二附加特征直至所述第N附加特征进行选择性的保留和剔除,以实现对所述第一盈余数据集进行有效处理,确保统计的特征数据简单不繁琐。
进一步,所述第一处理逻辑,步骤S1140还包括:
步骤S1141:根据所述第一卷积结果,获得第一保留附加特征集和第一剔除附加特征集,其中,所述第一保留附加特征集和所述目标卷积特征具备第一关联性,所述第一剔除附加特征集和所述目标卷积特征不具备所述第一关联性;
步骤S1142:基于所述第一保留附加特征集,构建附加特征数据库;
步骤S1143:将所述第一保留附加特征集上传至所述附加特征数据库进行储存,对所述第一剔除附加特征集进行剔除。
具体而言,所述第一处理逻辑可具体理解为:基于所述第一卷积结果,可获得所述第一保留附加特征集合和所述第一剔除附加特征集合,所述第一保留附加特征集合可理解为与所述目标卷积特征具有所述第一关联性,即具备最直接的相关联性,举例而言,员工甲的实际出勤天数与工资统计具有直接关系,可对其“实际出勤天数特征”进行保留;所述第一剔除附加特征集合可理解为与所述目标卷积特征不具备所述第一关联性,即没有直接的关系,举例而言,若员工甲在月中期因业务需要经常加班,到了月末期不忙的时候,可适当安排调休,使得平均工作时间保持在一个正常的范围,与当月的工资统计不具有直接关系,可对其“调休特征”进行剔除,其次,可基于所述第一保留附加特征集构建所述附加特征数据库,对保留的附加特征集和进行安全存储,同时,对所述第一剔除附加特征集合进行剔除,确保对有用数据进行安全存储,对无效数据进行及时剔除,确保数据的可靠性。
进一步,所述根据所述第一纠错结果对所述表格设计系统进行修正,步骤S900还包括:
步骤S910:根据所述预设表格列表数据集,生成预设表格设计信息;
步骤S920:根据所述第一损失数据集和所述第一处理逻辑,对所述第一纠错结果进行补正,生成第二预设表格设计信息;
步骤S930:判断所述第二预设表格设计信息是否满足所述预设表格设计信息;
步骤S940:若所述第二预设表格设计信息不满足所述预设表格设计信息,对所述表格设计系统进行修正。
具体而言,为了进一步基于所述第一纠错结果对所述表格设计系统进行修正,具体的,所述预设表格设计信息为最初的一个设计雏形,即大致对哪些特征进行采集,同时,基于所述第一损失数据和所述第一处理逻辑,对所述第一纠错结果进行补正,即对必要特征信息进行添加,对非必要特征信息进行剔除,使得生成所述第二预设表格设计信息,通过判断所述第二预设表格设计信息是否满足所述预设表格设计信息,可进一步对所述表格设计系统进行修正,确保所述表格设计系统可高效准确运行。
进一步,所述将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练,获得第一纠错结果,步骤S800还包括:
步骤S810:将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练,所述内容纠错模型通过多组训练数据训练所得,其中,所述多组训练数据中的每一组训练数据均包括:所述第一关键词特征数据集、所述第二关键词特征数据集以及用来标识第一纠错结果的标识信息;
步骤S820:获得所述内容纠错模型的输出信息,所述输出信息包括所述第一纠错结果。
具体而言,为了获得更加准确的第一纠错结果,可将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练。所述内容纠错模型是一个神经网络模型,即机器学习中的神经网络模型,它是以神经元的数学模型为基础来描述的。简单地讲,它是一个数学模型。在本申请实施例中,将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练,用标识的第一纠错结果对神经网络模型进行训练。
进一步来说,所述内容纠错模型的过程实质为监督学习的过程。所述多组训练数据具体为:所述第一关键词特征数据集、所述第二关键词特征数据集以及用来标识第一纠错结果的标识信息。通过输入所述第一关键词特征数据集和所述第二关键词特征数据集,内容纠错模型会输出训练结果。通过将所述输出信息与所述起标识作用的第一纠错结果进行校验,如果所述输出信息与所述起标识作用的第一纠错结果要求相一致,则本数据监督学习完成,则进行下一组数据监督学习;如果所述输出信息与所述起标识作用的第一纠错结果要求不一致,则神经网络学习模型自身进行调整,直到神经网络学习模型输出结果与所述起标识作用的第一纠错结果要求相一致,进行下一组数据的监督学习。通过训练数据使神经网络学习模型自身不断地修正、优化,通过监督学习的过程来提高神经网络学习模型处理所述信息的准确性,进而达到使得所述第一纠错结果更加准确的技术效果。
综上所述,本申请实施例所提供的一种具备辅助填写功能的表格设计方法及系统具有如下技术效果:
1、通过基于表格设计的内容采集导向对用户的语音和图像进行采集、特征提取以及分类,同时使得语音信息采集和图像信息采集同步进行,当两者采集结果一致时,可确保输入数据准确无误,在赋予表格设计辅助填写功能的同时,确保了输入数据准确无误,确保数据统计的高效准确性,进而达到了确保基于表格设计系统设计出的具备辅助填写功能的表格可快速准确的录入数据,进而提高工作效率的技术效果。
实施例二
基于与前述实施例中一种具备辅助填写功能的表格设计方法同样发明构思,本发明还提供了一种具备辅助填写功能的表格设计系统,如图2所示,所述系统包括:
第一获得单元11:所述第一获得单元11用于获得第一表格内容采集导向性信息;
第二获得单元12:所述第二获得单元12用于根据所述第一表格内容采集导向性信息,获得第一用户的第一语音输入信息;
第三获得单元13:所述第三获得单元13用于基于所述语音识别装置,获得与所述第一语音输入信息相匹配的第一转换文字信息;
第一生成单元14:所述第一生成单元14用于对所述第一转换文字信息进行第一关键词特征的提取、分类,生成第一关键词特征数据集;
第一采集单元15:所述第一采集单元15用于基于所述第一表格内容采集导向性信息和所述图像采集装置,采集所述第一用户的目标图像信息;
第一解析单元16:所述第一解析单元16用于对所述目标图像信息进行图像解析,获得第一图像解析结果;
第二生成单元17:所述第二生成单元17用于对所述第一图像解析结果进行第二关键词特征的提取、分类,生成第二关键词特征数据集;
第一输入单元18:所述第一输入单元18用于将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练,获得第一纠错结果,其中,所述内容纠错模型包含于所述表格设计系统;
第一修正单元19:所述第一修正单元19用于根据所述第一纠错结果对所述表格设计系统进行修正。
进一步的,所述系统还包括:
第四获得单元:所述第四获得单元用于根据所述第一表格内容采集导向性信息,获得预设表格列表数据集;
第一构建单元:所述第一构建单元用于基于所述预设表格列表数据集,构建表格列表归纳模型;
第一上传单元:所述第一上传单元用于将所述第一关键词特征和所述第二关键词特征上传至所述表格列表归纳模型,并进行遍历检索分析,获得第一损失数据集和第一盈余数据集;
第二输入单元:所述第二输入单元用于将所述第一损失数据集输入至所述内容纠错模型,生成第二内容纠错模型;
第一学习单元:所述第一学习单元用于基于所述第二内容纠错模型,对所述第一损失数据集进行增量学习。
进一步的,所述系统还包括:
第五获得单元:所述第五获得单元用于基于所述第一盈余数据集,获得第一附加特征、第二附加特征直至第N附加特征;
第六获得单元:所述第六获得单元用于获得所述预设表格列表数据集的目标卷积特征;
第一运算单元:所述第一运算单元用于根据所述目标卷积特征,对所述第一附加特征、所述第二附加特征直至所述第N附加特征进行遍历的卷积运算,获得第一卷积结果;
第一保留单元:所述第一保留单元用于基于所述第一卷积结果和第一处理逻辑,对所述第一附加特征、所述第二附加特征直至所述第N附加特征进行保留和剔除。
进一步的,所述系统还包括:
第七获得单元:所述第七获得单元用于根据所述第一卷积结果,获得第一保留附加特征集和第一剔除附加特征集,其中,所述第一保留附加特征集和所述目标卷积特征具备第一关联性,所述第一剔除附加特征集和所述目标卷积特征不具备所述第一关联性;
第二构建单元:所述第二构建单元用于基于所述第一保留附加特征集,构建附加特征数据库;
第二上传单元:所述第二上传单元用于将所述第一保留附加特征集上传至所述附加特征数据库进行储存,对所述第一剔除附加特征集进行剔除。
进一步的,所述系统还包括:
第一分析单元:所述第一分析单元用于对所述第一转换文字信息进行语句结构分析,获得第一结构信息、第二结构信息以及第三结构信息;
第一提取单元:所述第一提取单元用于基于所述第一结构信息,提取第一关键词信息,基于所述第二结构信息,提取第二关键词信息,基于所述第三结构信息,提取第三关键词信息,其中,所述第一关键词信息、所述第二关键词信息以及所述第三关键词信息均包含于所述第一关键词特征;
第一分类单元:所述第一分类单元用于基于关键词词义,对所述第一关键词特征进行分类。
进一步的,所述系统还包括:
第三生成单元:所述第三生成单元用于根据所述预设表格列表数据集,生成预设表格设计信息;
第一补正单元:所述第一补正单元用于根据所述第一损失数据集和所述第一处理逻辑,对所述第一纠错结果进行补正,生成第二预设表格设计信息;
第一判断单元:所述第一判断单元用于判断所述第二预设表格设计信息是否满足所述预设表格设计信息;
第二修正单元:所述第二修正单元用于若所述第二预设表格设计信息不满足所述预设表格设计信息,对所述表格设计系统进行修正。
进一步的,所述系统还包括:
第三输入单元:所述第三输入单元用于将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练,所述内容纠错模型通过多组训练数据训练所得,其中,所述多组训练数据中的每一组训练数据均包括:所述第一关键词特征数据集、所述第二关键词特征数据集以及用来标识第一纠错结果的标识信息;
第八获得单元:所述第八获得单元用于获得所述内容纠错模型的输出信息,所述输出信息包括所述第一纠错结果。
前述图1实施例一中的一种具备辅助填写功能的表格设计方法的各种变化方式和具体实例同样适用于本实施例的一种具备辅助填写功能的表格设计系统,通过前述对一种具备辅助填写功能的表格设计方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种具备辅助填写功能的表格设计系统的实施方法,所以为了说明书的简洁,在此不再详述。
实施例三
下面参考图3来描述本申请实施例的电子设备。
图3图示了根据本申请实施例的电子设备的结构示意图。
基于与前述实例施中一种具备辅助填写功能的表格设计方法的发明构思,本发明还提供一种具备辅助填写功能的表格设计系统,其上存储有计算机程序,该程序被处理器执行时实现前文所述一种具备辅助填写功能的表格设计系统的任一方法的步骤。
其中,在图3中,总线架构(用总线300来代表),总线300可以包括任意数量的互联的总线和桥,总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其它电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口305在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件,即收发机,提供用于在传输介质上与各种其他系统通信的单元。处理器302负责管理总线300和通常的处理,而存储器304可以被用于存储处理器302在执行操作时所使用的数据。
本申请实施例提供一种具备辅助填写功能的表格设计方法,其中,所述方法应用于表格设计系统,且所述系统与一图像采集装置、语音识别装置通信连接,所述方法还包括:获得第一表格内容采集导向性信息;根据所述第一表格内容采集导向性信息,获得第一用户的第一语音输入信息;基于所述语音识别装置,获得与所述第一语音输入信息相匹配的第一转换文字信息;对所述第一转换文字信息进行第一关键词特征的提取、分类,生成第一关键词特征数据集;基于所述第一表格内容采集导向性信息和所述图像采集装置,采集所述第一用户的目标图像信息;对所述目标图像信息进行图像解析,获得第一图像解析结果;对所述第一图像解析结果进行第二关键词特征的提取、分类,生成第二关键词特征数据集;将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练,获得第一纠错结果,其中,所述内容纠错模型包含于所述表格设计系统;根据所述第一纠错结果对所述表格设计系统进行修正。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的系统。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令系统的制造品,该指令系统实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (9)
1.一种具备辅助填写功能的表格设计方法,其特征在于,所述表格设计方法应用于表格设计系统,且所述表格设计系统与一图像采集装置、语音识别装置通信连接,所述方法还包括:
获得第一表格内容采集导向性信息;
根据所述第一表格内容采集导向性信息,获得第一用户的第一语音输入信息;
基于所述语音识别装置,获得与所述第一语音输入信息相匹配的第一转换文字信息;
对所述第一转换文字信息进行第一关键词特征的提取、分类,生成第一关键词特征数据集;
基于所述第一表格内容采集导向性信息和所述图像采集装置,采集所述第一用户的目标图像信息;
对所述目标图像信息进行图像解析,获得第一图像解析结果;
对所述第一图像解析结果进行第二关键词特征的提取、分类,生成第二关键词特征数据集;
将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练,获得第一纠错结果,其中,所述内容纠错模型包含于所述表格设计系统;
根据所述第一纠错结果对所述表格设计系统进行修正。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述第一表格内容采集导向性信息,获得预设表格列表数据集;
基于所述预设表格列表数据集,构建表格列表归纳模型;
将所述第一关键词特征和所述第二关键词特征上传至所述表格列表归纳模型,并进行遍历检索分析,获得第一损失数据集和第一盈余数据集;
将所述第一损失数据集输入至所述内容纠错模型,生成第二内容纠错模型;
基于所述第二内容纠错模型,对所述第一损失数据集进行增量学习。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
基于所述第一盈余数据集,获得第一附加特征、第二附加特征直至第N附加特征;
获得所述预设表格列表数据集的目标卷积特征;
根据所述目标卷积特征,对所述第一附加特征、所述第二附加特征直至所述第N附加特征进行遍历的卷积运算,获得第一卷积结果;
基于所述第一卷积结果和第一处理逻辑,对所述第一附加特征、所述第二附加特征直至所述第N附加特征进行保留和剔除。
4.如权利要求3所述的方法,其特征在于,所述第一处理逻辑,还包括:
根据所述第一卷积结果,获得第一保留附加特征集和第一剔除附加特征集,其中,所述第一保留附加特征集和所述目标卷积特征具备第一关联性,所述第一剔除附加特征集和所述目标卷积特征不具备所述第一关联性;
基于所述第一保留附加特征集,构建附加特征数据库;
将所述第一保留附加特征集上传至所述附加特征数据库进行储存,对所述第一剔除附加特征集进行剔除。
5.如权利要求1所述的方法,其特征在于,所述对所述第一转换文字信息进行第一关键词特征的提取、分类,还包括:
对所述第一转换文字信息进行语句结构分析,获得第一结构信息、第二结构信息以及第三结构信息;
基于所述第一结构信息,提取第一关键词信息,基于所述第二结构信息,提取第二关键词信息,基于所述第三结构信息,提取第三关键词信息,其中,所述第一关键词信息、所述第二关键词信息以及所述第三关键词信息均包含于所述第一关键词特征;
基于关键词词义,对所述第一关键词特征进行分类。
6.如权利要求3所述的方法,其特征在于,所述根据所述第一纠错结果对所述表格设计系统进行修正,还包括:
根据所述预设表格列表数据集,生成预设表格设计信息;
根据所述第一损失数据集和所述第一处理逻辑,对所述第一纠错结果进行补正,生成第二预设表格设计信息;
判断所述第二预设表格设计信息是否满足所述预设表格设计信息;
若所述第二预设表格设计信息不满足所述预设表格设计信息,对所述表格设计系统进行修正。
7.如权利要求1所述的方法,其特征在于,所述将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练,获得第一纠错结果,还包括:
将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练,所述内容纠错模型通过多组训练数据训练所得,其中,所述多组训练数据中的每一组训练数据均包括:所述第一关键词特征数据集、所述第二关键词特征数据集以及用来标识第一纠错结果的标识信息;
获得所述内容纠错模型的输出信息,所述输出信息包括所述第一纠错结果。
8.一种具备辅助填写功能的表格设计系统,其特征在于,所述系统包括:
第一获得单元:所述第一获得单元用于获得第一表格内容采集导向性信息;
第二获得单元:所述第二获得单元用于根据所述第一表格内容采集导向性信息,获得第一用户的第一语音输入信息;
第三获得单元:所述第三获得单元用于基于语音识别装置,获得与所述第一语音输入信息相匹配的第一转换文字信息;
第一生成单元:所述第一生成单元用于对所述第一转换文字信息进行第一关键词特征的提取、分类,生成第一关键词特征数据集;
第一采集单元:所述第一采集单元用于基于所述第一表格内容采集导向性信息和图像采集装置,采集所述第一用户的目标图像信息;
第一解析单元:所述第一解析单元用于对所述目标图像信息进行图像解析,获得第一图像解析结果;
第二生成单元:所述第二生成单元用于对所述第一图像解析结果进行第二关键词特征的提取、分类,生成第二关键词特征数据集;
第一输入单元:所述第一输入单元用于将所述第一关键词特征数据集和所述第二关键词特征数据集输入内容纠错模型进行训练,获得第一纠错结果,其中,所述内容纠错模型包含于所述表格设计系统;
第一修正单元:所述第一修正单元用于根据所述第一纠错结果对所述表格设计系统进行修正。
9.一种具备辅助填写功能的表格设计系统,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现权利要求1-7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110695565.6A CN113254698B (zh) | 2021-06-23 | 2021-06-23 | 一种具备辅助填写功能的表格设计方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110695565.6A CN113254698B (zh) | 2021-06-23 | 2021-06-23 | 一种具备辅助填写功能的表格设计方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113254698A true CN113254698A (zh) | 2021-08-13 |
CN113254698B CN113254698B (zh) | 2021-11-19 |
Family
ID=77189361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110695565.6A Active CN113254698B (zh) | 2021-06-23 | 2021-06-23 | 一种具备辅助填写功能的表格设计方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113254698B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106649238A (zh) * | 2016-12-20 | 2017-05-10 | 北京云知声信息技术有限公司 | 语音转写方法及装置 |
CN108984510A (zh) * | 2018-09-12 | 2018-12-11 | 山西中电科新能源技术有限公司 | 通过语音将信息录入表格的系统 |
CN109840519A (zh) * | 2019-01-25 | 2019-06-04 | 青岛盈智科技有限公司 | 一种自适应的智能单据识别录入装置及其使用方法 |
CN110060674A (zh) * | 2019-03-15 | 2019-07-26 | 重庆小雨点小额贷款有限公司 | 表格管理方法、装置、终端和存储介质 |
CN111126009A (zh) * | 2019-12-12 | 2020-05-08 | 深圳追一科技有限公司 | 表单填写方法、装置、终端设备及存储介质 |
-
2021
- 2021-06-23 CN CN202110695565.6A patent/CN113254698B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106649238A (zh) * | 2016-12-20 | 2017-05-10 | 北京云知声信息技术有限公司 | 语音转写方法及装置 |
CN108984510A (zh) * | 2018-09-12 | 2018-12-11 | 山西中电科新能源技术有限公司 | 通过语音将信息录入表格的系统 |
CN109840519A (zh) * | 2019-01-25 | 2019-06-04 | 青岛盈智科技有限公司 | 一种自适应的智能单据识别录入装置及其使用方法 |
CN110060674A (zh) * | 2019-03-15 | 2019-07-26 | 重庆小雨点小额贷款有限公司 | 表格管理方法、装置、终端和存储介质 |
CN111126009A (zh) * | 2019-12-12 | 2020-05-08 | 深圳追一科技有限公司 | 表单填写方法、装置、终端设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113254698B (zh) | 2021-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021047186A1 (zh) | 咨询对话处理的方法、装置、设备及存储介质 | |
CN111597243B (zh) | 基于数据仓库抽象数据加载的方法及系统 | |
US11429810B2 (en) | Question answering method, terminal, and non-transitory computer readable storage medium | |
CN112199512B (zh) | 面向科技服务的事理图谱构建方法、装置、设备及存储介质 | |
CN110334214A (zh) | 一种自动识别案件中虚假诉讼的方法 | |
CN111159375A (zh) | 一种文本处理方法及装置 | |
CN107844558A (zh) | 一种分类信息的确定方法以及相关装置 | |
CN114547072A (zh) | 自然语言查询转换sql方法、系统、设备及存储介质 | |
CN115186780B (zh) | 学科知识点分类模型训练方法、系统、存储介质及设备 | |
KR102155877B1 (ko) | 인공지능 학습 데이터 생성을 위한 크라우드소싱 플랫폼의 참여 자격에 매칭되는 프로젝트 정보 제공 방법 | |
CN113468317A (zh) | 一种简历筛选方法、系统、设备和存储介质 | |
CN116775879A (zh) | 大语言模型的微调训练方法、合同风险评审方法及系统 | |
CN116467171A (zh) | 自动化测试用例构建装置、方法、电子设备及存储介质 | |
CN109359288B (zh) | 一种对于法务领域文书量化评估的方法 | |
CN117648093A (zh) | 基于大模型和自定制需求模板的rpa流程自动化生成方法 | |
CN113326678A (zh) | 会议纪要的生成方法、装置、终端设备及计算机存储介质 | |
CN113254698B (zh) | 一种具备辅助填写功能的表格设计方法及系统 | |
Magalhães et al. | Mare: an active learning approach for requirements classification | |
CN114722159B (zh) | 针对数控机床制造资源的多源异构数据处理方法及系统 | |
CN115062126A (zh) | 一种语句分析方法、装置、电子设备及可读存储介质 | |
Sinpang et al. | Detecting ambiguity in requirements analysis using Mamdani fuzzy inference | |
CN113722421B (zh) | 一种合同审计方法和系统,及计算机可读存储介质 | |
CN112380321A (zh) | 基于票据知识图谱的主次数据库分配方法及相关设备 | |
CN111881266A (zh) | 一种应答方法及装置 | |
CN111414936B (zh) | 分类网络的确定方法、图像检测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |