CN109190096B - 确定控件的方法、装置和存储介质以及电子设备 - Google Patents
确定控件的方法、装置和存储介质以及电子设备 Download PDFInfo
- Publication number
- CN109190096B CN109190096B CN201810786493.4A CN201810786493A CN109190096B CN 109190096 B CN109190096 B CN 109190096B CN 201810786493 A CN201810786493 A CN 201810786493A CN 109190096 B CN109190096 B CN 109190096B
- Authority
- CN
- China
- Prior art keywords
- control
- target
- text
- determined
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
- G06F40/18—Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开涉及一种确定控件的方法、装置和存储介质以及电子设备,该方法包括:从当前数据表中获取目标文本;从所述目标文本中提取至少一个目标关键词;确定每个所述目标关键词对应的至少一个待确定控件;获取每个所述目标关键词与至少一个所述待确定控件之间的关联度;根据所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件。
Description
技术领域
本公开涉及计算机技术领域,具体地,涉及一种确定控件的方法、装置和存储介质以及电子设备。
背景技术
用户在设计数据表(如表单)时需要在数据表中填充控件(如日期、单选按钮、复选框、单行文本以及多行文本等控件),其中,该数据表可以通过在表单设计器中人工绘制或者将已有数据表拷贝至表单设计器中的方式获取,而填充控件可以通过拖拽操作完成,考虑到在该数据表为大表单时,需要将大量的控件均拖拽至该大表单中,存在工作量较大的问题,可见,通过拖拽操作耗时较长,从而造成服务超时,以及表单数据丢失的问题。
为了减少用户的拖拽操作,目前,可以基于数据表中文本的文字语义自动填充控件,例如,若该数据表中文本为“在A-B日期之间的售房总数”,则提取的文字语义可能为“日期”,此时,自动填充的控件即为日期控件,但是,由于该数据表中文本对应的目标控件并非是日期控件,因此,仅依靠数据表中文本的文字语义自动填充控件存在准确率较低的问题。
发明内容
为了解决上述问题,本公开提出了一种确定控件的方法、装置和存储介质以及电子设备。
根据本公开实施例的第一方面,提供一种确定控件的方法,包括:
从当前数据表中获取目标文本;
从所述目标文本中提取至少一个目标关键词;
确定每个所述目标关键词对应的至少一个待确定控件;
获取每个所述目标关键词与至少一个所述待确定控件之间的关联度;
根据所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件。
可选地,在所述根据所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件前,还包括:
从多个文本样本中获取至少一个所述待确定控件对应的文本集;所述文本集包括至少一个所述文本样本;
获取每个所述目标关键词在至少一个所述待确定控件对应的文本集中的词语权重;
所述根据所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的所述目标控件包括:
根据所述词语权重和所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件。
可选地,所述根据所述词语权重和所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件包括:
根据所述词语权重和所述关联度确定每个所述目标关键词与至少一个所述待确定控件的关联加权值;
将每个所述目标关键词与同一所述待确定控件的关联加权值进行求和得到同一所述待确定控件的关联评价参数;
根据所述关联评价参数从至少一个所述待确定控件中确定所述目标控件。
可选地,在所述确定每个所述目标关键词对应的至少一个待确定控件前,还包括:
从多个数据表样本中,获取多个所述文本样本以及多个所述文本样本依次对应的控件样本;
从每个所述文本样本中提取至少一个关键词样本;
根据至少一个所述关键词样本与所述控件样本建立关键词控件对应关系;所述关键词控件对应关系包括每个所述文本样本中的至少一个所述关键词样本与每个所述文本样本对应的控件样本之间的一一对应关系;
所述确定每个所述目标关键词对应的至少一个待确定控件包括:
根据所述关键词控件对应关系确定每个所述目标关键词对应的至少一个所述待确定控件。
可选地,在所述当前数据表是由不同数据表格式的至少两个预设数据表构成时,在所述从当前数据表中获取目标文本前,还包括:
将不同数据表格式的至少两个所述预设数据表转换为同一数据表格式;
将转换为同一数据表格式的至少两个所述预设数据表进行合并得到所述当前数据表。
可选地,在所述根据所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件后,还包括:
接收关联度更新指令;
在所述关联度更新指令指示减小所述关联度时,将所述关联度减去预定值得到更新后的关联度;
在所述关联度更新指令指示增大所述关联度时,将所述关联度加上所述预定值得到更新后的关联度。
根据本公开实施例的第二方面,提供一种确定控件的装置,包括:
第一获取模块,用于从当前数据表中获取目标文本;
第一提取模块,用于从所述目标文本中提取至少一个目标关键词;
第一确定模块,用于确定每个所述目标关键词对应的至少一个待确定控件;
第二获取模块,用于获取每个所述目标关键词与至少一个所述待确定控件之间的关联度;
第二确定模块,用于根据所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件。
可选地,还包括:
第三获取模块,用于从多个文本样本中获取至少一个所述待确定控件对应的文本集;所述文本集包括至少一个所述文本样本;
第四获取模块,用于获取每个所述目标关键词在至少一个所述待确定控件对应的文本集中的词语权重;
所述第二确定模块,用于根据所述词语权重和所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件。
可选地,所述第二确定模块包括:
第一确定子模块,用于根据所述词语权重和所述关联度确定每个所述目标关键词与至少一个所述待确定控件的关联加权值;
计算子模块,用于将每个所述目标关键词与同一所述待确定控件的关联加权值进行求和得到同一所述待确定控件的关联评价参数;
第二确定子模块,用于根据该关联评价参数从至少一个该待确定控件中确定该目标控件。
可选地,还包括:
第五获取模块,用于从多个数据表样本中,获取多个所述文本样本以及多个所述文本样本依次对应的控件样本;
第二提取模块,用于从每个所述文本样本中提取至少一个关键词样本;
建立模块,用于根据至少一个所述关键词样本与所述控件样本建立关键词控件对应关系;所述关键词控件对应关系包括每个所述文本样本中的至少一个所述关键词样本与每个所述文本样本对应的控件样本之间的一一对应关系;
所述第一确定模块,用于根据所述关键词控件对应关系确定每个所述目标关键词对应的至少一个所述待确定控件。
可选地,在所述当前数据表是由不同数据表格式的至少两个预设数据表构成时,还包括:
转换模块,用于将不同数据表格式的至少两个所述预设数据表转换为同一数据表格式;
合并模块,用于将转换为同一数据表格式的至少两个所述预设数据表进行合并得到所述当前数据表。
可选地,还包括:
接收模块,用于接收关联度更新指令;
第六获取模块,用于在所述关联度更新指令指示减小所述关联度时,将所述关联度减去预定值得到更新后的关联度;
第七获取模块,用于在所述关联度更新指令指示增大所述关联度时,将所述关联度加上所述预定值得到更新后的关联度。
根据本公开实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一方面所述方法的步骤。
根据本公开实施例的第四方面,提供一个电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现上述第一方面所述方法的步骤。
通过上述技术方案,可以首先从当前数据表中获取目标文本;接着,从所述目标文本中提取至少一个目标关键词;然后,确定每个所述目标关键词对应的至少一个待确定控件;其次,获取每个所述目标关键词与至少一个所述待确定控件之间的关联度;最后,根据所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件。这样,可以根据每个该目标关键词与至少一个待确定控件之间的关联度确定与全部目标关键词关联度最好的目标控件,从而提高了确定目标控件的准确性,并避免了现有技术中仅基于数据表中文本的文字语义而导致的确定目标控件不准确的问题。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1为本公开示例性实施例示出的一种确定控件的方法的流程示意图;
图2为本公开示例性实施例示出的另一种确定控件的方法的流程示意图;
图3为本公开示例性实施例示出的第一种确定控件的装置框图;
图4为本公开示例性实施例示出的第二种确定控件的装置框图;
图5为本公开示例性实施例示出的第三种确定控件的装置框图;
图6为本公开示例性实施例示出的第四种确定控件的装置框图;
图7为本公开示例性实施例示出的第五种确定控件的装置框图;
图8为本公开示例性实施例示出的第六种确定控件的装置框图;
图9为本公开示例性实施例示出的一种电子设备的框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
本公开可以在目标文本中提取到至少一个目标关键词,并确定每个该目标关键词对应的至少一个待确定控件,这样,可以根据每个该目标关键词与至少一个待确定控件之间的关联度确定与全部目标关键词关联度最好的目标控件,从而提高了确定目标控件的准确性,并避免了现有技术中仅基于数据表中文本的文字语义而导致的确定目标控件不准确的问题。
下面结合具体实施例对本公开进行详细说明。
图1为本公开示例性实施例示出的一种确定控件的方法的流程示意图,如图1所示,包括:
S101、从当前数据表中获取目标文本。
通常可以将当前数据表划分为多个子表,其中,该子表一般存在以下类型,规则类型:该子表为位于当前数据表同一行中的两个相邻单元格,一个单元格中包括描述控件文本,另一个单元格为空白单元格,该空白单元格可以用于收集与该描述控件文本对应的文本型数据;单选复选类型:该子表为位于当前数据表同一行中的两个相邻单元格,两个相邻单元格中均存在描述同一控件的描述控件文本;意见审核类型:该子表可以为位于当前数据表一整行的单元格,该单元格中可以包括人名、时间、意见等文本。这样,将该当前数据表划分为多个子表后,可以确定每个子表所属类型,并在该子表为意见审核类型时,将该子表进行拆分,从而使得人名、时间、意见等文本分解,此时,该目标文本可以为分解后的文本;在该子表为规则类型时,该目标文本可以为描述控件文本;在该子表为单选复选类型时,该目标文本可以为描述同一控件的描述控件文本,上述子表的类型只是举例说明,本公开对此不作限定。
S102、从该目标文本中提取至少一个目标关键词。
在本步骤中,可以对该目标文本进行分词处理得到至少一个词语,需要说明的是,由于一些词语如“啊”“噢”“嘛”“的”等停用词,并无实际的意义,只是表示语气,如果将这些词作为目标关键词,会造成获取目标关键词的复杂度过大的问题,因此,为了解决该问题,本公开可以将至少一个词语中的停用词去除得到待确定词语,并从该待确定词语中确定至少一个目标关键词。
S103、确定每个该目标关键词对应的至少一个待确定控件。
在本公开中,可以获取关键词控件对应关系,并根据该关键词控件对应关系确定每个该目标关键词对应的至少一个待确定控件,其中,该关键词控件对应关系包括每个文本样本中的至少一个关键词样本与每个文本样本对应的控件样本之间的一一对应关系。
S104、获取每个该目标关键词与至少一个该待确定控件之间的关联度。
其中,该目标关键词与该待确定控件之间的关联性越好,该关联度越大,相反,该目标关键词与该待确定控件之间的关联性越差,该关联度越小。
S105、根据该关联度从至少一个该待确定控件中确定全部该目标关键词对应的目标控件。
需要说明的是,本公开还需要从多个文本样本中获取至少一个该待确定控件对应的文本集,其中,该文本集包括至少一个该文本样本,并获取每个该目标关键词在至少一个该待确定控件对应的文本集中的词语权重,这样,可以综合该词语权重和该关联度从至少一个该确定控件中确定全部该目标关键词对应的目标控件。
采用上述方法,可以在目标文本中提取至少一个目标关键词,并确定每个该目标关键词对应的至少一个待确定控件,这样,可以根据每个该目标关键词与至少一个待确定控件之间的关联度确定与全部目标关键词关联度最好的目标控件,从而提高了确定目标控件的准确性,并避免了现有技术中仅基于数据表中文本的文字语义而导致的确定目标控件不准确的问题。
图2为本公开示例性实施例示出的一种确定控件的方法的流程示意图,如图2所示,包括:
S201、从当前数据表中获取目标文本。
需要说明的是,在本步骤前,还包括:构建该当前数据表。
在相关技术中可以通过人工绘制的方式构建该当前数据表,由于人工绘制的过程需要从零创建,造成工作量较大的问题,为了避免该问题,可以通过拷贝预设数据表的方式创建该当前数据表,目前,拷贝预设数据表的方式适用于:该当前数据表包括同一种数据表格式(如word格式、WPS格式或者Excel格式等)的至少一个预设数据表,此时,可以直接将同一种数据表格式的至少一个预设数据表拷贝至表单设计器以构建该当前数据表;但是,在该当前数据表包括不同数据表格式的至少两个预设数据表时,由于表单设计器不能同时兼容不同数据表格式的至少两个预设数据表,为了解决该问题,本公开可以将不同数据表格式的至少两个预设数据表转换为同一数据表格式,并将转换为同一数据表格式的至少两个预设数据表进行合并得到该当前数据表,这样,解决了由于表单设计器不能同时兼容多个数据表格式而导致的无法构建当前数据表的问题。
示例地,若该当前数据表包括word格式的第一表单和wps格式的第二表单,在一种可能的实现方式中,可以将word格式的第一表单转换为wps格式,并将转换为wps格式的第一表单和wps格式的第二表单进行合并得到该当前数据表;在另一种可能的实现方式中,可以将wps格式的第二表单转换为word格式,并将转换为word格式的第二表单和word格式的第一表单进行合并得到该当前数据表,上述示例只是举例说明,本公开对此不作限定。
在本公开中,通常可以将当前数据表划分为多个子表,其中,该子表一般存在以下类型,规则类型:该子表为位于当前数据表同一行中的两个相邻单元格,一个单元格中包括描述控件文本,另一个单元格为空白单元格,该空白单元格可以用于收集与该描述控件文本对应的文本型数据;单选复选类型:该子表为位于当前数据表同一行中的两个相邻单元格,两个相邻单元格中均存在描述同一控件的描述控件文本;意见审核类型:该子表可以为位于当前数据表一整行的单元格,该单元格中可以包括人名、时间、意见等文本。这样,将该当前数据表划分为多个子表后,可以确定每个子表所属类型,并在该子表为意见审核类型时,将该子表进行拆分,从而使得人名、时间、意见等文本分解,此时,该目标文本可以为分解后的文本;在该子表为规则类型时,该目标文本可以为描述控件文本;在该子表为单选复选类型时,该目标文本可以为描述同一控件的描述控件文本,上述子表的类型只是举例说明,本公开对此不作限定。示例地,若该当前数据表如表1所示:
表1
由上述表1可知:可以确定第二行中的第一列(即住宅面积(平方))和第二行中的第二列(即空白单元格)为规则类型;第二行中的第三列(即房屋总数)和第二行中的第四列(即空白单元格)为规则类型;第一行中的第一列(即项目建设情况)和第一行中的第二列(即已竣工、主体已竣工以及其他)为单选复选类型;第一行中的第三列(即销售方式)和第一行中的第四列(即自销和委托销售)为单选复选类型;第七行和第八行均为意见审核类型。这样,对于表1所示的当前数据表,可以根据当前数据表获取到多个子表,其中,需要对第七行对应的子表和第八行对应的子表分别进行拆分,为了方便描述,以子表包括第八行为例进行说明,由于该子表中包括了“审核意见”、“审核人”、“受理税务机关(公章)”、“审核日期”、“年”、“月”以及“日”等文本,则可以根据该子表中的文字布局(如文字的位置或者文字之间的间距等信息)对该子表进行拆分,从而使得该第八行中的整个文本分解,分解后得到“审核意见”对应的文本、“审核人”对应的文本、“受理税务机关(公章)”对应的文本,以及“审核日期、年、月、日”对应的文本,上述对子表进行拆分的具体过程可以参考现有技术,不再赘述,另外,在该子表拆分完成后,若该拆分结果存在错误,则可以通过人工对该拆分结果进行修正。
S202、从该目标文本中提取至少一个目标关键词。
在本步骤中,可以对该目标文本进行分词处理得到至少一个词语,需要说明的是,由于一些词语如“啊”“噢”“嘛”“的”等停用词,并无实际的意义,只是表示语气,如果将这些词作为目标关键词,会造成获取目标关键词的复杂度过大的问题,因此,为了解决该问题,本公开可以将至少一个词语中的停用词去除得到待确定词语,并从该待确定词语中确定至少一个目标关键词,在一种可能的实现方式中,可以从多个数据表样本中,获取多个该文本样本,并从每个该文本样本中提取至少一个关键词样本,根据至少一个该关键词样本构建关键词集,这样,可以确定该关键词集中是否包括与该待确定词语匹配的关键词样本,在该关键词集中包括与该待确定词语匹配的关键词样本时,确定该待确定词语为该目标关键词,在该关键词集中不包括与该待确定词语匹配的关键词样本时,确定该待确定词语不为该目标关键词,上述从多个数据表样本中获取多个文本样本的方法可以参考步骤S201中获取目标文本的方法,不再赘述。
S203、根据关键词控件对应关系确定每个该目标关键词对应的至少一个待确定控件。
在本公开中,可以通过以下方式构建该关键词控件对应关系:
S11、从多个数据表样本中,获取多个该文本样本以及多个该文本样本依次对应的控件样本。
由于该数据表样本中已对每一个文本样本设置有对应的控件样本,因此,可以直接根据该数据表样本确定每一个文本样本对应的控件样本。示例地,若数据表样本如表2所示:
表2
由上述表2可知:在该文本样本为“姓名”时,对应的控件为“单行文本控件”;在该文本样本为“请假日期”时,对应的控件为“日期控件”;在该文本样本为“请假类别”、“工伤”、“病假”和“事假”时,对应的控件为“单选框控件”,上述示例只是举例说明,本公开对此不作限定。
S12、从每个该文本样本中提取至少一个关键词样本。
示例地,继续以表2中的示例为例进行说明,在该文本样本为“姓名”时,对应的关键词样本可以为“姓名”;在该文本样本为“请假日期”时,对应的关键词样本可以为“日期”;在该文本样本为“请假类别”、“工伤”、“病假”和“事假”时,对应的关键词样本可以为“类别”“工伤”、“病假”和“事假”,上述示例只是举例说明,本公开对此不作限定。
S13、根据至少一个该关键词样本与该控件样本建立关键词控件对应关系。
其中,该关键词控件对应关系包括每个该文本样本中的至少一个该关键词样本与每个该文本样本对应的控件样本之间的一一对应关系。示例地,继续以表2中的示例为例进行说明,该关键词控件对应关系可以为关键词样本“姓名”与“单行本控件”之间的对应关系,关键词样本“日期”与“日期控件”之间的对应关系,关键词样本“类别”与“单选框控件”之间的对应关系,关键词样本“工伤”与“单选框控件”之间的对应关系,关键词样本“病假”与“单选框控件”之间的对应关系,关键词样本“事假”与“单选框控件”之间的对应关系,上述示例只是举例说明,本公开对此不作限定。
这样,在构建完成该关键词控件对应关系后,若该目标关键词包括“日期”、“年”、“月”和“日”,则可以根据该关键词控件对应关系确定每个该目标关键词对应的至少一个待确定控件,即“日期”对应的至少一个待确定控件,“年”对应的至少一个待确定控件,“月”对应的至少一个待确定控件,以及“日”对应的至少一个待确定控件,上述示例只是举例说明,本公开对此不作限定。
S204、获取每个该目标关键词与至少一个该待确定控件之间的关联度。
其中,该目标关键词与该待确定控件之间的关联性越好,该关联度越大,相反,该目标关键词与该待确定控件之间的关联性越差,该关联度越小。
需要说明的是,在构建完成该关键词控件对应关系后,可以预先对该关键词控件对应关系中的关键词样本和对应的控件样本设置初始关联度(如设置为1),并根据该初始关联度以及后续步骤中的词语权重生成该关键词样本对应的数据表控件,其中,该数据表控件为该关键词控件对应关系中该关键词样本对应的控件样本中的控件,从而可以通过用户确定展示的该数据表控件是否正确,若展示的该数据表控件正确,则可以将该关键词样本与对应的该数据表控件之间的初始关联度增大,相反,若展示的该数据表控件错误,则可以将该关键词样本与对应的该数据表控件之间的初始关联度减小,这样,本步骤中的关联度可以通过更新该初始关联度获取到。
S205、从多个文本样本中获取至少一个该待确定控件对应的文本集。
其中,该文本集包括至少一个该文本样本。同样地,考虑到该数据表样本中已经对每一个文本样本设置有对应的控件样本,因此,可以直接根据该数据表样本确定每一个文本样本对应的控件样本,这样,本步骤可以将该多个文本样本按照该多个文本样本对应的控件样本的控件类别进行聚类,从而根据聚类结果得到每个该待确定控件对应的文本集。
S206、获取每个该目标关键词在至少一个该待确定控件对应的文本集中的词语权重。
在本步骤中,该词语权重可以是词语出现的频率,若该目标关键词在某一个待确定控件对应的文本集中未出现,则对应的词语权重即为0;若该目标关键词在某一个待确定控件对应的文本集中出现了10次,则对应的词语权重为10,上述示例只是举例说明,本公开对此不作限定。
S207、根据该词语权重和该关联度从至少一个该确定控件中确定全部该目标关键词对应的目标控件。
在本步骤中,可以根据该词语权重和该关联度确定每个该目标关键词与至少一个该待确定控件的关联加权值,并将每个该目标关键词与同一该待确定控件的关联加权值进行求和得到同一该待确定控件的关联评价参数,从而根据该关联评价参数从至少一个该待确定控件中确定该目标控件。示例地,可以确定最大关联评价参数对应的该待确定控件为该目标控件。需要说明的是,在将每个该目标关键词与同一该待确定控件的关联加权值进行求和得到同一该待确定控件的关联评价参数时,若该目标关键词对应的至少一个待确定控件中不包括同一该待确定控件,则可以认为该目标关键词与同一该待确定控件的关联加权值为0,上述示例只是举例说明,本公开对此不作限定。
示例地,在该目标关键词包括a、b和c时,假设a对应的至少一个待确定控件为A1和A2,b对应的至少一个待确定控件为B1、B2和A1,c对应的至少一个待确定控件为A1、A2和C,此时,若:a在A1对应的文本集中出现了5次,且a与A1之间的关联度为1.2;a在A2对应的文本集中出现了3次,且a与A2之间的关联度为1.3;b在A1对应的文本集中出现了7次,且b与A1之间的关联度为1.2;b在B1对应的文本集中出现了3次,且b与B1之间的关联度为0.8;b在B2对应的文本集中出现了4次,且b与B2之间的关联度为0.7;c在A1对应的文本集中出现了8次,且c与A1之间的关联度为1.4;c在A2对应的文本集中出现了10次,且c与A2之间的关联度为1.2;c在C对应的文本集中出现了3次,且c与C之间的关联度为0.9,则:首先,可以确定a属于A1的加权值为6,a属于A2的加权值为3.9,b属于A1的加权值为8.4,b属于B1的加权值为2.4,b属于B2的加权值为2.8,c属于A1的加权值为11.2,c属于A2的加权值为12,c属于C的加权值2.7;然后,a、b和c都属于A1的加权值进行求和得到A1的关联评价参数为25.6;由于b的待确定控件不包括A2,此时,可以认为b属于A2的加权值为0,因此,a、b和c都属于A2的加权值进行求和得到A2的关联评价参数为15.9;同理,a、b和c都属于B1的加权值进行求和得到B1的关联评价参数为2.4,;a、b和c都属于B2的加权值进行求和得到B1的关联评价参数为2.8,a、b和c都属于C的加权值进行求和得到C的关联评价参数为2.7,此时,由于A1的关联评价参数最大,因此,可以确定a、b和c对应的目标控件为A1,上述示例只是举例说明,本公开对此不作限定。
另外,在通过上述方式确定该目标控件后,可以将该目标控件智能地填充至该当前数据表中,此时,可以根据填充结果对该关联度进行更新,具体地:接收关联度更新指令;并在该关联度更新指令指示减小该关联度时,将该关联度减去预定值得到更新后的关联度;在该关联度更新指令指示增大所述关联度时,将该关联度加上该预定值得到更新后的关联度,这样,通过对该关联度进行调整,从而提高确定控件的准确度。
采用上述方法,可以在目标文本中提取到至少一个目标关键词,并确定每个该目标关键词对应的至少一个待确定控件,这样,可以根据每个该目标关键词与至少一个该待确定控件之间的关联度确定与全部目标关键词关联度最好的目标控件,从而提高了确定目标控件的准确性,并避免了现有技术中仅基于数据表中文本的文字语义而导致的确定目标控件不准确的问题。
图3为本公开示例性实施例示出的一种确定控件的装置,如图3所示,包括:
第一获取模块301,用于从当前数据表中获取目标文本;
第一提取模块302,用于从该目标文本中提取至少一个目标关键词;
第一确定模块303,用于确定每个该目标关键词对应的至少一个待确定控件;
第二获取模块304,用于获取每个该目标关键词与至少一个该待确定控件之间的关联度;
第二确定模块305,用于根据该关联度从至少一个该待确定控件中确定全部该目标关键词对应的目标控件。
图4为本公开示例性实施例示出的一种确定控件的装置,如图4所示,还包括:
第三获取模块306,用于从多个文本样本中获取至少一个该待确定控件对应的文本集;该文本集包括至少一个该文本样本;
第四获取模块307,用于获取每个该目标关键词在至少一个该待确定控件对应的文本集中的词语权重;
该第二确定模块305,用于根据该词语权重和该关联度从至少一个该待确定控件中确定全部该目标关键词对应的目标控件。
图5为本公开示例性实施例示出的一种确定控件的装置,如图5所示,该第二确定模块305包括:
第一确定子模块3051,用于根据该词语权重和该关联度确定每个该目标关键词与至少一个该待确定控件的关联加权值;
计算子模块3052,用于将每个该目标关键词与同一该待确定控件的关联加权值进行求和得到同一该待确定控件的关联评价参数;
第二确定子模块3053,用于根据该关联评价参数从至少一个该待确定控件中确定该目标控件。
图6为本公开示例性实施例示出的一种确定控件的装置,如图6所示,还包括:
第五获取模块308,用于从多个数据表样本中,获取多个该文本样本以及多个该文本样本依次对应的控件样本;
第二提取模块309,用于从每个该文本样本中提取至少一个关键词样本;
建立模块310,用于根据至少一个该关键词样本与该控件样本建立关键词控件对应关系;该关键词控件对应关系包括每个该文本样本中的至少一个该关键词样本与每个该文本样本对应的控件样本之间的一一对应关系;
该第一确定模块303,用于根据该关键词控件对应关系确定每个该目标关键词对应的至少一个该待确定控件。
图7为本公开示例性实施例示出的一种确定控件的装置,如图7所示,在该当前数据表是由不同数据表格式的至少两个预设数据表构成时,还包括:
转换模块311,用于将不同数据表格式的至少两个该预设数据表转换为同一数据表格式;
合并模块312,用于将转换为同一数据表格式的至少两个该预设数据表进行合并得到该当前数据表。
图8为本公开示例性实施例示出的一种确定控件的装置,如图8所示,还包括:
接收模块313,用于接收关联度更新指令;
第六获取模块314,用于在该关联度更新指令指示减小该关联度时,将该关联度减去预定值得到更新后的关联度;
第七获取模块315,用于在该关联度更新指令指示增大该关联度时,将该关联度加上该预定值得到更新后的关联度。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
采用上述装置,可以在目标文本中提取到至少一个目标关键词,并确定每个该目标关键词对应的至少一个待确定控件,这样,可以根据每个该目标关键词与至少一个该待确定控件之间的关联度确定与全部目标关键词关联度最好的目标控件,从而提高了确定目标控件的准确性,并避免了现有技术中仅基于数据表中文本的文字语义而导致的确定目标控件不准确的问题。
图9是根据一示例性实施例示出的一个电子设备900的框图。如图9所示,该电子设备900可以包括:处理器901,存储器902。该电子设备900还可以包括多媒体组件903,输入/输出(I/O)接口904,以及通信组件905中的一者或多者。
其中,处理器901用于控制该电子设备900的整体操作,以完成上述的确定控件的方法中的全部或部分步骤。存储器902用于存储各个类型的数据以支持在该电子设备900的操作,这些数据例如可以包括用于在该电子设备900上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器902可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件903可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器902或通过通信组件905发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口904为处理器901和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件905用于该电子设备900与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G或4G,或它们中的一个或几个的组合,因此相应的该通信组件905可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,电子设备900可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的确定控件的方法。
在另一示例性实施例中,还提供了一个包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的确定控件的方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器902,上述程序指令可由电子设备900的处理器901执行以完成上述的确定控件的方法。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多个简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各个可能的组合方式不再另行说明。
此外,本公开的各个不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
Claims (10)
1.一种确定控件的方法,其特征在于,包括:
从当前数据表中获取目标文本;所述目标文本为将所述当前数据表划分为多个子表后,根据每个子表的子表类型获取到的所述当前数据表中的文本;
从所述目标文本中提取至少一个目标关键词;
确定每个所述目标关键词对应的至少一个待确定控件;
获取每个所述目标关键词与至少一个所述待确定控件之间的关联度,所述关联度表征所述目标关键词与所述待确定控件之间的关联性;
根据所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件,所述目标控件用于填充至所述当前数据表。
2.根据权利要求1所述的方法,其特征在于,在所述根据所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件前,还包括:
从多个文本样本中获取至少一个所述待确定控件对应的文本集;所述文本集包括至少一个所述文本样本;
获取每个所述目标关键词在至少一个所述待确定控件对应的文本集中的词语权重;
所述根据所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的所述目标控件包括:
根据所述词语权重和所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件。
3.根据权利要求2所述的方法,其特征在于,所述根据所述词语权重和所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件包括:
根据所述词语权重和所述关联度确定每个所述目标关键词与至少一个所述待确定控件的关联加权值;
将每个所述目标关键词与同一所述待确定控件的关联加权值进行求和得到同一所述待确定控件的关联评价参数;
根据所述关联评价参数从至少一个所述待确定控件中确定所述目标控件。
4.根据权利要求2所述的方法,其特征在于,在所述确定每个所述目标关键词对应的至少一个待确定控件前,还包括:
从多个数据表样本中,获取多个所述文本样本以及多个所述文本样本依次对应的控件样本;
从每个所述文本样本中提取至少一个关键词样本;
根据至少一个所述关键词样本与所述控件样本建立关键词控件对应关系;所述关键词控件对应关系包括每个所述文本样本中的至少一个所述关键词样本与每个所述文本样本对应的控件样本之间的一一对应关系;
所述确定每个所述目标关键词对应的至少一个待确定控件包括:
根据所述关键词控件对应关系确定每个所述目标关键词对应的至少一个所述待确定控件。
5.根据权利要求1至4任一项所述的方法,其特征在于,在所述当前数据表是由不同数据表格式的至少两个预设数据表构成时,在所述从当前数据表中获取目标文本前,还包括:
将不同数据表格式的至少两个所述预设数据表转换为同一数据表格式;
将转换为同一数据表格式的至少两个所述预设数据表进行合并得到所述当前数据表。
6.根据权利要求1至4任一项所述的方法,其特征在于,在所述根据所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件后,还包括:
接收关联度更新指令;
在所述关联度更新指令指示减小所述关联度时,将所述关联度减去预定值得到更新后的关联度;
在所述关联度更新指令指示增大所述关联度时,将所述关联度加上所述预定值得到更新后的关联度。
7.一种确定控件的装置,其特征在于,包括:
第一获取模块,用于从当前数据表中获取目标文本;所述目标文本为将所述当前数据表划分为多个子表后,根据每个子表的子表类型获取到的所述当前数据表中的文本;
第一提取模块,用于从所述目标文本中提取至少一个目标关键词;
第一确定模块,用于确定每个所述目标关键词对应的至少一个待确定控件;
第二获取模块,用于获取每个所述目标关键词与至少一个所述待确定控件之间的关联度,所述关联度表征所述目标关键词与所述待确定控件之间的关联性;
第二确定模块,用于根据所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件,所述目标控件用于填充至所述当前数据表。
8.根据权利要求7所述的装置,其特征在于,还包括:
第三获取模块,用于从多个文本样本中获取至少一个所述待确定控件对应的文本集;所述文本集包括至少一个所述文本样本;
第四获取模块,用于获取每个所述目标关键词在至少一个所述待确定控件对应的文本集中的词语权重;
所述第二确定模块,用于根据所述词语权重和所述关联度从至少一个所述待确定控件中确定全部所述目标关键词对应的目标控件。
9.一个计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-6中任一项所述方法的步骤。
10.一个电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-6中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810786493.4A CN109190096B (zh) | 2018-07-17 | 2018-07-17 | 确定控件的方法、装置和存储介质以及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810786493.4A CN109190096B (zh) | 2018-07-17 | 2018-07-17 | 确定控件的方法、装置和存储介质以及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109190096A CN109190096A (zh) | 2019-01-11 |
CN109190096B true CN109190096B (zh) | 2023-05-09 |
Family
ID=64936826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810786493.4A Active CN109190096B (zh) | 2018-07-17 | 2018-07-17 | 确定控件的方法、装置和存储介质以及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109190096B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111580709B (zh) * | 2020-04-03 | 2021-05-28 | 微民保险代理有限公司 | 一种操作信息单的显示方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104102704A (zh) * | 2014-07-08 | 2014-10-15 | 深圳市深信服电子科技有限公司 | 系统控件展示方法和装置 |
CN105577923A (zh) * | 2015-12-18 | 2016-05-11 | 深圳市金立通信设备有限公司 | 一种信息处理方法及终端 |
-
2018
- 2018-07-17 CN CN201810786493.4A patent/CN109190096B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104102704A (zh) * | 2014-07-08 | 2014-10-15 | 深圳市深信服电子科技有限公司 | 系统控件展示方法和装置 |
CN105577923A (zh) * | 2015-12-18 | 2016-05-11 | 深圳市金立通信设备有限公司 | 一种信息处理方法及终端 |
Also Published As
Publication number | Publication date |
---|---|
CN109190096A (zh) | 2019-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110275965B (zh) | 假新闻检测方法、电子装置及计算机可读存储介质 | |
CN108958959B (zh) | 检测hive数据表的方法和装置 | |
CN108536745B (zh) | 基于Shell的数据表提取方法、终端、设备及存储介质 | |
CN109815261A (zh) | 全局搜索功能实现及数据实时同步方法、装置及电子设备 | |
CN103678704A (zh) | 一种基于图片信息的识图方法、系统、设备及装置 | |
CN111708753A (zh) | 数据库迁移的评估方法、装置、设备及计算机存储介质 | |
CN112818937B (zh) | Excel文件的识别方法、装置、电子设备及可读存储介质 | |
JP6464604B2 (ja) | 検索支援プログラム、検索支援方法および検索支援装置 | |
CN110209781B (zh) | 一种文本处理方法、装置以及相关设备 | |
KR101694727B1 (ko) | 인공 지능 기반 연관도 계산을 이용한 노트 제공 방법 및 장치 | |
CN109190096B (zh) | 确定控件的方法、装置和存储介质以及电子设备 | |
CN108052686A (zh) | 一种摘要提取方法及相关设备 | |
CN108664505B (zh) | 一种数据库表结构的导出方法及装置 | |
US11216894B2 (en) | Image-based semantic accommodation search | |
CN110866681B (zh) | 一种风险信息推送策略的配置方法及装置 | |
CN111666278A (zh) | 数据存储、检索方法、电子设备及存储介质 | |
CN112948264B (zh) | 测试任务的执行方法及装置、系统、存储介质、电子装置 | |
EP2833276A1 (en) | Data search system and data search method | |
CN110780898B (zh) | 页面数据的升级方法、装置和电子设备 | |
CN111459411B (zh) | 数据迁移方法、装置、设备及存储介质 | |
CN114818635A (zh) | 数据报表生成方法、装置、电子设备及存储介质 | |
US11206182B2 (en) | Automatically reconfiguring an input interface | |
US8601078B2 (en) | Communication terminal and method for creating e-mail | |
CN112417822A (zh) | 一种更换电子表格单元格中图片的方法、装置及电子设备 | |
JP7344521B1 (ja) | プログラム、方法、情報処理装置、及びシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |