发明内容
本发明实施例提供了一种在Word文件中读取信息的方法和装置,能够提高信息读取的效率。
第一方面,本发明实施例提供了一种在Word文件中读取信息的方法,预先创建信息缓存模板,并建立所述信息缓存模板与信息格式的对应关系,还包括:
确定待读取Word文件;
根据所述信息缓存模板,获取所述待读取Word文件中的至少一条待读取信息;
按照所述信息缓存模板对应的所述信息格式,将所述至少一条待读取信息写入所述信息缓存模板;
确定待填写表单;
根据所述待填写表单,将所述信息缓存模板中的至少一条待读取信息写入所述待填写表单。
优选地,所述信息缓存模板中包括:控件标识字段、标题字段和内容字段;
所述待读取Word文件,包括:至少一个内容控件;
所述根据所述信息缓存模板,获取所述待读取Word文件中的至少一条待读取信息,包括:
针对所述待读取Word文件中的每一个所述内容控件,在所述当前内容控件中,分别获取所述控件标识字段对应的待读取标识信息、所述标题字段对应的待读取标题信息和所述内容字段对应的待读取内容信息。
优选地,所述待填写表单,包括:至少一个表单控件,其中每一个所述表单控件包括:标题信息和待写入内容字段;
所述根据所述待填写表单,将所述信息缓存模板中的至少一条待读取信息写入所述待填写表单,包括:
根据确定的所述待读取Word文件,在所述信息缓存模板中,确定至少一个所述待读取标识信息;
针对于每一个所述表单控件,在所述至少一个待读取标识信息对应的至少一个待读取标题信息中,确定是否存在与当前表单控件的标题信息相同的待读取标题信息;
当存在与所述当前表单控件的标题信息相同的待读取标题信息时,确定该待读取标题信息对应的待读取内容信息为目标内容信息;
将所述目标内容信息写入所述当前表单控件的待写入内容字段下。
优选地,所述目标内容信息,包括:至少一个信息元素;
进一步包括:预先设定至少一个写入方法,每一个所述写入方法对应一个写入格式;
所述将所述目标内容信息写入所述当前表单控件的待写入内容字段下,包括:
获取各个所述信息元素的写入格式;
根据所述至少一个写入格式,确定写入各个所述信息元素的所述写入方法;
按照所述至少一个写入方法,分别将各个所述信息元素写入所述当前表单控件的待写入内容字段下。
第二方面,本发明实施例提供了一种在Word文件中读取信息的装置,包括:创建模块、获取模块、模板写入模块和表单写入模块;
所述创建模块,用于创建信息缓存模板,所述信息缓存模板对应一种信息格式;
所述获取模块,用于确定待读取Word文件;根据所述创建模块创建的所述信息缓存模板,获取所述第一确定模块确定的所述待读取Word文件中的至少一条待读取信息;
所述模板写入模块,用于按照所述信息格式,将所述获取模块获取的所述至少一条待读取信息写入所述信息缓存模板;
所述表单写入模块,用于确定待填写表单;根据所述待填写表单,将所述信息缓存模板中的至少一条待读取信息写入所述待填写表单。
优选地,所述信息缓存模板,设置有控件标识字段、标题字段和内容字段;
所述待读取Word文件,包括:至少一个内容控件;
所述获取模块,用于针对每一个所述内容控件,在所述当前内容控件中,分别获取所述控件标识字段对应的待读取标识信息、所述标题字段对应的待读取标题信息和所述内容字段对应的待读取内容信息。
优选地,所述控件标识字段、所述标题字段和所述内容字段两两之间存在对应关系;
所述模板写入模块,用于将所述当前内容控件的所述待读取标识信息、所述待读取标题信息和所述待读取内容信息,分别写入所述控件标识字段、所述标题字段和所述内容字段下,使得所述当前内容控件的所述待读取标识信息、所述待读取标题信息和所述待读取内容信息两两之间存在对应关系。
优选地,所述待填写表单,包括:至少一个表单控件,其中每一个所述表单控件包括:标题信息和待写入内容字段;
所述表单写入模块,包括:标识确定单元、标题确定单元和写入单元;
所述标识确定单元,用于根据确定的所述待读取Word文件,在所述信息缓存模板中,确定至少一个所述待读取标识信息;
所述标题确定单元,用于针对于每一个所述表单控件,在所述至少一个待读取标识信息对应的至少一个待读取标题信息中,确定是否存在与当前表单控件的标题信息相同的待读取标题信息;
所述写入单元,用于当所述标题确定单元确定存在与所述当前表单控件的标题信息相同的待读取标题信息时,确定该待读取标题信息对应的待读取内容信息为目标内容信息;将所述目标内容信息写入所述当前表单控件的待写入内容字段下。
优选地,所述目标内容信息,包括:至少一个信息元素;
进一步包括:设定模块;
所述设定模块,用于预先设定至少一个写入方法,每一个所述写入方法对应一个写入格式;
所述写入单元,用于获取各个所述信息元素的写入格式;根据所述至少一个写入格式,确定写入各个所述信息元素的所述写入方法;按照所述至少一个写入方法,分别将各个所述信息元素写入所述当前表单控件的待写入内容字段下。
本发明实施例提供了一种在Word文件中读取信息的方法和装置,预先创建信息缓存模板,并建立信息缓存模板与信息格式的对应关系;根据信息缓存模板,从确定的待读取Word文件中获取的至少一条待读取信息,通过信息缓存模板确定待读取Word文件中的待读取信息的种类,从而避免对整个Word文件中的信息进行获取,以提高信息读取效率;按照信息缓存模板对应的信息格式,将至少一条待读取信息写入信息缓存模板,使得待读取信息具有缓存模板对应的信息格式,以便写入待填写表单;在确定待填写表单之后,将信息缓存模板中的至少一条待读取信息写入待填写表单。由此可见,本发明实施例创建的信息缓存模板能够代替人工将待读取Word文件中将待读取信息写入待填写表单,从而提高了信息读取的效率。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种在Word文件中读取信息的方法,包括以下步骤:
步骤101,预先创建信息缓存模板,并建立所述信息缓存模板与信息格式的对应关系。
步骤102,确定待读取Word文件。
步骤103,根据所述信息缓存模板,获取所述待读取Word文件中的至少一条待读取信息。
步骤104,按照所述信息缓存模板对应的所述信息格式,将所述至少一条待读取信息写入所述信息缓存模板。
步骤105,确定待填写表单。
步骤106,根据所述待填写表单,将所述信息缓存模板中的至少一条待读取信息写入所述待填写表单。
本发明实施例提供了一种在Word文件中读取信息的方法,预先创建信息缓存模板,并建立信息缓存模板与信息格式的对应关系;根据信息缓存模板,从确定的待读取Word文件中获取的至少一条待读取信息,通过信息缓存模板确定待读取Word文件中的待读取信息的种类,从而避免对整个Word文件中的信息进行获取,以提高信息读取效率;按照信息缓存模板对应的信息格式,将至少一条待读取信息写入信息缓存模板,使得待读取信息具有缓存模板对应的信息格式,以便写入待填写表单;在确定待填写表单之后,将信息缓存模板中的至少一条待读取信息写入待填写表单。由此可见,本发明实施例创建的信息缓存模板能够代替人工将待读取Word文件中将待读取信息写入待填写表单,从而提高了信息读取的效率。
为了方便从Word文件提取信息,在Word文件中设定内容控件,并通过设定的内容控件读取待读取信息,在本发明的一个实施例中,所述信息缓存模板中包括:控件标识字段、标题字段和内容字段;
所述待读取Word文件,包括:至少一个内容控件;
所述根据所述信息缓存模板,获取所述待读取Word文件中的至少一条待读取信息,包括:
针对所述待读取Word文件中的每一个所述内容控件,在所述当前内容控件中,分别获取所述控件标识字段对应的待读取标识信息、所述标题字段对应的待读取标题信息和所述内容字段对应的待读取内容信息。
通过在信息缓存模板中设置控件标识字段、标题字段和内容字段,以获取内容控件的待读取标识信息、待读取标题信息和待读取内容信息。其中,控件标识字段对应内容控件的ID(identification,身份),即待读取标识信息,通过控件标识字段可以在Word文件中唯一确定一个内容控件。标题字段对应内容空间的标题,即待读取标题信息,通常内容控件的标题是对内容控件中的信息进行概括或标识,因此通过标题字段能够锁定待读取内容信息。内容字段对应内容控件中的具体信息,即待读取内容信息,通过内容字段能够获取最终写入带填写表格中的待读取信息。
为了避免在信息缓存模板中的待读取信息写入待填写表单的过程中出现错误,在本发明的一个实施例中,所述控件标识字段、所述标题字段和所述内容字段两两之间存在对应关系;
所述按照所述信息缓存模板对应的所述信息格式,将所述至少一条待读取信息写入所述信息缓存模板,包括:
将所述当前内容控件的所述待读取标识信息、所述待读取标题信息和所述待读取内容信息,分别写入所述控件标识字段、所述标题字段和所述内容字段下,使得所述当前内容控件的所述待读取标识信息、所述待读取标题信息和所述待读取内容信息两两之间存在对应关系。
信息缓存模板对应的信息格式为控件标识字段、标题字段和内容字段,这使得模板中的待写入信息按照一定的顺序在信息缓存模板中存储,以防止出现待读取信息被误读,例如,信息缓存模板为包括3个数据列的表格,3个数据列分别代表控件标识字段、标题字段和内容字段,该表格每一个数据行存储一个内容控件中的待读取信息,以保证各个内容控件间的待读取信息不会混放在一起,从而避免待读取信息被误读。
为了保证待读取信息能够被准确地写入到待填写表单中相应的位置,在本发明的一个实施例中,所述待填写表单,包括:至少一个表单控件,其中每一个所述表单控件包括:标题信息和待写入内容字段;
所述根据所述待填写表单,将所述信息缓存模板中的至少一条待读取信息写入所述待填写表单,包括:
根据确定的所述待读取Word文件,在所述信息缓存模板中,确定至少一个所述待读取标识信息;
针对于每一个所述表单控件,在所述至少一个待读取标识信息对应的至少一个待读取标题信息中,确定是否存在与当前表单控件的标题信息相同的待读取标题信息;
当存在与所述当前表单控件的标题信息相同的待读取标题信息时,确定该待读取标题信息对应的待读取内容信息为目标内容信息;
将所述目标内容信息写入所述当前表单控件的待写入内容字段下。
用户会给待填写表单匹配待读取Word文件,根据待读取Word文件中内容控件的ID,从信息缓存模板中确定至少一个待读取标识信息。在各个待读取标识信息对应的各个待读取标题信息中,确定与当前表单控件的标题信息相同的待读取信息,再将该待读取信息对应的待读取内容信息写入当前表单控件的待写入内容字段下,从而完成写入过程。
上述方法利用待读取标识信息锁定待读取Word文件中内容控件,通过匹配标题信息和待读取标题信息,确定待读取信息将写入的表单控件,实现精确将待读取信息精确地写入待填写表单中,提高了读取信息的效率。
待读取Word文件中存在多种写入格式的信息元素,不同写入格式的信息元素需要不同的写入方法,在本发明的一个实施例中,所述目标内容信息,包括:至少一个信息元素;
进一步包括:预先设定至少一个写入方法,每一个所述写入方法对应一个写入格式;
所述将所述目标内容信息写入所述待写入内容字段下,包括:
获取各个所述信息元素的写入格式;
根据所述至少一个写入格式,确定写入各个所述信息元素的所述写入方法;
按照所述至少一个写入方法,分别将各个所述信息元素写入所述当前表单控件的待写入内容字段下。
在将目标内容信息写入当前表单控件前,先确定目标内容信息中各个信息元素的写入格式,根据预先存储的写入方法与写入格式的对应关系,确定各个信息元素的写入方法,并以确定出的写入方法将各个信息元素写入当前表单控件。例如,信息元素的写入格式为选择输入框和下拉文本框,那么写入时,在预设的方法中分别确定选择输入框和下拉文本框的写入方法,再根据写入方法将选择输入框和下拉文本框对应的信息元素写入当前表单控件。
为了更好地说明本发明上述实施例中的方法,如图2所示,本发明实施例提供了另一种在Word文件中读取信息的方法,包括以下步骤:
步骤201,确定待读取Word文件。
在本发明实施例中,根据用户输入的待读取Word文件的路径确定待读取Word文件。
步骤202,根据预设的信息缓存模板包括的控件标识字段、标题字段和内容字段,分别获取待读取Word文件中的每一个内容控件的待读取标识信息、待读取标题信息和待读取内容信息。
在本发明实施例中,内容控件的待读取标识信息为内容控件的ID,待读取标题信息为内容控件的标题,待读取内容信息为内容控件中的具体信息。
步骤203,将每一个内容控件的待读取标识信息、待读取标题信息和待读取内容信息,分别写入控件标识字段、标题字段和内容字段下。
在本发明实施例中,将获取到的待读取标识信息、待读取标题信息和待读取内容信息写入信息缓存模板,使得获取到的待读取标识信息、待读取标题信息和待读取内容信息两两之间存在对应关系,以保证不会误读待读取信息。此外,信息缓存模板可以存储多个Word文件中的待读取信息,当再次调用这些待读取信息时,不用逐个查找Word文件,而是直接在信息缓存模板中查找,从而提高信息读取效率。
步骤204,确定待填写表单。
在本发明实施例中,根据用户输入的待读取待填写表单的路径确定待填写表单。
步骤205,根据确定的待读取Word文件,在信息缓存模板中,确定至少一个待读取标识信息。
在本发明实施例中,由于信息缓存模板能够存储多个待读取Word文件的待读取信息信息,因此要先根据确定的待读取Word文件,查找该待读取Word文件中各个内容控件的ID。
步骤206,针对于待填写表单中的每一个表单控件,在至少一个待读取标识信息对应的至少一个待读取标题信息中,确定是否存在与当前表单控件的标题信息相同的待读取标题信息。
在本发明实施例中,由于待读取标识信息、待读取标题信息和待读取内容信息两两之间存在对应关系,那么在确定内容控件的ID后,就能确定内容控件的标题。此时,可以在确定的内容控件的标题中查找是否存在当前表单控件的标题信息。
步骤207,当存在与当前表单控件的标题信息相同的待读取标题信息时,确定与当前表单控件的标题信息相同的待读取标题信息对应的待读取内容信息为目标内容信息。
在本发明实施例中,根据待读取标识信息、待读取标题信息和待读取内容信息两两之间存在的对应关系,当内容控件的标题与待填写表单中的标题相同时,那么该内容控件的标题下的具体内容写入该待填写表单中的标题下的目标内容信息。
步骤208,确定目标内容信息包括的各个信息元素的写入格式。
在本发明实施例中,写入格式包括:文本输入框、选择输入框、下拉文本框、日历、数值计算器、多行文本输入框、时间控件、智能帮助中的至少一种。
步骤209,确定各个信息元素的写入格式对应预设写入方法。
在本发明实施例中,针对上述的每一个写入格式都预设一个写入方法。
步骤210,按照确定的写入方法,分别将各个信息元素写入当前表单控件的待写入内容字段下。
通常在待填写表单中设置有至少一个数据校验方法,即预先在表单中的设置写入条件,只有待写入信息满足预设的写入条件,才能将信息写入表单中。同时,每一个数据校验方法会关联一个写入事件,当触发写入事件时,待填写表单就会执行相应的数据校验方法。在本发明实施例中,根据写入格式,触发待填写表单中相应的写入事件,使待填写表单执行相应的数据校验方法保证输入内容的合法性。
如图3所示,本发明实施例提供了一种在Word文件中读取信息的装置,包括:创建模块301、获取模块302、模板写入模块303和表单写入模块304;
创建模块301,用于创建信息缓存模板,所述信息缓存模板对应一种信息格式;
获取模块302,用于确定待读取Word文件;根据创建模块301创建的所述信息缓存模板,获取所述第一确定模块确定的所述待读取Word文件中的至少一条待读取信息;
模板写入模块303,用于按照所述信息格式,将获取模块302获取的所述至少一条待读取信息写入所述信息缓存模板;
表单写入模块304,用于确定待填写表单;根据所述待填写表单,将所述信息缓存模板中的至少一条待读取信息写入所述待填写表单。
在本发明的一个实施例中,所述信息缓存模板,设置有控件标识字段、标题字段和内容字段;
所述待读取Word文件,包括:至少一个内容控件;
获取模块302,用于针对每一个所述内容控件,在所述当前内容控件中,分别获取所述控件标识字段对应的待读取标识信息、所述标题字段对应的待读取标题信息和所述内容字段对应的待读取内容信息。
在本发明的一个实施例中,模板写入模块303,用于将所述当前内容控件的所述待读取标识信息、所述待读取标题信息和所述待读取内容信息,分别写入所述控件标识字段、所述标题字段和所述内容字段下,使得所述当前内容控件的所述待读取标识信息、所述待读取标题信息和所述待读取内容信息两两之间存在对应关系。
如图4所示,本发明实施例提供了另一种在Word文件中读取信息的装置,所述待填写表单,包括:至少一个表单控件,其中每一个所述表单控件包括:标题信息和待写入内容字段;
表单写入模块304,包括:标识确定单元3041、标题确定单元3042和写入单元3043;
标识确定单元3041,用于根据确定的所述待读取Word文件,在所述信息缓存模板中,确定至少一个所述待读取标识信息;
标题确定单元3042,用于针对于每一个所述表单控件,在所述至少一个待读取标识信息对应的至少一个待读取标题信息中,确定是否存在与当前表单控件的标题信息相同的待读取标题信息;
写入单元3043,用于当标题确定单元3042确定存在与所述当前表单控件的标题信息相同的待读取标题信息时,确定该待读取标题信息对应的待读取内容信息为目标内容信息;将所述目标内容信息写入所述当前表单控件的待写入内容字段下。
如图5所示,本发明实施例提供了又一种在Word文件中读取信息的装置,
所述目标内容信息,包括至少一个信息元素;
进一步包括:设定模块501;
设定模块501,用于预先设定至少一个写入方法,每一个所述写入方法对应一个写入格式;
所述写入单元,用于获取各个所述信息元素的写入格式;根据所述至少一个写入格式,确定写入各个所述信息元素的所述写入方法;按照所述至少一个写入方法,分别将各个所述信息元素写入所述待写入内容字段下。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明实施例提供了一种可读介质,包括执行指令,当存储控制器的处理器执行所述执行指令时,所述存储控制器执行上述实施例中任一项所述的在Word文件中读取信息的方法。
本发明实施例提供了一种存储控制器,包括:处理器、存储器和总线;
所述处理器和所述存储器通过所述总线连接;
所述存储器,当所述存储控制器运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述存储控制器执行上述实施例中任一项所述的在Word文件中读取信息的方法。
综上所述,本发明各个实施例至少具有如下有益效果:
1、本发明一实施例中,预先创建信息缓存模板,并建立信息缓存模板与信息格式的对应关系;根据信息缓存模板,从确定的待读取Word文件中获取的至少一条待读取信息,通过信息缓存模板确定待读取Word文件中的待读取信息的种类,从而避免对整个Word文件中的信息进行获取,以提高信息读取效率;按照信息缓存模板对应的信息格式,将至少一条待读取信息写入信息缓存模板,使得待读取信息具有缓存模板对应的信息格式,以便写入待填写表单;在确定待填写表单之后,将信息缓存模板中的至少一条待读取信息写入待填写表单。由此可见,本发明实施例创建的信息缓存模板能够代替人工将待读取Word文件中将待读取信息写入待填写表单,从而提高了信息读取的效率。
2、本发明一实施例中,通过控件标识字段、标题字段和内容字段,分别获取待读取Word文件中的每一个内容控件的待读取标识信息、待读取标题信息和待读取内容信息,实现对待读取信息的自动获取,进一步提高了信息读取的效率。
3、本发明一实施例中,将待读取标识信息、待读取标题信息和待读取内容信息写入信息缓存模板后,待读取标识信息、待读取标题信息和待读取内容信息两两存在对应关系,保证各个内容控件的待读取信息不会混放在一起,从而避免在将待读取内容信息写入待填写表单时出现错误,从而进一步提高了信息读取的效率。
4、本发明一实施例中,通过预先设定写入方法,并设置每一个写入方法对应的写入格式,能够将目标内容信息中各种写入格式的信息元素成功写入待填写表单,避免出现写入格式错误,从而进一步提高了信息读取的效率。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。