参数调整方法和装置
技术领域
本发明涉及文档识别技术领域,尤其涉及一种参数调整方法和装置。
背景技术
以数字文档资源和网络知识库为基础的识别和检索系统,需要对文档内部章节、段落等文本对象和图表、公式等特殊对象进行检测识别,因此,对这些对象检测识别的好坏直接影响到整个系统。
现有技术中,只能针对特定排版格式的文档进行检测识别。但是,当文档排版格式发生较大变化时,检测效果非常不理想。因此,如何调整各个文档识别模板参数,以适应不同排版格式的文档以此提高识别效果成为如今亟需解决的问题。
发明内容
本发明提供一种参数调整方法和装置,能够调整各个文档识别模板参数,以适应不同排版格式的文档,以提高识别效果。
第一方面,本发明提供一种参数调整方法,包括:
获取各个交互操作模板参数;
根据预设的文档识别模板参数和交互操作模板参数之间的第一映射关系,确定与每一个交互操作模板参数对应的文档识别模板参数,其中,所述第一映射关系中每一个所述文档识别模板参数对应至少一个交互操作模板参数;
根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果。
进一步地,在所述获取各个交互操作模板参数之前,还包括:
获取文档;
根据预设的各个文档识别模板参数对所述文档进行识别处理,得到并显示第二识别结果;
根据预设的交互操作模板参数和文档识别模板参数之间的第二映射关系,确定并显示与预设的每一个文档识别参数对应的交互操作模板参数,其中,所述第二映射关系中每一个所述交互操作模板参数对应至少一个文档识别模板参数。
进一步地,所述获取各个交互操作模板参数,包括:
显示预设的各个交互操作模板参数;
接收用户的修改指令,并根据所述修改指令,修改预设的各个交互操作模板参数,得到修改后的各个交互操作模板参数。
进一步地,在所述根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到识别结果之后,还包括:
显示所述第一识别结果;
接收用户发送的确认指令,其中,所述确认指令用于指示所述第一识别结果满足预设的识别条件;
根据所述确认指令,保存每一个所述交互操作模板参数。
进一步地,在所述根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果之后,还包括:
若所述第一识别结果满足预设的识别条件,则保存每一个所述交互操作模板参数。
进一步地,根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,包括:
根据与每一个交互操作模板参数对应的文档识别模板参数,提取所述文档中的对象,其中,所述对象包括段落对象、章节对象、图表对象、公式对象中的至少一种。
进一步地,所述交互操作模板参数、所述文档识别模板参数分别包括以下中的任一项:元素标识符、元素名称、元素类型、元素注释、元素类别。
第二方面,本发明提供了一种参数调整装置,包括:
第一获取单元,用于获取各个交互操作模板参数;
第一确定单元,用于根据预设的文档识别模板参数和交互操作模板参数之间的第一映射关系,确定与每一个交互操作模板参数对应的文档识别模板参数,其中,所述第一映射关系中每一个所述文档识别模板参数对应至少一个交互操作模板参数;
第一识别单元,用于根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果。
所述装置还包括:
第二获取单元,用于获取文档;
第二识别单元,用于根据预设的各个文档识别模板参数对所述文档进行识别处理,得到并显示第二识别结果;
第二确定单元,用于根据预设的交互操作模板参数和文档识别模板参数之间的第二映射关系,确定并显示与预设的每一个文档识别参数对应的交互操作模板参数,其中,所述第二映射关系中每一个所述交互操作模板参数对应至少一个文档识别模板参数。
进一步地,所述第一获取单元,包括:
显示模块,用于显示预设的各个交互操作模板参数;
接收模块,用于接收用户的修改指令;
修改模块,用于根据所述修改指令,修改预设的各个交互操作模板参数,得到修改后的各个交互操作模板参数。
进一步地,所述装置还包括:
显示单元,用于显示所述第一识别结果;
接收单元,用于接收用户发送的确认指令,其中,所述确认指令用于指示所述第一识别结果满足预设的识别条件;
第一存储单元,用于根据所述确认指令,保存每一个所述交互操作模板参数。
进一步地,所述装置还包括:
第二存储单元,用于在所述识别单元得到识别结果之后,若所述识别结果满足预设的识别条件,则保存每一个所述交互操作模板参数。
进一步地,所述第一识别单元,用于根据与每一个交互操作模板参数对应的文档识别模板参数,提取所述文档中的对象,其中,所述对象包括段落对象、章节对象、图表对象、公式对象中的至少一种。
进一步地,所述交互操作模板参数、所述文档识别模板参数分别包括以下中的任一项:元素标识符、元素名称、元素类型、元素注释、元素类别。
第三方面,本发明提供了一种参数调整设备,包括:存储器和处理器;
所述存储器,用于存储计算机程序;
其中,所述处理器执行所述存储器中的计算机程序,以实现第一方面中任一项所述的方法。
第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现第一方面中任一项所述的方法。
本发明提供了一种参数调整方法和装置,通过将文档识别模板参数映射成交互操作模板参数,这样,在获取到各个交互操作模板参数之后,便可根据文档识别模板参数和交互操作模板参数之间的第一映射关系,生成相对应的各个文档识别模板参数,从而通过交互操作模板参数的改变来调整文档识别模板参数,以通过不同的文档识别模板参数适应不同排版格式的文档,进而提高对不同排版格式的文档的识别效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本发明实施例一提供的一种参数调整方法的流程图;
图2为本发明实施例二提供的一种参数调整方法的流程图;
图3为本发明实施例三提供的一种参数调整装置的结构示意图;
图4为本发明实施例四提供的一种参数调整装置的结构示意图;
图5为本发明实施例五提供的一种参数调整设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一提供的一种参数调整方法的流程图,以该实施例提供的方法应用于参数调整装置来进行示例说明,如图1所示,该方法包括:
步骤101:获取各个交互操作模板参数。
实际应用中,本实施例的执行主体可以为参数调整装置,该参数调整装置可以为程序软件,也可以为存储有相关计算机程序的介质,例如,U盘等;或者,该参数调整装置还可以为集成或安装有相关计算机程序的实体设备,例如,芯片、智能终端、电脑、服务器等。
在本实施例中,由于各个文档识别模板参数不易理解,因此将适用于识别算法的文档识别模板参数映射成用户可以理解的交互操作模板参数,从而针对不同排版格式的文档,用户可通过修改各个交互操作模板参数来调整各个文档识别模板参数,以提高文档识别效果。获取各个交互操作模板参数的其中一种方式可为:向用户提供一个交互界面,该交互界面上展示有各个交互操作模板参数,用户可在该交互界面上对各个交互操作模板参数进行修改,从而根据用户的修改获取到各个交互操作模板参数,其中,具体是对交互操作模板参数的值进行修改。
步骤102:根据预设的文档识别模板参数和交互操作模板参数之间的第一映射关系,确定与每一个交互操作模板参数对应的文档识别模板参数,其中,所述第一映射关系中每一个所述文档识别模板参数对应至少一个交互操作模板参数。
在本实施例中,第一映射关系可以为现有的函数关系,且第一映射关系具体是根据交互操作模板参数生成文档识别模板参数的关系,且每一个文档识别模板参数可能需要至少一个交互操作模板参数共同生成。
举例来说,假设共有a、b、c、d、e这5个交互操作模板参数、共有R、Y、T、U、I、O这6个文档识别模板参数、预设的文档识别模板参数和交互操作模板参数之间的第一映射关系包括有R-(a、c、d)、Y-b、T-(d、e)、U-(b、d)、I-a、O-(a、c、d),其中,第一映射关系中可以包括有函数关系,如R-(a、c、d)代表的是,文档识别模板参数R为因变量,交互操作模板参数a、c、d为自变量的一种函数关系,R-(a、c、d)和O-(a、c、d)为自变量相同的两种函数关系。假设用户只对交互操作模板参数a、c、d中的a、c进行了修改,接下来则根据修改后的a、c、预设的d以及R-(a、c、d),生成新的R,另外,还会根据修改后的a和I-a,生成新的I,根据修改后的a、c、预设的d以及O-(a、c、d),生成新的O。
步骤103:根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果。
在本实施例中,当通过上述步骤202生成新的R、I和O之后,便可利用新生成的R、I、O和预设的Y、T、U对文档进行识别处理。上述只是以修改其中两个交互操作模板参数为例,若用户修改了所有交互操作模板参数,则所有的文档识别模板参数均会重新生成,从而利用新生成的6个文档识别模板参数对文档进行识别处理。
本发明实施例提供了一种参数调整方法,通过将文档识别模板参数映射成交互操作模板参数,这样,在获取到各个交互操作模板参数之后,便可根据文档识别模板参数和交互操作模板参数之间的第一映射关系,生成相对应的各个文档识别模板参数,从而通过交互操作模板参数的改变来调整文档识别模板参数,以通过不同的文档识别模板参数适应不同排版格式的文档,进而提高对不同排版格式的文档的识别效果。
图2为本发明实施例二提供的一种参数调整方法的流程图,如图2所示,该方法可以包括:
步骤201:获取文档。
步骤202:根据预设的各个文档识别模板参数对所述文档进行识别处理,得到并显示第二识别结果。
在本实施例中,每一次读取文档之后,首先都会获得默认的各个文档识别模板参数,并利用默认的各个文档识别模板参数对读取的文档进行识别检测处理,得到第二识别结果,将第二识别结果展示给用户。
步骤203:根据预设的交互操作模板参数和文档识别模板参数之间的第二映射关系,确定并显示与预设的每一个文档识别参数对应的交互操作模板参数,其中,第二映射关系中每一个交互操作模板参数对应至少一个文档识别模板参数。
在本实施例中,第二映射关系可以为现有的函数关系,且第二映射关系具体是根据文档识别模板参数生成交互操作模板参数的关系,且每一个交互操作模板参数可能需要至少一个文档识别模板参数共同生成。在根据默认的各个文档识别模板参数生成并展示相应的各个交互操作模板参数之后,若第二识别结果未满足要求,则用户可对当前所展示的各个交互操作模板参数进行修改。
在本实施例中,预先应对交互操作模板参数和文档识别模板参数的结构进行定义。以进行版心识别和段落识别为例,定义的交互操作模板参数的元素结构可如下表1所示,定义的文档识别模板参数的元素结构可如下表2所示。
表1交互操作模板参数的元素结构
由表1所示,共定义了9个交互操作模板参数。
表2文档识别模板参数的元素结构
由表2可知,共定义了10个文档识别模板参数。
步骤204:接收用户的修改指令。
步骤205:根据修改指令,修改所确定的各个交互操作模板参数,得到修改后的各个交互操作模板参数。
在本实施例中,可向用户提供一个交互界面,该交互界面上可显示上述9个交互操作模板参数,用户可在该交互界面上对9个交互操作模板参数中的任意一个或多个参数进行修改。
步骤206:根据预设的文档识别模板参数和交互操作模板参数之间的第一映射关系,确定与修改后的各个交互操作模板参数对应的文档识别模板参数,其中,第一映射关系中每一个文档识别模板参数对应至少一个交互操作模板参数。
在本实施例中,预先定义的文档识别模板参数和交互操作模板参数的映射关系可如下表3所示。
表3文档识别模板参数和交互操作模板参数的映射关系
由表3可知,文档识别模板参数DOCPARAM_8对应有交互操作模板参数OPERPARAM_1、OPERPARAM_3、OPERPARAM_9,文档识别模板参数DOCPARAM_10对应,OPERPARAM_2,其他对应关系不再赘述。例如,当用户修改了交互操作模板参数OPERPARAM_1,则会根据修改后的OPERPARAM_1和预设的OPERPARAM_3、OPERPARAM_9,生成新的DOCPARAM_8。
步骤207:根据与每一个交互操作模板参数对应的文档识别模板参数,提取文档中的对象,得到第一识别结果,其中,对象包括段落对象、章节对象、图表对象、公式对象中的至少一种。
在本实施例中,利用上述步骤得到的各个文档识别模板参数对获取到的文档进行识别处理,以将文档中的对象进行提取。
步骤208:显示第一识别结果。
步骤209:接收用户发送的确认指令,其中,确认指令用于指示第一识别结果满足预设的识别条件。
在本实施例中,在得到识别结果之后,可将识别结果显示给用户,以使得用户查看识别结果是否满足预设的识别条件,其中,预设的识别条件可以是用户自己主观认定的识别条件,例如,识别结果中包括图片,用户可观看图片是否清晰,如果用户认定清晰,则认为识别结果满足要求;预设的识别条件还可以是预先设置在终端上的识别条件,如识别结果中包括公式,用户可根据终端中预设好的正确公式与识别结果中的公式进行比对,如果比对一致,则确定识别结果满足需求。
值得说明的是,当识别结果未满足需求时,用户可再次对各个交互操作模板参数进行修改,以重新调整各个文档识别模板参数,直至得到的识别结果满足要求。
步骤210:根据确认指令,保存每一个交互操作模板参数。
在本实施例中,在接收到用户的确认指示后,对各个交互操作模板参数进行保存,这样,在读入与之相同的文档之后,可通过加载功能将之前保存的各个交互操作模板参数导入进来,这样用户就可以不用再去调整,从而实现参数的共享。
另外,为了提高工作效率,还可自动对识别结果进行识别,具体的,若识别结果满足预设的识别条件,则保存每一个交互操作模板参数。
本发明实施例通过向用户提供交互界面,用户通过交互界面修改交互操作模板参数,根据建立的映射关系实现对文档模板参数的自动生成;另外,通过保存处理,实现了对文档操作模板参数的共享,以在读取到相同排版格式的文档时,无需用户在交互界面上手动修改交互操作模板参数,可直接加载已保存的各个交互操作模板参数,提高了用户体验。
图3为本发明实施例三提供的一种参数调整装置的结构示意图,包括:
第一获取单元301,用于获取各个交互操作模板参数。
第一确定单元302,用于根据预设的文档识别模板参数和交互操作模板参数之间的第一映射关系,确定与每一个交互操作模板参数对应的文档识别模板参数,其中,所述第一映射关系中每一个所述文档识别模板参数对应至少一个交互操作模板参数。
第一识别单元303,用于根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果。
在本实施例中,本实施例的参数调整装置可执行本发明实施例一提供的参数调整方法,其实现原理相类似,此处不再赘述。
本发明实施例通过将文档识别模板参数映射成交互操作模板参数,这样,在获取到各个交互操作模板参数之后,便可根据文档识别模板参数和交互操作模板参数之间的第一映射关系,生成相对应的各个文档识别模板参数,从而通过交互操作模板参数的改变来调整文档识别模板参数,以通过不同的文档识别模板参数适应不同排版格式的文档,进而提高对不同排版格式的文档的识别效果。
图4为本发明实施例四提供的一种参数调整装置的的结构示意图,在实施例三的基础上,如图4所示,所述装置还包括:
第二获取单元401,用于获取文档;
第二识别单元402,用于根据预设的各个文档识别模板参数对所述文档进行识别处理,得到并显示第二识别结果;
第二确定单元403,用于根据预设的交互操作模板参数和文档识别模板参数之间的第二映射关系,确定并显示与预设的每一个文档识别参数对应的交互操作模板参数,其中,所述第二映射关系中每一个所述交互操作模板参数对应至少一个文档识别模板参数。所述第一获取单元301,包括:
显示模块3011,用于显示预设的各个交互操作模板参数。
接收模块3012,用于接收用户的修改指令。
修改模块3013,用于根据所述修改指令,修改预设的各个交互操作模板参数,得到修改后的各个交互操作模板参数。
进一步地,所述装置还包括:
显示单元404,用于显示所述第一识别结果。
接收单元405,用于接收用户发送的确认指令,其中,所述确认指令用于指示所述第一识别结果满足预设的识别条件。
第一存储单元406,用于根据所述确认指令,保存每一个所述交互操作模板参数。
进一步地,所述装置还包括:
第二存储单元407,用于在所述第一识别单元303得到识别结果之后,若所述第一识别结果满足预设的识别条件,则保存每一个所述交互操作模板参数。
进一步地,所述第一识别单元303,用于根据与每一个交互操作模板参数对应的文档识别模板参数,提取所述文档中的对象,其中,所述对象包括段落对象、章节对象、图表对象、公式对象中的至少一种。
进一步地,所述交互操作模板参数、所述文档识别模板参数分别包括以下中的任一项:元素标识符、元素名称、元素类型、元素注释、元素类别。
在本实施例中,本实施例的参数调整装置可执行本发明实施例二提供的参数调整方法,其实现原理相类似,此处不再赘述。
本发明实施例通过向用户提供交互界面,用户通过交互界面修改交互操作模板参数,根据建立的映射关系实现对文档模板参数的自动生成;另外,通过保存处理,实现了对文档操作模板参数的共享,以在读取到相同排版格式的文档时,无需用户在交互界面上手动修改交互操作模板参数,可直接加载已保存的各个交互操作模板参数,提高了用户体验。
图5为本发明实施例五提供的一种参数调整设备的结构示意图,包括:存储器501和处理器502。
所述存储器501,用于存储计算机程序。
其中,所述处理器502执行所述存储器501中的计算机程序,以实现任一实施例的提供的方法。
本发明实施例六提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现任一实施例的提供的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。