CN111382621A - 参数调整方法和装置 - Google Patents

参数调整方法和装置 Download PDF

Info

Publication number
CN111382621A
CN111382621A CN201811628271.6A CN201811628271A CN111382621A CN 111382621 A CN111382621 A CN 111382621A CN 201811628271 A CN201811628271 A CN 201811628271A CN 111382621 A CN111382621 A CN 111382621A
Authority
CN
China
Prior art keywords
interactive operation
template
parameters
parameter
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811628271.6A
Other languages
English (en)
Inventor
汪雄
颜钦钦
高良才
汤帜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Peking University
Original Assignee
Pku Founder Information Industry Group Co ltd
Peking University
Peking University Founder Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pku Founder Information Industry Group Co ltd, Peking University, Peking University Founder Group Co Ltd filed Critical Pku Founder Information Industry Group Co ltd
Priority to CN201811628271.6A priority Critical patent/CN111382621A/zh
Publication of CN111382621A publication Critical patent/CN111382621A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提供一种参数调整方法和装置,该方法包括:获取各个交互操作模板参数;根据预设的文档识别模板参数和交互操作模板参数之间的第一映射关系,确定与每一个交互操作模板参数对应的文档识别模板参数,其中,所述第一映射关系中每一个所述文档识别模板参数对应至少一个交互操作模板参数;根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果。本方案能够调整各个文档识别模板参数,以适应不同排版格式的文档,以提高识别效果。

Description

参数调整方法和装置
技术领域
本发明涉及文档识别技术领域,尤其涉及一种参数调整方法和装置。
背景技术
以数字文档资源和网络知识库为基础的识别和检索系统,需要对文档内部章节、段落等文本对象和图表、公式等特殊对象进行检测识别,因此,对这些对象检测识别的好坏直接影响到整个系统。
现有技术中,只能针对特定排版格式的文档进行检测识别。但是,当文档排版格式发生较大变化时,检测效果非常不理想。因此,如何调整各个文档识别模板参数,以适应不同排版格式的文档以此提高识别效果成为如今亟需解决的问题。
发明内容
本发明提供一种参数调整方法和装置,能够调整各个文档识别模板参数,以适应不同排版格式的文档,以提高识别效果。
第一方面,本发明提供一种参数调整方法,包括:
获取各个交互操作模板参数;
根据预设的文档识别模板参数和交互操作模板参数之间的第一映射关系,确定与每一个交互操作模板参数对应的文档识别模板参数,其中,所述第一映射关系中每一个所述文档识别模板参数对应至少一个交互操作模板参数;
根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果。
进一步地,在所述获取各个交互操作模板参数之前,还包括:
获取文档;
根据预设的各个文档识别模板参数对所述文档进行识别处理,得到并显示第二识别结果;
根据预设的交互操作模板参数和文档识别模板参数之间的第二映射关系,确定并显示与预设的每一个文档识别参数对应的交互操作模板参数,其中,所述第二映射关系中每一个所述交互操作模板参数对应至少一个文档识别模板参数。
进一步地,所述获取各个交互操作模板参数,包括:
显示预设的各个交互操作模板参数;
接收用户的修改指令,并根据所述修改指令,修改预设的各个交互操作模板参数,得到修改后的各个交互操作模板参数。
进一步地,在所述根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到识别结果之后,还包括:
显示所述第一识别结果;
接收用户发送的确认指令,其中,所述确认指令用于指示所述第一识别结果满足预设的识别条件;
根据所述确认指令,保存每一个所述交互操作模板参数。
进一步地,在所述根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果之后,还包括:
若所述第一识别结果满足预设的识别条件,则保存每一个所述交互操作模板参数。
进一步地,根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,包括:
根据与每一个交互操作模板参数对应的文档识别模板参数,提取所述文档中的对象,其中,所述对象包括段落对象、章节对象、图表对象、公式对象中的至少一种。
进一步地,所述交互操作模板参数、所述文档识别模板参数分别包括以下中的任一项:元素标识符、元素名称、元素类型、元素注释、元素类别。
第二方面,本发明提供了一种参数调整装置,包括:
第一获取单元,用于获取各个交互操作模板参数;
第一确定单元,用于根据预设的文档识别模板参数和交互操作模板参数之间的第一映射关系,确定与每一个交互操作模板参数对应的文档识别模板参数,其中,所述第一映射关系中每一个所述文档识别模板参数对应至少一个交互操作模板参数;
第一识别单元,用于根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果。
所述装置还包括:
第二获取单元,用于获取文档;
第二识别单元,用于根据预设的各个文档识别模板参数对所述文档进行识别处理,得到并显示第二识别结果;
第二确定单元,用于根据预设的交互操作模板参数和文档识别模板参数之间的第二映射关系,确定并显示与预设的每一个文档识别参数对应的交互操作模板参数,其中,所述第二映射关系中每一个所述交互操作模板参数对应至少一个文档识别模板参数。
进一步地,所述第一获取单元,包括:
显示模块,用于显示预设的各个交互操作模板参数;
接收模块,用于接收用户的修改指令;
修改模块,用于根据所述修改指令,修改预设的各个交互操作模板参数,得到修改后的各个交互操作模板参数。
进一步地,所述装置还包括:
显示单元,用于显示所述第一识别结果;
接收单元,用于接收用户发送的确认指令,其中,所述确认指令用于指示所述第一识别结果满足预设的识别条件;
第一存储单元,用于根据所述确认指令,保存每一个所述交互操作模板参数。
进一步地,所述装置还包括:
第二存储单元,用于在所述识别单元得到识别结果之后,若所述识别结果满足预设的识别条件,则保存每一个所述交互操作模板参数。
进一步地,所述第一识别单元,用于根据与每一个交互操作模板参数对应的文档识别模板参数,提取所述文档中的对象,其中,所述对象包括段落对象、章节对象、图表对象、公式对象中的至少一种。
进一步地,所述交互操作模板参数、所述文档识别模板参数分别包括以下中的任一项:元素标识符、元素名称、元素类型、元素注释、元素类别。
第三方面,本发明提供了一种参数调整设备,包括:存储器和处理器;
所述存储器,用于存储计算机程序;
其中,所述处理器执行所述存储器中的计算机程序,以实现第一方面中任一项所述的方法。
第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现第一方面中任一项所述的方法。
本发明提供了一种参数调整方法和装置,通过将文档识别模板参数映射成交互操作模板参数,这样,在获取到各个交互操作模板参数之后,便可根据文档识别模板参数和交互操作模板参数之间的第一映射关系,生成相对应的各个文档识别模板参数,从而通过交互操作模板参数的改变来调整文档识别模板参数,以通过不同的文档识别模板参数适应不同排版格式的文档,进而提高对不同排版格式的文档的识别效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本发明实施例一提供的一种参数调整方法的流程图;
图2为本发明实施例二提供的一种参数调整方法的流程图;
图3为本发明实施例三提供的一种参数调整装置的结构示意图;
图4为本发明实施例四提供的一种参数调整装置的结构示意图;
图5为本发明实施例五提供的一种参数调整设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一提供的一种参数调整方法的流程图,以该实施例提供的方法应用于参数调整装置来进行示例说明,如图1所示,该方法包括:
步骤101:获取各个交互操作模板参数。
实际应用中,本实施例的执行主体可以为参数调整装置,该参数调整装置可以为程序软件,也可以为存储有相关计算机程序的介质,例如,U盘等;或者,该参数调整装置还可以为集成或安装有相关计算机程序的实体设备,例如,芯片、智能终端、电脑、服务器等。
在本实施例中,由于各个文档识别模板参数不易理解,因此将适用于识别算法的文档识别模板参数映射成用户可以理解的交互操作模板参数,从而针对不同排版格式的文档,用户可通过修改各个交互操作模板参数来调整各个文档识别模板参数,以提高文档识别效果。获取各个交互操作模板参数的其中一种方式可为:向用户提供一个交互界面,该交互界面上展示有各个交互操作模板参数,用户可在该交互界面上对各个交互操作模板参数进行修改,从而根据用户的修改获取到各个交互操作模板参数,其中,具体是对交互操作模板参数的值进行修改。
步骤102:根据预设的文档识别模板参数和交互操作模板参数之间的第一映射关系,确定与每一个交互操作模板参数对应的文档识别模板参数,其中,所述第一映射关系中每一个所述文档识别模板参数对应至少一个交互操作模板参数。
在本实施例中,第一映射关系可以为现有的函数关系,且第一映射关系具体是根据交互操作模板参数生成文档识别模板参数的关系,且每一个文档识别模板参数可能需要至少一个交互操作模板参数共同生成。
举例来说,假设共有a、b、c、d、e这5个交互操作模板参数、共有R、Y、T、U、I、O这6个文档识别模板参数、预设的文档识别模板参数和交互操作模板参数之间的第一映射关系包括有R-(a、c、d)、Y-b、T-(d、e)、U-(b、d)、I-a、O-(a、c、d),其中,第一映射关系中可以包括有函数关系,如R-(a、c、d)代表的是,文档识别模板参数R为因变量,交互操作模板参数a、c、d为自变量的一种函数关系,R-(a、c、d)和O-(a、c、d)为自变量相同的两种函数关系。假设用户只对交互操作模板参数a、c、d中的a、c进行了修改,接下来则根据修改后的a、c、预设的d以及R-(a、c、d),生成新的R,另外,还会根据修改后的a和I-a,生成新的I,根据修改后的a、c、预设的d以及O-(a、c、d),生成新的O。
步骤103:根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果。
在本实施例中,当通过上述步骤202生成新的R、I和O之后,便可利用新生成的R、I、O和预设的Y、T、U对文档进行识别处理。上述只是以修改其中两个交互操作模板参数为例,若用户修改了所有交互操作模板参数,则所有的文档识别模板参数均会重新生成,从而利用新生成的6个文档识别模板参数对文档进行识别处理。
本发明实施例提供了一种参数调整方法,通过将文档识别模板参数映射成交互操作模板参数,这样,在获取到各个交互操作模板参数之后,便可根据文档识别模板参数和交互操作模板参数之间的第一映射关系,生成相对应的各个文档识别模板参数,从而通过交互操作模板参数的改变来调整文档识别模板参数,以通过不同的文档识别模板参数适应不同排版格式的文档,进而提高对不同排版格式的文档的识别效果。
图2为本发明实施例二提供的一种参数调整方法的流程图,如图2所示,该方法可以包括:
步骤201:获取文档。
步骤202:根据预设的各个文档识别模板参数对所述文档进行识别处理,得到并显示第二识别结果。
在本实施例中,每一次读取文档之后,首先都会获得默认的各个文档识别模板参数,并利用默认的各个文档识别模板参数对读取的文档进行识别检测处理,得到第二识别结果,将第二识别结果展示给用户。
步骤203:根据预设的交互操作模板参数和文档识别模板参数之间的第二映射关系,确定并显示与预设的每一个文档识别参数对应的交互操作模板参数,其中,第二映射关系中每一个交互操作模板参数对应至少一个文档识别模板参数。
在本实施例中,第二映射关系可以为现有的函数关系,且第二映射关系具体是根据文档识别模板参数生成交互操作模板参数的关系,且每一个交互操作模板参数可能需要至少一个文档识别模板参数共同生成。在根据默认的各个文档识别模板参数生成并展示相应的各个交互操作模板参数之后,若第二识别结果未满足要求,则用户可对当前所展示的各个交互操作模板参数进行修改。
在本实施例中,预先应对交互操作模板参数和文档识别模板参数的结构进行定义。以进行版心识别和段落识别为例,定义的交互操作模板参数的元素结构可如下表1所示,定义的文档识别模板参数的元素结构可如下表2所示。
表1交互操作模板参数的元素结构
Figure BDA0001928446660000071
Figure BDA0001928446660000081
由表1所示,共定义了9个交互操作模板参数。
表2文档识别模板参数的元素结构
Figure BDA0001928446660000082
Figure BDA0001928446660000091
由表2可知,共定义了10个文档识别模板参数。
步骤204:接收用户的修改指令。
步骤205:根据修改指令,修改所确定的各个交互操作模板参数,得到修改后的各个交互操作模板参数。
在本实施例中,可向用户提供一个交互界面,该交互界面上可显示上述9个交互操作模板参数,用户可在该交互界面上对9个交互操作模板参数中的任意一个或多个参数进行修改。
步骤206:根据预设的文档识别模板参数和交互操作模板参数之间的第一映射关系,确定与修改后的各个交互操作模板参数对应的文档识别模板参数,其中,第一映射关系中每一个文档识别模板参数对应至少一个交互操作模板参数。
在本实施例中,预先定义的文档识别模板参数和交互操作模板参数的映射关系可如下表3所示。
表3文档识别模板参数和交互操作模板参数的映射关系
Figure BDA0001928446660000092
由表3可知,文档识别模板参数DOCPARAM_8对应有交互操作模板参数OPERPARAM_1、OPERPARAM_3、OPERPARAM_9,文档识别模板参数DOCPARAM_10对应,OPERPARAM_2,其他对应关系不再赘述。例如,当用户修改了交互操作模板参数OPERPARAM_1,则会根据修改后的OPERPARAM_1和预设的OPERPARAM_3、OPERPARAM_9,生成新的DOCPARAM_8。
步骤207:根据与每一个交互操作模板参数对应的文档识别模板参数,提取文档中的对象,得到第一识别结果,其中,对象包括段落对象、章节对象、图表对象、公式对象中的至少一种。
在本实施例中,利用上述步骤得到的各个文档识别模板参数对获取到的文档进行识别处理,以将文档中的对象进行提取。
步骤208:显示第一识别结果。
步骤209:接收用户发送的确认指令,其中,确认指令用于指示第一识别结果满足预设的识别条件。
在本实施例中,在得到识别结果之后,可将识别结果显示给用户,以使得用户查看识别结果是否满足预设的识别条件,其中,预设的识别条件可以是用户自己主观认定的识别条件,例如,识别结果中包括图片,用户可观看图片是否清晰,如果用户认定清晰,则认为识别结果满足要求;预设的识别条件还可以是预先设置在终端上的识别条件,如识别结果中包括公式,用户可根据终端中预设好的正确公式与识别结果中的公式进行比对,如果比对一致,则确定识别结果满足需求。
值得说明的是,当识别结果未满足需求时,用户可再次对各个交互操作模板参数进行修改,以重新调整各个文档识别模板参数,直至得到的识别结果满足要求。
步骤210:根据确认指令,保存每一个交互操作模板参数。
在本实施例中,在接收到用户的确认指示后,对各个交互操作模板参数进行保存,这样,在读入与之相同的文档之后,可通过加载功能将之前保存的各个交互操作模板参数导入进来,这样用户就可以不用再去调整,从而实现参数的共享。
另外,为了提高工作效率,还可自动对识别结果进行识别,具体的,若识别结果满足预设的识别条件,则保存每一个交互操作模板参数。
本发明实施例通过向用户提供交互界面,用户通过交互界面修改交互操作模板参数,根据建立的映射关系实现对文档模板参数的自动生成;另外,通过保存处理,实现了对文档操作模板参数的共享,以在读取到相同排版格式的文档时,无需用户在交互界面上手动修改交互操作模板参数,可直接加载已保存的各个交互操作模板参数,提高了用户体验。
图3为本发明实施例三提供的一种参数调整装置的结构示意图,包括:
第一获取单元301,用于获取各个交互操作模板参数。
第一确定单元302,用于根据预设的文档识别模板参数和交互操作模板参数之间的第一映射关系,确定与每一个交互操作模板参数对应的文档识别模板参数,其中,所述第一映射关系中每一个所述文档识别模板参数对应至少一个交互操作模板参数。
第一识别单元303,用于根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果。
在本实施例中,本实施例的参数调整装置可执行本发明实施例一提供的参数调整方法,其实现原理相类似,此处不再赘述。
本发明实施例通过将文档识别模板参数映射成交互操作模板参数,这样,在获取到各个交互操作模板参数之后,便可根据文档识别模板参数和交互操作模板参数之间的第一映射关系,生成相对应的各个文档识别模板参数,从而通过交互操作模板参数的改变来调整文档识别模板参数,以通过不同的文档识别模板参数适应不同排版格式的文档,进而提高对不同排版格式的文档的识别效果。
图4为本发明实施例四提供的一种参数调整装置的的结构示意图,在实施例三的基础上,如图4所示,所述装置还包括:
第二获取单元401,用于获取文档;
第二识别单元402,用于根据预设的各个文档识别模板参数对所述文档进行识别处理,得到并显示第二识别结果;
第二确定单元403,用于根据预设的交互操作模板参数和文档识别模板参数之间的第二映射关系,确定并显示与预设的每一个文档识别参数对应的交互操作模板参数,其中,所述第二映射关系中每一个所述交互操作模板参数对应至少一个文档识别模板参数。所述第一获取单元301,包括:
显示模块3011,用于显示预设的各个交互操作模板参数。
接收模块3012,用于接收用户的修改指令。
修改模块3013,用于根据所述修改指令,修改预设的各个交互操作模板参数,得到修改后的各个交互操作模板参数。
进一步地,所述装置还包括:
显示单元404,用于显示所述第一识别结果。
接收单元405,用于接收用户发送的确认指令,其中,所述确认指令用于指示所述第一识别结果满足预设的识别条件。
第一存储单元406,用于根据所述确认指令,保存每一个所述交互操作模板参数。
进一步地,所述装置还包括:
第二存储单元407,用于在所述第一识别单元303得到识别结果之后,若所述第一识别结果满足预设的识别条件,则保存每一个所述交互操作模板参数。
进一步地,所述第一识别单元303,用于根据与每一个交互操作模板参数对应的文档识别模板参数,提取所述文档中的对象,其中,所述对象包括段落对象、章节对象、图表对象、公式对象中的至少一种。
进一步地,所述交互操作模板参数、所述文档识别模板参数分别包括以下中的任一项:元素标识符、元素名称、元素类型、元素注释、元素类别。
在本实施例中,本实施例的参数调整装置可执行本发明实施例二提供的参数调整方法,其实现原理相类似,此处不再赘述。
本发明实施例通过向用户提供交互界面,用户通过交互界面修改交互操作模板参数,根据建立的映射关系实现对文档模板参数的自动生成;另外,通过保存处理,实现了对文档操作模板参数的共享,以在读取到相同排版格式的文档时,无需用户在交互界面上手动修改交互操作模板参数,可直接加载已保存的各个交互操作模板参数,提高了用户体验。
图5为本发明实施例五提供的一种参数调整设备的结构示意图,包括:存储器501和处理器502。
所述存储器501,用于存储计算机程序。
其中,所述处理器502执行所述存储器501中的计算机程序,以实现任一实施例的提供的方法。
本发明实施例六提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现任一实施例的提供的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims (10)

1.一种参数调整方法,其特征在于,包括:
获取各个交互操作模板参数;
根据预设的文档识别模板参数和交互操作模板参数之间的第一映射关系,确定与每一个交互操作模板参数对应的文档识别模板参数,其中,所述第一映射关系中每一个所述文档识别模板参数对应至少一个交互操作模板参数;
根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果。
2.根据权利要求1所述的方法,其特征在于,在所述获取各个交互操作模板参数之前,还包括:
获取文档;
根据预设的各个文档识别模板参数对所述文档进行识别处理,得到并显示第二识别结果;
根据预设的交互操作模板参数和文档识别模板参数之间的第二映射关系,确定并显示与预设的每一个文档识别参数对应的交互操作模板参数,其中,所述第二映射关系中每一个所述交互操作模板参数对应至少一个文档识别模板参数。
3.根据权利要求1所述的方法,其特征在于,所述获取各个交互操作模板参数,包括:
显示预设的各个交互操作模板参数;
接收用户的修改指令,并根据所述修改指令,修改预设的各个交互操作模板参数,得到修改后的各个交互操作模板参数。
4.根据权利要求3所述的方法,其特征在于,在所述根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果之后,还包括:
显示所述第一识别结果;
接收用户发送的确认指令,其中,所述确认指令用于指示所述第一识别结果满足预设的识别条件;
根据所述确认指令,保存每一个所述交互操作模板参数。
5.根据权利要求3所述的方法,其特征在于,在所述根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果之后,还包括:
若所述第一识别结果满足预设的识别条件,则保存每一个所述交互操作模板参数。
6.根据权利要求1任一项所述的方法,其特征在于,根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,包括:
根据与每一个交互操作模板参数对应的文档识别模板参数,提取所述文档中的对象,其中,所述对象包括段落对象、章节对象、图表对象、公式对象中的至少一种。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述交互操作模板参数、所述文档识别模板参数分别包括以下中的任一项:元素标识符、元素名称、元素类型、元素注释、元素类别。
8.一种参数调整装置,其特征在于,包括:
第一获取单元,用于获取各个交互操作模板参数;
第一确定单元,用于根据预设的文档识别模板参数和交互操作模板参数之间的第一映射关系,确定与每一个交互操作模板参数对应的文档识别模板参数,其中,所述第一映射关系中每一个所述文档识别模板参数对应至少一个交互操作模板参数;
第一识别单元,用于根据与每一个交互操作模板参数对应的文档识别模板参数,对预设的文档进行识别处理,得到第一识别结果。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第二获取单元,用于获取文档;
第二识别单元,用于根据预设的各个文档识别模板参数对所述文档进行识别处理,得到并显示第二识别结果;
第二确定单元,用于根据预设的交互操作模板参数和文档识别模板参数之间的第二映射关系,确定并显示与预设的每一个文档识别参数对应的交互操作模板参数,其中,所述第二映射关系中每一个所述交互操作模板参数对应至少一个文档识别模板参数。
10.根据权利要求8所述的装置,其特征在于,所述第一获取单元,包括:
显示模块,用于显示预设的各个交互操作模板参数;
接收模块,用于接收用户的修改指令;
修改模块,用于根据所述修改指令,修改预设的各个交互操作模板参数,得到修改后的各个交互操作模板参数。
CN201811628271.6A 2018-12-28 2018-12-28 参数调整方法和装置 Pending CN111382621A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811628271.6A CN111382621A (zh) 2018-12-28 2018-12-28 参数调整方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811628271.6A CN111382621A (zh) 2018-12-28 2018-12-28 参数调整方法和装置

Publications (1)

Publication Number Publication Date
CN111382621A true CN111382621A (zh) 2020-07-07

Family

ID=71218202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811628271.6A Pending CN111382621A (zh) 2018-12-28 2018-12-28 参数调整方法和装置

Country Status (1)

Country Link
CN (1) CN111382621A (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006131814A2 (en) * 2005-06-07 2006-12-14 Stuart Alexander King Document processing system and method computer readable medium
CN1906608A (zh) * 2003-11-21 2007-01-31 新加坡科技研究局 确认技术文档内容的方法和系统
US20070226211A1 (en) * 2006-03-27 2007-09-27 Heinze Daniel T Auditing the Coding and Abstracting of Documents
US20110107204A1 (en) * 2008-04-22 2011-05-05 Epoq Group Ltd. Automated document assembly with obscuring
CN102541948A (zh) * 2010-12-23 2012-07-04 北大方正集团有限公司 用于提取文档结构的方法和装置
CN102663138A (zh) * 2012-05-03 2012-09-12 北京大学 一种公式查询条件的输入方法与装置
CN102855243A (zh) * 2011-06-28 2013-01-02 北大方正集团有限公司 用于提取文档结构的方法和装置
CN103383681A (zh) * 2011-12-31 2013-11-06 华为数字技术(成都)有限公司 一种文件类型识别方法及系统
US20170220545A1 (en) * 2016-02-01 2017-08-03 Microsoft Technology Licesning, LLC Generating templates from user's past documents
CN107301162A (zh) * 2016-04-14 2017-10-27 珠海金山办公软件有限公司 一种识别文字文档的方法及装置
CN108170656A (zh) * 2017-12-28 2018-06-15 阿里巴巴集团控股有限公司 模板创建方法、文档创建方法、渲染方法和装置
US10133477B1 (en) * 2005-06-02 2018-11-20 Eli I Zeevi Integrated document editor
CN108984683A (zh) * 2018-06-29 2018-12-11 北京百度网讯科技有限公司 结构化数据的提取方法、系统、设备及存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1906608A (zh) * 2003-11-21 2007-01-31 新加坡科技研究局 确认技术文档内容的方法和系统
US10133477B1 (en) * 2005-06-02 2018-11-20 Eli I Zeevi Integrated document editor
WO2006131814A2 (en) * 2005-06-07 2006-12-14 Stuart Alexander King Document processing system and method computer readable medium
US20140257842A1 (en) * 2006-03-27 2014-09-11 A-Life Medical, Llc Auditing the coding and abstracting of documents
US20070226211A1 (en) * 2006-03-27 2007-09-27 Heinze Daniel T Auditing the Coding and Abstracting of Documents
US20110107204A1 (en) * 2008-04-22 2011-05-05 Epoq Group Ltd. Automated document assembly with obscuring
CN102541948A (zh) * 2010-12-23 2012-07-04 北大方正集团有限公司 用于提取文档结构的方法和装置
CN102855243A (zh) * 2011-06-28 2013-01-02 北大方正集团有限公司 用于提取文档结构的方法和装置
CN103383681A (zh) * 2011-12-31 2013-11-06 华为数字技术(成都)有限公司 一种文件类型识别方法及系统
CN102663138A (zh) * 2012-05-03 2012-09-12 北京大学 一种公式查询条件的输入方法与装置
US20170220545A1 (en) * 2016-02-01 2017-08-03 Microsoft Technology Licesning, LLC Generating templates from user's past documents
CN107301162A (zh) * 2016-04-14 2017-10-27 珠海金山办公软件有限公司 一种识别文字文档的方法及装置
CN108170656A (zh) * 2017-12-28 2018-06-15 阿里巴巴集团控股有限公司 模板创建方法、文档创建方法、渲染方法和装置
CN108984683A (zh) * 2018-06-29 2018-12-11 北京百度网讯科技有限公司 结构化数据的提取方法、系统、设备及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LIN,CHEN: "an improved algorithm for identifying mathematical formulas in the images of PDF documents", 《PROCEEDINGS OF 2015 IEEE INTERNATIONAL CONFERENCE ON PROGRESS IN INFORMATCS AND COMPUTING》 *
LIN,XY: "mathematical formula identification and performance evaluation in PDF document", 《INTERNATIONAL JOURNAL ON DOCUMENT ANALYSIS AND RECOGNITION》 *
文伟平: "基于机器学习的恶意文档识别工具设计与实现", 《信息网络安全》 *
黎斯达: "PDF文档中的脚注识别研究", 《北京大学学报(自然科学版)》 *

Similar Documents

Publication Publication Date Title
US20240143904A1 (en) Human-Computer Interaction Method And Apparatus Thereof
CN111752557A (zh) 一种展示方法及装置
CN107291949B (zh) 信息搜索方法及装置
CN109241003B (zh) 文件管理方法和装置
CN111444750B (zh) 一种pdf文档识别方法、装置及电子设备
CN112445693A (zh) 一种页面更新检测方法、装置、设备及存储介质
CN109582934B (zh) 版式文档的转换方法及装置
CN114359533A (zh) 一种基于页面文本的页码识别方法和计算机设备
CN113989817A (zh) 一种自定义票据的识别方法、设备及介质
CN114529933A (zh) 一种合同数据差异性的比对方法、装置、设备和介质
CN112508717A (zh) 一种影像信息的审核方法、装置、电子设备及存储介质
CN113064556A (zh) 一种bios的数据存储方法、装置、设备及存储介质
US20200342169A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
CN111382621A (zh) 参数调整方法和装置
CN111401027B (zh) 版式模板文件升级方法和装置
CN109656652B (zh) 网页图表绘制方法、装置、计算机设备和存储介质
CN103488440A (zh) 单据打印装置和单据打印方法
US20220301285A1 (en) Processing picture-text data
CN110119743B (zh) 一种图片识别方法、服务器及计算机可读存储介质
CN114997137A (zh) 一种文档信息抽取方法、装置、设备及可读存储介质
CN109918633B (zh) 一种信息快速填写方法及终端
CN111352917A (zh) 信息录入方法、装置、电子设备及存储介质
CN108073594B (zh) 一种生成热力图的方法及装置
CN110347953B (zh) 页面生成方法、装置、计算机设备及存储介质
CN111338941B (zh) 信息处理方法和装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230703

Address after: 3007, Hengqin International Financial Center Building, No. 58 Huajin Street, Hengqin New District, Zhuhai City, Guangdong Province, 519030

Applicant after: New founder holdings development Co.,Ltd.

Applicant after: Peking University

Address before: 100871, Beijing, Haidian District, Cheng Fu Road, No. 298, Zhongguancun Fangzheng building, 9 floor

Applicant before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Applicant before: PKU FOUNDER INFORMATION INDUSTRY GROUP CO.,LTD.

Applicant before: Peking University

TA01 Transfer of patent application right
AD01 Patent right deemed abandoned

Effective date of abandoning: 20240126

AD01 Patent right deemed abandoned