CN111581937A - 文档生成方法、装置、计算机可读介质及电子设备 - Google Patents

文档生成方法、装置、计算机可读介质及电子设备 Download PDF

Info

Publication number
CN111581937A
CN111581937A CN202010414406.XA CN202010414406A CN111581937A CN 111581937 A CN111581937 A CN 111581937A CN 202010414406 A CN202010414406 A CN 202010414406A CN 111581937 A CN111581937 A CN 111581937A
Authority
CN
China
Prior art keywords
document
template
parameter
request
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010414406.XA
Other languages
English (en)
Inventor
周小建
周翔
杨益民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casic Wisdom Industrial Development Co ltd
Original Assignee
Casic Wisdom Industrial Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casic Wisdom Industrial Development Co ltd filed Critical Casic Wisdom Industrial Development Co ltd
Priority to CN202010414406.XA priority Critical patent/CN111581937A/zh
Publication of CN111581937A publication Critical patent/CN111581937A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供一种文档生成方法、文档生成装置、计算机可读介质及电子设备;涉及领域文档处理技术领域。该文档生成方法包括:获取示例文档以及所述示例文档对应的分类等级信息;根据所述示例文档确定所述分类等级信息对应的模板文档;接收到文档生成请求时,根据所述文档生成请求的请求参数在所述模板文档中获取对应的目标模板;结合所述目标模板以及所述请求参数生成格式文档。本公开中的文档生成方法能够在一定程度上克服格式文档生成困难的问题,进而提升文档生成的效率。

Description

文档生成方法、装置、计算机可读介质及电子设备
技术领域
本公开涉及文档处理技术领域,具体而言,涉及一种文档生成方法、文档生成装置、计算机可读存储介质及电子设备。
背景技术
随着自动化办公的不断深入,各业务单位的职能范围不断扩大,办公行为正向数字化、智慧化、以及精细化的方向发展。在日常工作中,管理部门经常需要打印如处罚单、证明材料等重复使用的文档,这类文档通常有特殊的用途,具有定制化程度高的特点,往往需要在专用设备上获取,例如用于请假的请假条,需要在特定管理人员使用的电脑上进行打印,从而导致在普通的设备上难以获取这类文档。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种文档生成方法、文档生成装置、计算机可读介质及电子设备,能够在一定程度上克服文档获取困难的问题,进而提升文档的生成效率。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供一种文档生成方法,包括:
获取示例文档以及所述示例文档对应的分类等级信息;
根据所述示例文档确定所述分类等级信息对应的模板文档;
接收到文档生成请求时,根据所述文档生成请求的请求参数在所述模板文档中获取对应的目标模板;
结合所述目标模板以及所述请求参数生成格式文档。
在本公开的一种示例性实施例中,根据所述示例文档确定所述分类等级信息对应的模板文档之后,还包括:
提取所述示例文档中包含的动态参数;
通过所述模板文档对应的分类等级信息、示例文档、以及所述示例文档中包含的动态参数,生成所述模版描述文件。
在本公开的一种示例性实施例中,所述根据所述文档生成请求的请求参数在所述模板文档中获取对应的目标模板,包括:
从所述模板文档对应的模板描述文件中解析出所述模板文档分别对应的多个参数;
通过所述多个参数与所述请求参数进行匹配,以确定与所述请求参数对应的所述目标模板。
在本公开的一种示例性实施例中,所述根据所述文档生成请求的请求参数在所述模板文档中获取对应的目标模板,包括:
通过所述分类等级信息生成分类表,并通过所述动态参数生成所述分类表对应的参数表;
提取所述请求参数中的第一参数,在所述分类表中查询所述第一参数匹配的目标分类表;
提取所述请求参数中的第二参数,在所述目标分类表对应的多个参数表中查询与所述第二参数匹配的目标参数表;
获取所述目标参数表对应的模板文档,作为目标模板。
在本公开的一种示例性实施例中,还包括:
如果所述请求参数中的第二参数与各个所述参数表均不匹配,则按照所述第二参数分别与每一参数表的相似度,确定所述第二参数对应的目标参数表。
在本公开的一种示例性实施例中,所述根据所述示例文档确定所述分类等级信息对应的模板文档,包括:
识别出所述示例文档中的动态参数;
利用标签对所述示例文档中的动态参数进行标记,以将标记后的示例文档作为所述分类等级信息对应的模板文档。
在本公开的一种示例性实施例中,所述结合所述目标模板以及所述请求参数生成格式文档,包括:
将所述目标模板中的标签标记的动态参数替换为所述请求参数,以获得格式文档。
根据本公开的第二方面,提供一种文档生成装置,可以包括:文档分类模块、分类匹配模块、模板获取模块以及文档生成模块,其中:
文档分类模块,用于获取示例文档以及所述示例文档对应的分类等级信息。
分类匹配模块,用于根据所述示例文档确定所述分类等级信息对应的模板文档。
模板获取模块,用于接收到文档生成请求时,根据所述文档生成请求的请求参数在所述模板文档中获取对应的目标模板。
文档生成模块,用于结合所述目标模板以及所述请求参数生成格式文档。
在本公开的一种示例性实施例中,该文档生成装置还包括参数提取模块,以及描述文件生成模块,其中:
参数提取模块,用于提取所述示例文档中包含的动态参数。
描述文件生成模块,用于通过所述模板文档对应的分类等级信息、示例文档、以及所述示例文档中包含的动态参数,生成所述模版描述文件。
在本公开的一种示例性实施例中,模板获取模块可以具体包括参数解析模块,以及参数匹配模块,其中:
从所述模板文档对应的模板描述文件中解析出所述模板文档分别对应的多个参数。
通过所述多个参数与所述请求参数进行匹配,以确定与所述请求参数对应的所述目标模板。
在本公开的一种示例性实施例中,模板获取模块可以包括表生成模块、第一查询模块、第二查询模块以及目标模板确定模块,其中:
表生成模块,用于通过所述分类等级信息生成分类表,并通过所述动态参数生成所述分类表对应的参数表。
第一查询模块,用于提取所述请求参数中的第一参数,在所述分类表中查询所述第一参数匹配的目标分类表。
第二查询模块,用于提取所述请求参数中的第二参数,在所述目标分类表对应的多个参数表中查询与所述第二参数匹配的目标参数表。
目标模板确定模块,用于获取所述目标参数表对应的模板文档,作为目标模板。
在本公开的一种示例性实施例中,该文档生成装置还包括相似度计算模块,用于如果所述请求参数中的第二参数与各个所述参数表均不匹配,则按照所述第二参数分别与每一参数表的相似度,确定所述第二参数对应的目标参数表。
在本公开的一种示例性实施例中,分类匹配模块可以包括参数识别模块,以及标签模块,其中:
参数识别模块,用于识别出所述示例文档中的动态参数。
标签模块,用于利用标签对所述示例文档中的动态参数进行标记,以将标记后的示例文档作为所述分类等级信息对应的模板文档。
在本公开的一种示例性实施例中,文档生成模块可以具体用于将所述目标模板中的标签标记的动态参数替换为所述请求参数,以获得格式文档。
根据本公开的第三方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的方法。
根据本公开的第四方面,提供一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的方法。
本公开示例性实施例可以具有以下部分或全部有益效果:
在本公开的一示例实施方式所提供的文档生成方法中,一方面,通过模板文档可以实现格式文档的生成,能够提高文档的生成效率;另一方面,格式文档能够通过文档生成请求发送至客户端,从而解决普通终端难以获取格式文档的问题,能够降低文档开发成本;再一方面,结合客户端发送的请求参数生成格式文档,能够避免格式文档过于固定化而无法满足个性化需求的问题,进而能够增强格式文档的兼容性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出了根据本公开的一个实施例的文档生成方法的流程图;
图2示意性示出了根据本公开的另一个实施例的文档生成方法的流程图;
图3示意性示出了根据本公开的一个实施例的文档生成方法流程图;
图4示意性示出了根据本公开的另一个实施例的文档生成方法的流程图;
图5示意性示出了根据本公开的一个实施例的文档生成方法的流程图;
图6示意性示出了根据本公开的另一个实施例的文档生成方法的流程图;
图7示意性示出了根据本公开的一个实施例的文档生成装置的框图;
图8示意性示出了根据本公开的一个实施例的用于实现文档生成方法的系统架构图;
图9示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
以下对本公开实施例的技术方案进行详细阐述:
本示例实施方式中首先提供一种文档生成方法。参考图1所示,该文档生成方法可以包括以下步骤:
步骤S110:获取示例文档以及所述示例文档对应的分类等级信息。
步骤S120:根据所述示例文档确定所述分类等级信息对应的模板文档。
步骤S130:接收到文档生成请求时,根据所述文档生成请求的请求参数在所述模板文档中获取对应的目标模板。
步骤S140:结合所述目标模板以及所述请求参数生成格式文档,以将所述格式文档发送至对应的客户端。
在本公开的一示例实施方式所提供的文档生成方法中,一方面,通过模板文档可以实现格式文档的生成,能够提高文档的生成效率;另一方面,格式文档能够通过文档生成请求发送至客户端,从而解决普通终端难以获取格式文档的问题,能够降低文档开发成本;再一方面,结合客户端发送的请求参数生成格式文档,能够避免格式文档过于固定化而无法满足个性化需求的问题,进而能够增强格式文档的兼容性。
下面,对于本示例实施方式的上述步骤进行更加详细的说明。
在步骤S110中,获取示例文档以及所述示例文档对应的分类等级信息。
示例文档指的是历史使用过的具有特定格式的文书,根据文书用途的不同,文书的格式也不同,例如,表格、图片等等;示例性的,示例文档可以具体包括如请假单、外出证明、出入证明等,或者还可以包括其他职能单位所使用的文书文件,例如行政单位需使用的处罚单等,本实施方式对此不做特殊限定。
通过服务器或者本地保存的历史记录,可以查找出历史使用过的文书,从而得到示例文档。分类等级信息是用于表示示例文档所属的类型的信息,对示例文档进行分类可以获取分类等级信息,示例性的,可以根据示例文档的用途对示例文档进行分类,例如,示例文档可以是用于证明用户身份,或者是用于申请特定资源的文档,则分类等级信息可以包括证明文书、申请文书等;还可以根据示例文档的职能范围对示例文档进行分类,或者根据示例文档的业务类型对示例文档进行分类,例如,行政工作中的示例文档可以根据业务类型分为环境保护、安全生产、城市管理等,根据职能范围可以分为安监局、环保局、城管局等;此外,示例文档还可以通过其他方式分类,例如按照区域进行分类,如可以分为城中、城东、城西、城南等等。
示例性的实施方式中,示例文档可以按照等级细化的方式进行分类,例如,先分为三个第一等级、然后分别对每一个第一等级再进行划分,得到三个第二等级,则分类等级信息可以包括九个类型。因此,按照该分类等级信息可以创建示例文档的文档目录,用于保存各个示例文档,其中每个等级可以对应一级目录,例如,示例文档1的文件路径可以为:第一等级\第二等级\第三等级\示例文档1。
在步骤S120中,根据所述示例文档确定所述分类等级信息对应的模板文档。
本实施方式中,分类等级信息可以包括多个针对示例文档的分类,其中每一分类均可以包含多个示例文档,这多个示例文档具有统一的格式,可以对应一个模板文档;或者,可以对每一个示例文档均生成一对应的模板文档,本实施方式不限于此。通过分类等级信息对应的示例文档可以生成模板文档,具体的,可以扫描示例文档,确定示例文档的格式以及示例文档中包含的文字内容,从而包含的文字内容进行去除,获取包含一定格式的模板文档。进一步的,该方法可以具体包括步骤S201和步骤S202,如图2所示。
参考图2,在步骤S201中,识别出所述示例文档中的动态参数。其中,动态参数指的是属于同一类型的多个示例文档中变化的部分,通常同一类型的示例文档可以具有同样的格式,其中包含的文字内容可以分为相同的部分和变化的部分。变化的部分的内容可以为动态参数,例如,示例文档中的申请人、申请时间可以为动态参数。通过扫描每个示例文档,可以获取示例文档中的包含的文字内容,从而对文字内容中包含的每个参数进行识别,确定其中的动态参数。示例性的,可以通过机器学习模型识别文字内容中每个词语,确定动态参数;或者,也可以通过对比属于每一类型的多个示例文档,对比出文档中的不同部分,将该部分确定为动态参数。
在步骤S202中,利用标签对所述示例文档中的动态参数进行标记,以将标记后的示例文档作为所述分类等级信息对应的模板文档。示例性的,通过办公软件中的标签工具可以将动态参数标记为标签,例如,word标签等。通过标记后包含标签的示例文档可以作为模板文档。
本实施方式中,通过将每一类型的示例文档中固有的内容保留,而将动态变化的内容进行标记可以获得模板文档,从而获得每一分类等级信息对应的模板文档,可以快速的获取模板,创建模板库。进一步的,还可以对动态参数进行进一步的分类,例如,动态参数可以分为时间、人名等,得到的分类的类型可以作为标签的标签名,从而便于生成格式文档时,快速地对动态参数进行替换。
示例性的,在获取每一分类等级信息对应的模板文档后,模板文档可以保存在与分类等级信息对应的文件目录中,换言之,模板文档的存储路径可以与对应的示例文档相同,例如,示例文档1的分类等级信息为第三等级,示例文档1的存储目录为:第一等级\第二等级\第三等级\示例文档1,则对应的模板文档1的存储路径可以为:第一等级\第二等级\第三等级\模板文档1。
在步骤S130中,接收到文档生成请求时,根据所述文档生成请求的请求参数在所述模板文档中获取对应的目标模板。
用户需要获取格式文档时,可以在客户端发送请求,客户端或者服务器在检测到该文档生成请求时,可以获取该文档生成请求中包含的请求参数。其中,请求参数是用于生成格式文档的信息,具体可以包括待生成的格式文档对应的动态参数,也可以包括待生成的格式文档对应的分类等级信息。用户可以根据对格式文档的需求输入请求参数,因此,本实施方式可以包括客户端显示界面,通过客户端显示界面获取客户端输入的信息,从而得到请求参数。举例而言,客户端显示界面中可以显示分类等级信息,供用户选择需要的格式类型,并通过输入框提示用户输入动态参数,例如“日期、申请人、执行人”等。
对请求参数进行解析可以获取请求参数中包含的分类等级信息,进而可以获取该分类等级信息对应的模板文档,作为目标模板。示例性的,本实施方式中,根据请求参数获取目标模板的方法可以包括步骤S301和步骤S302,如图3所示。
在步骤S301中,从所述模板文档对应的模板描述文件中解析出所述模板文档分别对应的多个参数。其中,每一模板文档可以对应一模板描述文件。模板描述文件是用于描述模板文件的数据,其中具体可以包括模板文件的属性信息,例如名称、存储路径、分类等级信息等,或者,还可以包括其他内容,例如模板文件中的动态参数、标签等,本实施方式不限于此。示例性的,在生成模板文档后,可以针对每一模板文档编写标准XML文件,作为对应的模板描述文件。因此,本实施方式中还包括以下步骤S401,以及步骤S402,如图4所示,具体的:
在步骤S401中,提取所述示例文档中包含的动态参数。本实施方式中,对于每个类型,可以将该类型中包含的所有示例文档中的动态参数均进行提取,例如,分类等级信息A中包含5个示例文档,则对这6个示例文档逐一进行动态参数识别,将识别出的动态参数可以进行提取保存。
在步骤S402中,通过所述模板文档对应的分类等级信息、示例文档、以及所述示例文档中包含的动态参数,生成所述模版描述文件。举例而言,可以通过可扩展标记语言XML对每个模板文档对应的分类等级信息、示例文档的存储路径、以及该分类等级信息对应的所有示例文档中包含的动态参数等信息进行描述,生成模板描述文件。
通过扫描所有的模板描述文件可以读取出模板文档的信息,以及每个示例文档的信息,能够避免对每一个示例文档、模板文档进行读取,从而简化文件的读取操作,提高读取效率。
接下来,继续参考图3,在步骤S302中,通过所述多个参数与所述请求参数进行匹配,以确定与所述请求参数对应的所述目标模板。具体的,首先从一个模板描述文件中读取出其包含的多个参数,然后将该多个参数与请求参数中包含的多个参数进行对比,如果能够进行匹配,则将该模板描述文件对应的模板文件确定为该请求参数对应的目标模板,如果不能匹配,则再获取下一个模板描述文件中包含的多个参数,再次与请求参数进行对比,依次类推,确定出与请求参数匹配的模板描述文件,进而确定目标模板。可选的,可以从模板描述文件中读取出分类等级信息,如果该分类等级信息与请求参数中的分类等级信息互相匹配,则可以确定该模板描述文件对应的模板文档为目标模板,从而能够减少匹配的计算量,提高效率。
进一步的,获取目标模板的方法可以包括以下步骤S501至步骤S504,如图5所示,具体的:
在步骤S501中,通过所述分类等级信息生成分类表,并通过所述动态参数信息生成所述分类表对应的参数表。通过扫描所有的模板描述文件,可以确定每一类型对应的分类等级信息,以及动态参数信息,进而,利用所有的分类等级信息建立分类表,每一个分类表可以对应一个或多个参数表,一个参数表中可以只包含一个示例文档中的所有动态参数,则对于同一类型的示例文档来说,存在多个参数表;或者,也可以同一种类型中所有的示例文档中的动态参数保存在同一个参数表,则一个分类表对应一个参数表。举例而言,分类等级信息中共包含3个类型:A、B、C,A类型存在3个示例文档,B类型存在4个示例文档,C类型存在5个示例文档,则可以得到三个分类表,每个分类表中包含一个类型的信息,分类表A可以对应3个参数表,分类表B可对应4个参数表,分类表C可对应5个参数表。
在步骤S502中,提取所述请求参数中的第一参数,在所述分类表中查询所述第一参数匹配的目标分类表。其中,第一参数为请求参数中用于标识分类等级信息的参数,预先可以设置分类等级信息对应的字段,以及动态参数对应的字段,通过不同的字段分别对分类等级信息以及动态参数进行标识。例如,通过字段A标识分类等级信息,则提取出请求参数中的字段A的值,该值为请求参数的分类等级信息。得到第一参数后,可以查询分类表,确定该第一参数对应的目标分类表。
进一步的,如果通过第一参数能够查询到对应的分类表,则查询结果输出的分类表作为目标分类表;如果通过第一参数查询之后,没有匹配的结果,则可以确定不支持用户发送的该文档生成请求。不支持文档生成请求时,可以向用户显示提示消息,提示用户输入的请求参数有误,以便于用户重新输入请求参数。
在步骤S503中,提取所述请求参数中的第二参数,在所述目标分类表对应的多个参数表中查询与所述第二参数匹配的目标参数表。每个示例文档中可以包括多个动态参数,请求参数中也可以包括多个动态参数,提取出请求参数中包含的动态参数,作为第二参数。通过查询目标分类表对应的各个参数表,确定包含第二参数的参数表,将该参数表作为目标参数表。
如果请求参数中包含多个动态参数,则第二参数为多个,可以与第二参数完全匹配的参数表作为目标参数,也就是说,将同时包含每一个第二参数的参数表作为目标参数表,能够保证模板的精确性。如果不存在完全包含第二参数的参数表,即,各个参数表均不能与第二请求参数完全匹配,则可以计算各个参数表分别与第二参数的相似度,将与第二参数的相似度较高的参数表作为目标参数表。示例性的,可以通过模糊匹配算法确定第二参数与每一个参数表的匹配结果,得到相似度,从而选择相似度最高的参数表作为目标参数表。
在步骤S504中,获取所述目标参数表对应的模板文档,作为目标模板。示例性的,通过模板描述文件可以确定目标参数对应的模板文档的存储路径,从而在该存储路径下获取目标模板。本实施方式中,在请求参数能够与参数表匹配的情况下,可以获取与用户需求精确匹配的模板,在请求参数不能与参数表匹配的情况下,可以选择最接近的模板提供给用户,从而最大程度的满足用户对于格式文档的需求,能够减少用户的操作,提高文档的生成效率。
然后,在步骤S140中,结合所述目标模板以及所述请求参数生成格式文档。
本实施方式中,得到目标模板之后可以将请求参数填充至目标模板中,从而得到用户所需的格式文档。具体的,对请求参数中的第二参数可以进行识别,确定每个第二参数的参数类型,然后对于每个第二参数,查找目标模版中对应参数类型的标签,将该标签标记的位置处的内容更换为该第二参数,从而得到参数替换后的目标模版作为格式文档。进一步的,可以通过标签对应的参数类型与请求参数中第二参数的参数类型进行匹配,从而将第二参数一一替换至对应的标签中。如果请求参数中的多个第二参数能够完全与目标参数表互相匹配,也就是说,目标模板中的每个标签对应的参数类型分别与一个第二参数的参数类型相同,则可以将请求参数中的每个第二参数替换至目标模板中对应的标签中。如果请求参数中只有部分第二参数与目标参数表匹配,则将匹配的部分第二参数替换至目标模版中对应的标签中,并将目标模板中的其他标签标记的动态参数进行区别显示,例如显示为红色、增大字体等,从而提醒用户根据自己的需求选择是否对这部分参数进行替换。举例来说,若请求参数中包含5个第二参数,A、B、C、D、E,其中目标模板为与该第二参数最接近的模板,目标模板中包含标签A、标签B以及标签E,则分别将目标模板中标签A、标签B以及标签E标识的实体内容替换成第二参数中的A、B、E,并对目标模板中的其他标签对应的实体内容进行标红显示。
通过本实施方式,用户只需要输入请求参数就可以通过模板获得对应的格式文档,并且,能够在模板与用户需求不匹配时,识别出与用户需求接近的模板提供给用户,极大的减少了用户操作,能够提高文档获取的效率,满足用户需求。
示例性的实施方式中,该方法可以包括步骤S601至步骤S606,如图6所示。
参考图6,在步骤S601中,获取请求参数,发送至服务器端;用户可以在客户端显示界面中输入分类等级信息以及动态参数信息,从而构成请求参数,发送至对应的服务器端;在步骤S602中,验证请求参数;服务器端可以对接收到的请求参数进行验证,验证其中包含的分类等级信息是否符合要求,也就是说,验证请求参数中包含的信息能否与分类等级信息相匹配,如果能匹配则验证通过,执行步骤S603;在步骤S603中,将请求参数解析为分类信息与参数信息;其中,分类信息为请求参数中包含的表示分类等级信息的内容,参数信息为请求参数中表示动态参数的内容;在步骤S604中,利用分类信息进行查询,确定目标分类表;在步骤S605中,利用参数信息进行查询,确定目标参数表;在步骤S606中,复制目标模板,生成格式文档;通过将目标分类表对应的模板文档进行复制,得到目标模板,然后将请求参数中的参数信息与目标模板中的标签标识的参数进行替换,得到用户需要的格式文档,并发送至客户端中供用户查看和使用。
需要说明的是,图6中的步骤为上述具体实施例的总结,故,步骤S601~步骤S606在上述具体实施例中均对其进行了说明,此处不再赘述。
进一步的,本示例实施方式中,还提供了一种文档生成装置,用于执行本公开上述的文档生成方法。该装置可以应用于一服务器或终端设备。
参考图7所示,该文档生成装置700可以包括:文档分类模块710、分类匹配模块720、模板获取模块730以及文档生成模块740,其中:
文档分类模块710,用于获取示例文档以及所述示例文档对应的分类等级信息。
分类匹配模块720,用于根据所述示例文档确定所述分类等级信息对应的模板文档。
模板获取模块730,用于接收到文档生成请求时,根据所述文档生成请求的请求参数在所述模板文档中获取对应的目标模板。
文档生成模块740,用于结合所述目标模板以及所述请求参数生成格式文档。
在本公开的一种示例性实施例中,模板获取模块730可以具体包括参数解析模块,以及参数匹配模块,其中:
从所述模板文档对应的模板描述文件中解析出所述模板文档分别对应的多个参数。
通过所述多个参数与所述请求参数进行匹配,以确定与所述请求参数对应的所述目标模板。
在本公开的一种示例性实施例中,该文档生成装置还包括参数提取模块,以及描述文件生成模块,其中:
参数提取模块,用于提取所述示例文档中包含的动态参数。
描述文件生成模块,用于通过所述模板文档对应的分类等级信息、示例文档、以及所述示例文档中包含的动态参数,生成所述模版描述文件。
在本公开的一种示例性实施例中,模板获取模块730可以包括表生成模块、第一查询模块、第二查询模块以及目标模板确定模块,其中:
表生成模块,用于通过所述分类等级信息生成分类表,并通过所述动态参数生成所述分类表对应的参数表。
第一查询模块,用于提取所述请求参数中的第一参数,在所述分类表中查询所述第一参数匹配的目标分类表。
第二查询模块,用于提取所述请求参数中的第二参数,在所述目标分类表对应的多个参数表中查询与所述第二参数匹配的目标参数表。
目标模板确定模块,用于获取所述目标参数表对应的模板文档,作为目标模板。
在本公开的一种示例性实施例中,该文档生成装置还包括相似度计算模块,用于如果所述请求参数中的第二参数与各个所述参数表均不匹配,则按照所述第二参数分别与每一参数表的相似度,确定所述第二参数对应的目标参数表。
在本公开的一种示例性实施例中,分类匹配模块720可以包括参数识别模块,以及标签模块,其中:
参数识别模块,用于识别出所述示例文档中的动态参数。
标签模块,用于利用标签对所述示例文档中的动态参数进行标记,以将标记后的示例文档作为所述分类等级信息对应的模板文档。
在本公开的一种示例性实施例中,文档生成模块740可以具体用于将所述目标模板中的标签标记的动态参数替换为所述请求参数,以获得格式文档。
由于本公开的示例实施例的文档生成装置的各个功能模块与上述文档生成方法的示例实施例的步骤对应,因此对于本公开装置实施例中未披露的细节,请参照本公开上述的文档生成方法的实施例。
参阅图8,图8示出了可以应用本公开实施例的一种文档生成方法及文档生成装置的示例性应用环境的系统架构的示意图。
如图8所示,系统架构800可以包括终端设备801、802、803中的一个或多个,网络804和服务器805。网络804用以在终端设备801、802、803和服务器805之间提供通信链路的介质。网络804可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备801、802、803可以是具有显示屏的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图8中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器805可以是多个服务器组成的服务器集群等。
本公开实施例所提供的文档生成方法一般由服务器805执行,相应地,文档生成装置一般设置于服务器805中。但本领域技术人员容易理解的是,本公开实施例所提供的文档生成方法也可以由终端设备801、802、803执行,相应的,文档生成装置也可以设置于终端设备801、802、803中。或者,本实施例所提供文档生成方法还可以通过终端设备801、802、803与服务器805之间交互实现,本示例性实施例中对此不做特殊限定。
图9示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图9示出的电子设备的计算机系统900仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图9所示,计算机系统900包括中央处理单元(CPU)901,其可以根据存储在只读存储器(ROM)902中的程序或者从存储部分908加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。在RAM 903中,还存储有系统操作所需的各种程序和数据。CPU901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
以下部件连接至I/O接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(CPU)901执行时,执行本申请的方法和装置中限定的各种功能。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如下述实施例中所述的方法。例如,所述的电子设备可以实现如图1至图6所示的各个步骤等。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种文档生成方法,其特征在于,包括:
获取示例文档以及所述示例文档对应的分类等级信息;
根据所述示例文档确定所述分类等级信息对应的模板文档;
接收到文档生成请求时,根据所述文档生成请求的请求参数在所述模板文档中获取对应的目标模板;
结合所述目标模板以及所述请求参数生成格式文档。
2.根据权利要求1所述的方法,其特征在于,根据所述示例文档确定所述分类等级信息对应的模板文档之后,还包括:
提取所述示例文档中包含的动态参数;
通过所述模板文档对应的分类等级信息、示例文档、以及所述示例文档中包含的动态参数,生成模版描述文件。
3.根据权利要求2所述的方法,其特征在于,所述根据所述文档生成请求的请求参数在所述模板文档中获取对应的目标模板,包括:
从所述模板文档对应的模板描述文件中解析出所述模板文档分别对应的多个参数;
通过所述多个参数与所述请求参数进行匹配,以确定与所述请求参数对应的所述目标模板。
4.根据权利要求2所述的方法,其特征在于,所述根据所述文档生成请求的请求参数在所述模板文档中获取对应的目标模板,包括:
通过所述分类等级信息生成分类表,并通过所述动态参数生成所述分类表对应的参数表;
提取所述请求参数中的第一参数,在所述分类表中查询所述第一参数匹配的目标分类表;
提取所述请求参数中的第二参数,在所述目标分类表对应的多个参数表中查询与所述第二参数匹配的目标参数表;
获取所述目标参数表对应的模板文档,作为目标模板。
5.根据权利要求4所述的方法,其特征在于,还包括:
如果所述请求参数中的第二参数与各个所述参数表均不匹配,则按照所述第二参数分别与每一参数表的相似度,确定所述第二参数对应的目标参数表。
6.根据权利要求1所述的方法,其特征在于,所述根据所述示例文档确定所述分类等级信息对应的模板文档,包括:
识别出所述示例文档中的动态参数;
利用标签对所述示例文档中的动态参数进行标记,以将标记后的示例文档作为所述分类等级信息对应的模板文档。
7.根据权利要求6所述的方法,其特征在于,所述结合所述目标模板以及所述请求参数生成格式文档,包括:
将所述目标模板中的标签标记的动态参数替换为所述请求参数,以获得格式文档。
8.一种文档生成装置,其特征在于,包括:
文档分类模块,用于获取示例文档以及所述示例文档对应的分类等级信息;
分类匹配模块,用于根据所述示例文档确定所述分类等级信息对应的模板文档;
模板获取模块,用于接收到文档生成请求时,根据所述文档生成请求的请求参数在所述模板文档中获取对应的目标模板;
文档生成模块,用于结合所述目标模板以及所述请求参数生成格式文档。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任一项所述的方法。
CN202010414406.XA 2020-05-15 2020-05-15 文档生成方法、装置、计算机可读介质及电子设备 Pending CN111581937A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010414406.XA CN111581937A (zh) 2020-05-15 2020-05-15 文档生成方法、装置、计算机可读介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010414406.XA CN111581937A (zh) 2020-05-15 2020-05-15 文档生成方法、装置、计算机可读介质及电子设备

Publications (1)

Publication Number Publication Date
CN111581937A true CN111581937A (zh) 2020-08-25

Family

ID=72117519

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010414406.XA Pending CN111581937A (zh) 2020-05-15 2020-05-15 文档生成方法、装置、计算机可读介质及电子设备

Country Status (1)

Country Link
CN (1) CN111581937A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528012A (zh) * 2020-11-27 2021-03-19 北京百度网讯科技有限公司 生成文档记录的方法、装置、电子设备、存储介质及计算机程序产品
CN115169291A (zh) * 2022-07-14 2022-10-11 中国建筑西南设计研究院有限公司 文本转换方法、装置、终端设备和计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933020A (zh) * 2015-07-17 2015-09-23 北京奇虎科技有限公司 基于模板生成目标文档的方法及装置
CN109388612A (zh) * 2018-09-14 2019-02-26 中国科学院光电研究院 一种数据汇总文档生成的方法、设备、系统及介质
CN109815464A (zh) * 2018-12-15 2019-05-28 中国平安人寿保险股份有限公司 Pdf文档生成方法、装置、电子设备及存储介质
CN110738036A (zh) * 2019-10-15 2020-01-31 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN110837727A (zh) * 2019-10-23 2020-02-25 深圳价值在线信息科技股份有限公司 一种文档模板生成方法、装置、终端设备及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933020A (zh) * 2015-07-17 2015-09-23 北京奇虎科技有限公司 基于模板生成目标文档的方法及装置
CN109388612A (zh) * 2018-09-14 2019-02-26 中国科学院光电研究院 一种数据汇总文档生成的方法、设备、系统及介质
CN109815464A (zh) * 2018-12-15 2019-05-28 中国平安人寿保险股份有限公司 Pdf文档生成方法、装置、电子设备及存储介质
CN110738036A (zh) * 2019-10-15 2020-01-31 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN110837727A (zh) * 2019-10-23 2020-02-25 深圳价值在线信息科技股份有限公司 一种文档模板生成方法、装置、终端设备及介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528012A (zh) * 2020-11-27 2021-03-19 北京百度网讯科技有限公司 生成文档记录的方法、装置、电子设备、存储介质及计算机程序产品
CN112528012B (zh) * 2020-11-27 2023-08-29 北京百度网讯科技有限公司 生成文档记录的方法、装置、电子设备、及存储介质
CN115169291A (zh) * 2022-07-14 2022-10-11 中国建筑西南设计研究院有限公司 文本转换方法、装置、终端设备和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN111512315A (zh) 文档元数据的按块提取
US20190171873A1 (en) Cognitive document image digitization
CN109359194B (zh) 用于预测信息类别的方法和装置
CN110837356B (zh) 一种数据处理方法和装置
US9195653B2 (en) Identification of in-context resources that are not fully localized
CN112559865A (zh) 信息处理系统、计算机可读存储介质及电子设备
CN111143505A (zh) 文档处理方法、装置、介质及电子设备
US11423219B2 (en) Generation and population of new application document utilizing historical application documents
CN111581937A (zh) 文档生成方法、装置、计算机可读介质及电子设备
CN113435859A (zh) 信访件处理方法、装置、电子设备和计算机可读介质
US12033414B2 (en) Document readability enhancements
CN112801086A (zh) 凭证分类的方法、装置、电子设备和存储介质
CN112860722A (zh) 数据核对方法、装置、电子设备和可读存储介质
CN110990527A (zh) 自动问答方法及装置、存储介质及电子设备
CN114528851B (zh) 回复语句确定方法、装置、电子设备和存储介质
CN115982272A (zh) 一种城市大数据管理的数据标注方法、装置及计算机存储介质
CN114373068A (zh) 一种行业场景化的ocr模型实现系统、方法及设备
CN114170451A (zh) 一种文本识别方法和装置
CN112131379A (zh) 用于识别问题类别的方法、装置、电子设备及存储介质
CN113822046B (zh) 基于cucumber测试案例的解析方法、装置、设备及存储介质
CN113032469A (zh) 文本结构化模型训练、医疗文本结构化方法及装置
US20240281664A1 (en) System and Method for Optimized Training of a Neural Network Model for Data Extraction
CN116663514A (zh) 一种可配置的表单数据分发方法和装置
CN118691224A (zh) 文本的生成方法、生成装置和可读存储介质
CN114117310A (zh) 一种页面生成方法、装置、电子设备及计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination